Senn (1993)
クロスオーバーデザインで順序カテゴリアウトカムを用いた場合の解析方法を知らなかったので、このレターを読んでみて、メモを作成しました。
このレターは、Ezzet & Whitehead (1991, Stat Med) に対してコメントをしたもので、Ezzet & Whitehead が提案した変量効果を含む比例オッズモデルが複雑で実装も大変なので、別の方法を提案するという内容でした。
事例のデータとchange score
事例のデータは、クロスオーバー試験において0, 1, 2, 3のような4水準の順序カテゴリデータが得られるケースでした。
治療AとBについて1期と2期がある試験で、ABの順で治療を受ける群と、BAの順で治療を受ける群がランダム化されたものでした。
まず、データをchange scaleに変換したchange scoreを用いることを提案しています。
例えば、1期から2期でスコアが何段階変化したかを求め、-3 を 'much worse', -2 or -1 を 'worse', 0 を 'same', +1 or +2 を 'better', +3 を 'much better' のように変換します。
この例では、4水準の順序カテゴリデータの変化量を5水準に変換していて、partial orderingを用いていると説明されていました。
Partial orderingを用いているので、+1 or +2は変化量が違うのに両方 'better' と変換していて、0から2への変化と2から3への変化を同じとみなすことが妥当かどうかは不明、ということです。
不完全であるということは認めた上での提案のようです。
ちなみに、アウトカムが二値のときの変化量は-1 (worse), 0 (same), 1 (better) に正確に変換できて、クロスオーバー試験において二値アウトカムの結果を変換してから仮説検定する Prescott's test と近い考え方の方法と言える、ということでした。
比例オッズモデルによるchange scoreの解析
データをchange scoreに変換し、比例オッズモデルを用いて解析すると、非常に簡単に順序AB vs BA間の比較ができることが紹介されていました。
McCullagh (1980) の経験ロジット変換の方法を使うと、分割表の数値から手計算で各change score間のロジットの推定値が得られ、それをもとに治療効果パラメータ $\phi$ の近似推定値が得られることが紹介されていました。
以下に示したレターで使われていた事例データに対して、経験ロジット変換の方法を用いた場合の推定結果は $\hat{\phi}=1.571, \text{SE}(\hat{\phi})=0.34$ と書かれていました。
Change score | AB | BA |
---|---|---|
Much worse | 2 | 0 |
Worse | 41 | 13 |
Same | 86 | 79 |
Better | 12 | 50 |
Much better | 1 | 2 |
Rで比例オッズモデルを用いて解析すると、以下のようになり、レターに書かれていた比例オッズモデルによる推定結果と一致しました ($\hat{\phi}=1.604, \text{SE}(\hat{\phi})=0.26$)。
経験ロジット変換の結果とは、まあまあ近い結果になるようでした。
また、Ezzet & Whiteheadの方法をここで使ったモデルに近い形に修正した結果は、$\hat{\phi}=1.283, \text{SE}(\hat{\phi})=0.21$ であったと書かれていました。
library(MASS) df <- data.frame( sequence = factor( c(rep(0, 142), rep(1, 144)), labels = c("AB", "BA")), change = factor(c( rep(0, 2), rep(1, 41), rep(2, 86), rep(3, 12), rep(4, 1), rep(1, 13), rep(2, 79), rep(3, 50), rep(4, 2)), labels = c("Much worse", "Worse", "Same", "Better", "Much better")) ) table(df$change, df$sequence) fit <- polr(change ~ sequence, data = df, Hess = TRUE) summary(fit) confint(fit)
> table(df$change, df$sequence) AB BA Much worse 2 0 Worse 41 13 Same 86 79 Better 12 50 Much better 1 2 > fit <- polr(change ~ sequence, data = df, Hess = TRUE) > summary(fit) Call: polr(formula = change ~ sequence, data = df, Hess = TRUE) Coefficients: Value Std. Error t value sequenceBA 1.604 0.2637 6.085 Intercepts: Value Std. Error t value Much worse|Worse -4.4364 0.7132 -6.2208 Worse|Same -0.8032 0.1740 -4.6153 Same|Better 2.2037 0.2331 9.4540 Better|Much better 5.6437 0.6156 9.1680 Residual Deviance: 556.4482 AIC: 566.4482 > confint(fit) Waiting for profiling to be done... 2.5 % 97.5 % 1.099457 2.135862
感想
1993年の論文ということで、計算機事情もかなり違ったようですが、シンプルな解析方法があるのだなと思いました。
このレターでは他にも代替案(Koch et al., 1977; Jones & Kenward, 1989; Koch, 1972)が挙げられており、そちらも少し調べてみようかなと思いました。
あと、治療効果パラメータは推定できるのですが、どういう解釈ができるのかについては悩ましいなと思っています。
文献
- Senn S. A random effects model for ordinal responses from a crossover trial. by F. Ezzet and J. Whitehead, Statistics in Medicine, 10, 901–907 (1991). Statistics in Medicine 1993; 12(12): 2147–2151. doi: 10.1002/sim.4780122208.
- Ezzet F, Whitehead J. A random effects model for ordinal responses from a crossover trial. Statistics in Medicine 1991; 10(6): 901–907. doi: 10.1002/sim.4780100611.
- Prescott R. The comparison of success rates in cross-over trials in the presence of an order effect. Applied Statistics 1981; 30(1): 9–15. doi: 10.2307/2346652.
- McCullagh P. Regression model for ordinal data (with discussion). Journal of the Royal Statistical Society, Series B 1980; 42(2): 109–142. doi: 10.1111/j.2517-6161.1980.tb01109.x.
- Koch GG, Landis JR, Freeman JL, Freeman Jr DH, Lehnen RC. A general methodology for the analysis of experiments with repeated measurement of categorical data. Biometrics 1977; 33(1): 133–158. doi: 10.2307/2529309.
- Jones B, Kenward M. Design and Analysis of Cross-over Trials, Chapman and Hall, London and New York, 1989.
- Koch GG. The use of non-parametric methods in the statistical analysis of the two-period change-over design. Biometrics 1972; 28(2): 577–584. doi: 10.2307/2556170.