以前は単なる対応データの割合が一致するかどうかの検定ぐらいの認識だったので、ちゃんと勉強してみようと思いました。
でも McNemar の原典 [3] を読むとさっぱり分からなかったので Kbauth 1985 [2] なども読みました。
McNemar's test は、
\[
H_0:\, \pi_{12}=\pi_{21}
\] の検定としてではなく、
\[
H_0:\, p=q\, (1-p=1-q)
\] marginal homogeneity (周辺同等性) に対する検定として導かれていました。
変数B | 変数A | 合計 | |
---|---|---|---|
Yes | No | ||
Yes | $\pi_{11}$ | $\pi_{12}$ | $p$ |
No | $\pi_{21}$ | $\pi_{22}$ | $1-p$ |
合計 | $q$ | $1-q$ | $1$ |
marginal homogeneity は、対応する 周辺確率 が同等である、ということ。
これをきちんと認識できていなかった、結構な勉強不足だったと思う。
通常は marginal homogeneity のような推測をする場合、多項分布モデル
\[
X_{11}, X_{12}, X_{21} \sim \mathrm{Tn}(\pi_{11}, \pi_{12}, \pi_{21}; n)
\] を仮定する。
変数B | 変数A | 合計 | |
---|---|---|---|
Yes | No | ||
Yes | $X_{11}$ | $X_{12}$ | |
No | $X_{21}$ | $X_{22}$ | |
合計 | $n$ |
ここで、
\[
d=p-q=(\pi_{11}+\pi_{12})-(\pi_{11}+\pi_{12})=\pi_{12}-\pi_{21}
\] とパラメータを変換して、$H_0: d=0$ vs. $H_1: d\not=0]$ の仮説検定を考えよう。
$c$をある実定数とすれば、対数尤度関数は
\[
\begin{eqnarray}
\log L(\boldsymbol{\theta})&=&
x_{11}\log(\pi_{11}) + x_{12}\log(\pi_{21}+d) + x_{21}\log(\pi_{21})+\\&&
(n - x_{11} - x_{12} - x_{21})\log(1 - \pi_{11} - 2\pi_{21} - d)+c,
\end{eqnarray}
\] \[
\boldsymbol{\theta}=(\pi_{11}, \pi_{21}, d)^{\mathrm{t}},
\] であり、スコア関数は
\[
\mathbf{S}(\boldsymbol{\theta})=
\left(\frac{\partial\log L}{\partial \pi_{11}}, \frac{\partial\log L}{\partial \pi_{21}}, \frac{\partial\log L}{\partial d}\right)^{\mathrm{t}},
\] \[
\begin{eqnarray}
\frac{\partial\log L}{\partial \pi_{11}}&=&\frac{x_{11}}{\pi_{11}}-\frac{n-x_{11}-x_{12}-x_{21}}{1-\pi_{11}-2\pi_{21}-d}\\ \frac{\partial\log L}{\partial \pi_{21}}&=&\frac{x_{12}}{\pi_{21}+d}+\frac{x_{21}}{\pi_{x21}}-\frac{2(n-x_{11}-x_{12}-x_{21})}{1-\pi_{11}-2\pi_{21}-d}\\ \frac{\partial\log L}{\partial d}&=&\frac{x_{12}}{\pi_{21}+d}-\frac{n-x_{11}-x_{12}-x_{21}}{1-\pi_{11}-2\pi_{21}-d}\end{eqnarray}
\] であり、Fisher 情報行列は
\[
\mathbf{I}(\boldsymbol{\theta})=
\begin{pmatrix}\frac{n}{\pi_{11}}+\frac{n}{1-\pi_{11}-2\pi_{21}-d} & \frac{2n}{1-\pi_{11}-2\pi_{21}-d} & \frac{n}{1-\pi_{11}-2\pi_{21}-d}\\ \frac{2n}{1-\pi_{11}-2\pi_{21}-d} & \frac{n}{\pi_{21}+d}+\frac{n}{\pi_{21}}+\frac{4n}{1-\pi_{11}-2\pi_{21}-d} & \frac{n}{\pi_{21}+d}+\frac{2n}{1-\pi_{11}-2\pi_{21}-d}\\ \frac{n}{1-\pi_{11}-2\pi_{21}-d} & \frac{n}{\pi_{21}+d}+\frac{2n}{1-\pi_{11}-2\pi_{21}-d} & \frac{n}{\pi_{21}+d}+\frac{n}{1-\pi_{11}-2\pi_{21}-d}
\end{pmatrix}
\] である。
途中を省くが、この場合のスコア検定統計量 $\mathbf{S}_0(\boldsymbol{\theta})^{\mathrm{t}}\mathbf{I}_0(\boldsymbol{\theta})^{-1}\mathbf{S}(\boldsymbol{\theta})$ と Wald 検定統計量 $(\hat{d}-d_0)^2/\{\widehat{\mathrm{Var}}(\hat{d}-d_0)\}$ は一致して、
\[
\chi^2=\frac{(X_{12}+X_{21})^2}{X_{12}+X_{21}} \sim \chi^2(1),
\] となる。
これは、$\hat{d}$ と $\mathrm{Var}(\hat{d}\mid H_0)$ から求めた McNemar's test の検定統計量と同等になる。
ちなみに、Wald 検定で用いた漸近分散は
\[
\widehat{\mathrm{Var}}(\hat{d}-d_0)=
\frac{1}{\{\mathbf{I}(\hat{\boldsymbol{\theta}})\}_d}=
\frac{X_{12}+X_{21}}{n^2},
\] である。
symmetry と marginal homogeneity
McNemar's test は $2 \times 2$ 表の場合を対象にしている。
これをもっと一般化して $r \times r$ 表に拡張するなら、marginal homogeneity ではなく symmetry (対称性)
\[
H_0: \pi_{ij}=\pi_{ij}
\] を考えなければならないはずだ。
$2 \times 2$ 表の場合は、$\pi_{12}=\pi_{21}$ と $p=q$ は同等なので、marginal homogeneity と symmetry のどちらに対する検定といっても差し支えはない。
では、marginal homogeneity と symmetry はどう違うんだろう。
とりあえず、対称ではないが周辺同等な表を作って考えてみた。
pre \ post | 0~33点 | 34~66点 | 67~100点 | 合計 |
---|---|---|---|---|
0~33点 | 1 | 1000 | 0 | 1001 |
34~66点 | 0 | 1 | 1000 | 1001 |
67~100点 | 1000 | 0 | 1 | 1001 |
合計 | 1001 | 1001 | 1001 | 3003 |
pre テストの得点と、post テストの得点を比べたデータとして考えてみよう。
対称ではないが周辺同等な表をみると
- pre で 0–33点 → ほとんどが post で 34–66点
- pre で 34–66点 → ほとんどが post で 67–100点
- pre で 67–100点 → ほとんどが post で 0–33点
のようになっている事が分かる。
実際のデータでは 3. はあんまり起こらないと思うが、pre-post の間での介入効果みたいなものを調べたいときに、周辺同等性の仮説を考えると、このタイプの差は検出できない事になる。
文献
[1] Agresti A. Categorical data analysis. 2nd edition. John Wiley & Sons Inc. 2007.
[2] Kbauth J. A comparison or tests for marginal homogeneity in square contingency tables. Biometrical Journal 1985; 27(1): 1–15.
[3] McNemar Q. Note on the sampling error of the difference between correlated proportions or percentages. Psychometrika 1947; 12: 153–157.
記録
2008/07/06 ぐらいと 2008/11/07 ぐらいに書いた記事を手直ししたものです。