コクラン・アーミテージ検定 Last modified: Nov 07, 2002
外的基準が連続変数であるときに,各群の比率が外的基準と線形傾向があるかどうかを検定する。
注:元々は線形傾向の検定であったが,傾向検定(単調増加の検定)として使われることも多い。そのような場合には,外的基準は必ずしも必要ない(外的基準がない場合には,等間隔な整数値を仮定する)。
例題:
「表 1 のようなデータにおいて,5 群の比率が独立変数と線形傾向があるか検定しなさい。」
表 1.数値例
独立変数 | ケース数 | 陽性数 | 比率 | 比率の推定値 |
10 | 30 | 2 | 0.067 | -0.047 |
20 | 35 | 4 | 0.114 | 0.169 |
30 | 47 | 14 | 0.298 | 0.385 |
40 | 21 | 13 | 0.619 | 0.601 |
50 | 45 | 39 | 0.867 | 0.817 |
検定手順:
- 表 2 のように,$k$ 個の群があるとき,第 $i$ 群に対応する外的基準を $X_{i}$,ケース数を $n_i$,そのうちで対象とする特性を持つケース数(ここでは陽性数と呼ぶことにする)を $r_{i}$ とする。
表 2.コクラン・アーミテージ検定を適用するデータの形式
群 | 第 1 群 | 第 2 群 | $\cdots$ | 第 $k$ 群 |
ケース数 | $n_1$ | $n_2$ | $\cdots$ | $n_k$ |
陽性数 | $r_{1}$ | $r_{2}$ | $\cdots$ | $r_{k}$ |
比率 | $p_{1}$ | $p_{2}$ | $\cdots$ | $p_{k}$ |
外的基準値 | $X_{1}$ | $X_{2}$ | $\cdots$ | $X_{k}$ |
\[
n = \sum_{i=1}^k n_i,\ \ \
r = \sum_{i=1}^k r_i,\ \ \
\bar{p} = \frac{r}{n},\ \ \
\bar{X} = \frac{\displaystyle \sum_{i=1}^k n_i\ X_i}{n}
\]
- 各群の比率 $p_{i} = \displaystyle \frac{r_{i}}{n_i}$ が外的基準 $X_{i}$ と直線的な関係があると仮定すると,比率の予測値は $\hat{p}_i = a+b\ X_i$ と表せる。
$a$,$b$ は次式で推定できる。
\[
\begin{align*}
b & = \frac{\displaystyle \sum_{i=1}^k n_i\ (p_i-\bar{p})\ (X_i-\bar{X})} {\displaystyle \sum_{i=1}^k n_i\ (X_i-\bar{X})^2}
= \frac{\displaystyle \sum_{i=1}^k n_i\ p_i\ X_i-n\ \bar{p}\ \bar{X}} {\displaystyle \sum_{i=1}^k n_i\ X_i^2 - n\ \bar{X}^2} \\[5pt]
a & = \bar{p} - b\ \bar{X}
\end{align*}
\]
例題では,$a = -0.2624224$,$b = 0.02158385$ となる。比率の予測値は,表 1 に示すようになる。
- 直線の傾き($b$)が $0$ であるかどうかの検定(傾きの有意性の検定)は,次式の $\chi^2_{T}$ が自由度 $1$ の $\chi^2$ 分布に従うことを用いて検定できる。
\[
\chi^2_T = \frac{b^2}{\bar{p}\ (1-\bar{p})}\ \sum_{i=1}^k n_i\ (X_i-\bar{X})^2
\]
- 各群の比率に直線では表しきれない傾向があるかどうか(直線性の検定)は,次式の $\chi^2_{Q}$ が自由度 $k - 2$ の $\chi^2$ 分布に従うことを用いて検定できる。
\[
\chi^2_Q = \frac{\displaystyle \sum_{i=1}^k n_i\ (p_i-\hat{p}_i)^2}{\bar{p}\ (1-\bar{p})}
\]
- 各群の比率に差があるかどうかを検定するのは $k\times 2$ 分割表の $\chi^2$ 検定で行える。式の $\chi^2_{H}$ は,自由度 $k - 1$ の $\chi^2$ 分布に従う。
\[
\chi^2_H = \frac{n^2}{r\ (n-r)}\ \left( \sum_{i=1}^k \frac{r_i^2}{n_i} - \frac{r^2}{n} \right)
\]
- 比率の一様性の検定では,各群に順序関係があるときにもその情報を利用していない。
コクラン・アーミテージ検定は次式のように,比率の一様性の検定を目的とする $\chi^2_{H}$ 統計量を直線式で説明できる部分 $\chi^2_{T}$ と直線式からの乖離の部分 $\chi^2_{Q}$ に分割する。
\[
\chi^2_H = \chi^2_T + \chi^2_Q \tag{1}
\]
実際の計算では,$\chi^2_{H}$ と $\chi^2_{T}$ を先に計算し,$\chi^2_{Q}$ は $(1)$ 式から求めれば計算が簡単である。
- 結果の表示は表 3 のように行う。これらはちょうど一元配置分散分析において,全分散を級内分散と級間分散に分解することや結果を分散分析表の形で表現することに似ている。
表 3.コクラン・アーミテージ検定の結果
要因 | $\chi^2$ 値 | 自由度 |
傾き | $\chi^2_{T}$ | $1$ |
直線からの乖離 | $\chi^2_{Q}$ | $k - 2$ |
合計(非一様性) | $\chi^2_{H}$ | $k - 1$ |
例題では,表 4 のようにまとめられる。
表 4.コクラン・アーミテージ検定の結果
要因 | $\chi^2$ 値 | 自由度 | 有意確率 |
傾き | 68.57273 | 1 | $\lt$ 0.001 |
直線からの乖離 | 4.014484 | 3 | 0.25990 |
合計(非一様性) | 72.58722 | 4 | $\lt$ 0.001 |
- 検定結果の解釈は以下のようになる。
- $\chi^2_{T}$ が大きな値であれば(有意確率が小さければ)傾きが $0$ ではないことを意味する。すなわち,群の比率は,外的基準値により増減することを意味する。
- $\chi^2_{Q}$ が大きな値であれば(有意確率が小さければ)直線性の仮定は受け入れられない。すなわち,直線では表しきれないことを意味する。
- 両者をあわせて考えると,$\chi^2_{T}$ が大きく,かつ,$\chi^2_{Q}$ が小さければ,各群の比率は直線式で表現できることになる。
例題では,各群の比率は,独立変数値と直線的な傾向を持つといえる。
R で計算してみる
演習問題:
応用問題:
計算プログラム [R] [Python]
直前のページへ戻る E-mail to Shigenobu AOKI