対応のあるデータにおいて,代表値間に差があるかどうかを検定する。行と列を入替えることで,被験者間に差があるかどうかを検定できる。
例題:
「表 1 のようなデータがある。4 種の肥料間で収量に差があるか検定しなさい。」
肥料 | ||||
---|---|---|---|---|
品種 | $B_{1}$ | $B_{2}$ | $B_{3}$ | $B_{4}$ |
$A_{1}$ | 9 | 17 | 12 | 16 |
$A_{2}$ | 5 | 21 | 16 | 11 |
$A_{3}$ | 7 | 19 | 6 | 9 |
$A_{4}$ | 8 | 11 | 11 | 8 |
$A_{5}$ | 9 | 8 | 9 | 9 |
$A_{6}$ | 2 | 4 | 5 | 8 |
$A_{7}$ | 3 | 8 | 10 | 9 |
検定手順:
被験者 | 処理1 | 処理2 | $\dots$ | 処理 $c$ |
---|---|---|---|---|
1 | $X_{11}$ | $X_{12}$ | $\dots$ | $X_{1c}$ |
2 | $X_{21}$ | $X_{22}$ | $\dots$ | $X_{2c}$ |
: | : | : | : | : |
$r$ | $X_{r1}$ | $X_{r2}$ | $\dots$ | $X_{rc}$ |
例題では,$r = 7$,$c = 4$ である。
\[ R_j = \sum_{i=1}^r O_{ij} \]
被験者 | 処理 1 | 処理 2 | $\dots$ | 処理 $c$ |
---|---|---|---|---|
1 | $O_{11}$ | $O_{12}$ | $\dots$ | $O_{1c}$ |
2 | $O_{21}$ | $O_{22}$ | $\dots$ | $O_{2c}$ |
$\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ |
$r$ | $O_{r1}$ | $O_{r2}$ | $\dots$ | $O_{rc}$ |
順位の合計 | $R_{1}$ | $R_{2}$ | $\dots$ | $R_{c}$ |
検算:$\displaystyle \sum_{j=1}^c R_j = \frac{r \ c \ (c+1)}{2}$
例題の場合,表 4 のようになる。
肥料 | |||||
---|---|---|---|---|---|
品種 | $B_{1}$ | $B_{2}$ | $B_{3}$ | $B_{4}$ | 合計 |
$A_{1}$ | 1 | 4 | 2 | 3 | |
$A_{2}$ | 1 | 4 | 3 | 2 | |
$A_{3}$ | 2 | 4 | 1 | 3 | |
$A_{4}$ | 1.5 | 3.5 | 3.5 | 1.5 | |
$A_{5}$ | 3 | 1 | 3 | 3 | |
$A_{6}$ | 1 | 2 | 3 | 4 | |
$A_{7}$ | 1 | 2 | 4 | 3 | |
$R_{j}$ | 10.5 | 20.5 | 19.5 | 19.5 | 70 |
$R_{j}^{2}$ | 110.25 | 420.25 | 380.25 | 380.25 | 1291 |
\[ \chi_0^2 = \frac{12}{r \ c \ (c+1)}\sum_{j=1}^c R_j^2-3\ r\ (c+1) \] 例題では, $\chi^2_0 = 5.65714$ であり,自由度 $3$ の $\chi^2$ 分布に従う。
以上は多くの統計学の教科書に書かれているものであるが,R や SPSS では,検定統計量に対しても同順位の補正をしたものを求めている。
\[
\chi_0^2 = \frac{12 \displaystyle \sum_{j=1}^c (R_j-r\ (c+1)\ /\ 2)^2}{r\ c\ (c+1)-t\ /\ (c-1)}
\]
ただし,$t$ は $R$ の各行の要素について,ある値と同じ値となるものの数を $t_0$ としたとき $t_0^3-t_0$ としたものについての,行全体での総和である。
例では,$A_4$ において 1.5 と 3.5 の同順位がそれぞれ 2 個なので,$(2^3-2) + (2^3-2)) = 12$,および,$A_5$ において 3 の同順位が 3 個なので $3^3-3 = 24$ であり,合計して $t = 36$ である(同順位がない値の場合は $1^3-1=0$ である)。
したがって,$\chi_0^2 = \displaystyle \frac{12 \{(10.5-17.5)^2+(20.5-17.5)^2+(19.5-17.5)^2+(19.5-17.5)^2\}}{7\cdot 4 \cdot 5-36\ /\ 3} = 6.1875$ である。
行単位で同順位が全くない場合は,$\chi_0^2$ を求める 2 つの式は全く同じ値になる。
例題では,自由度 $3$ の $\chi^2$ 分布において,$\Pr\{\chi^2 \geqq 7.81\}= 0.05$ であるから,$P = \Pr\{\chi^2 \geqq 5.65714\}\gt 0.05$ である(正確な有意確率:$P = 0.1295$)。
同順位を考慮した場合は,正確な有意確率は$P = 0.1028$ である。
例題では,有意水準 $5\%$ で検定を行うとすれば($\alpha = 0.05$),同順位を考慮した場合もしない場合も,$P \gt \alpha$ であるから,帰無仮説は棄却できない。すなわち,「肥料間の差があるとはいえない」。
なお,処理の種類が少ない場合($c = 3,4,5$ の場合)には統計数値表を参照して棄却限界値を求め,以下の規則で決定を下す。
注: 全体として処理間に差があるときには,どの処理間に差があるかについて多重比較(対比較)を行うことができる。
演習問題:
「8 名のボランティアを被検者として,ある薬剤を投与しない場合(0mg),10,20,40,80mg 投与する場合の 5 通りの処置を行い,効果を測定した結果は表 5 のようになった。薬剤の効果があるかどうかを $5\%$ の有意水準で検定しなさい。」
投与量 | |||||
---|---|---|---|---|---|
被検者 | 0mg | 10mg | 20mg | 40mg | 80mg |
1 | 5 | 60 | 35 | 62 | 76 |
2 | 24 | 44 | 74 | 63 | 76 |
3 | 56 | 57 | 70 | 74 | 79 |
4 | 44 | 51 | 55 | 23 | 84 |
5 | 8 | 68 | 50 | 24 | 64 |
6 | 32 | 66 | 45 | 63 | 46 |
7 | 25 | 38 | 70 | 58 | 77 |
8 | 48 | 24 | 40 | 80 | 72 |
問題1 帰無仮説はどれか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。
問題2 $\chi^2_0$ 検定統計量を求めなさい。答えは小数点以下 2 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。
問題3 求められた $\chi^2_0$ 検定統計量は,自由度いくつの $\chi^2$ 分布に従うか,答えを解答欄に記入し,送信ボタンをクリックしなさい。
問題4 有意確率は $0.05$ より大きいか小さいか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。
問題5 有意水準 $5\%$ で検定を行うとき,帰無仮説は棄却できるかできないか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。
問題6 最終的な結論はどうなるか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。
応用問題: