クロス集計表(分割表)の形式でまとめられた結果に基づき,複数の群の分布に差があるかどうかを検定する。
注:実質的には,「独立性の検定」と同じものである。
例題:
「ABO 式の血液型を調べたところ,表 1 のような結果であった。男女で血液型の分布がことなるだろうか。」
性別 | A | B | O | AB | 合計 |
---|---|---|---|---|---|
男 | 20 | 15 | 16 | 4 | 55 |
女 | 15 | 7 | 9 | 4 | 35 |
合計 | 35 | 22 | 25 | 8 | 90 |
検定手順:
例題では,$m = 4$,$k = 2$ である。
群 | 第 1 カテゴリー | 第 2 カテゴリー | $\dots$ | 第 $m$ カテゴリー | 合計 |
---|---|---|---|---|---|
第 1 群 | $O_{11}$ | $O_{12}$ | $\dots$ | $O_{1m}$ | $n_1$ |
第 2 群 | $O_{21}$ | $O_{22}$ | $\dots$ | $O_{2m}$ | $n_2$ |
: | : | : | : | : | : |
第 $k$ 群 | $O_{k1}$ | $O_{k2}$ | $\dots$ | $O_{km}$ | $n_k$ |
合計 | $t_{1}$ | $t_{2}$ | $\dots$ | $t_{m}$ | $n$ |
例題では,たとえば A 型である確率は $\displaystyle \frac{35}{90} ≒ 0.389$ である。
例題では,A 型の男に対する期待値は $55 \times \displaystyle \frac{35}{90} ≒ 21.389$ である。
例題では,$(2-1) \times (4-1) = 3$ である。
例題では,自由度 $3$ の $\chi^2$ 分布において,$\Pr\{\chi^2 \geqq 7.81\}= 0.05$ であるから,$P = \Pr\{\chi^2 \geqq 1.1981 \}\gt 0.05$ である(正確な有意確率:$P = 0.75346$)。
例題では,有意水準 $5\%$ で検定を行うとすれば($\alpha = 0.05$),$P \gt \alpha$ であるから,帰無仮説は棄却できない。すなわち,「男女で血液型の分布は同じでないとはいえない」。
演習問題:
「調査対象者の年齢分布を男女ごとに集計すると表 3 のようになった。対象者の年齢構成が同じであるとみなしてよいか,検定しなさい。」
性別 | 20 歳代 | 30 歳代 | 40 歳代 | 50 歳代 | 60 歳代 | 合計 |
---|---|---|---|---|---|---|
男 | 11 | 24 | 35 | 43 | 27 | 140 |
女 | 16 | 30 | 46 | 53 | 17 | 162 |
合計 | 27 | 54 | 81 | 96 | 44 | 302 |
問題1 帰無仮説はどれか。a,b,c,d のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。
問題2 40 歳代の女は全体の何パーセントくらいいると期待されるか。小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。
問題3 30 歳代の男は何人くらいいると期待されるか。小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。
問題4 $\chi^2$ 検定統計量を求め,小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。
問題5 求められた $\chi^2$ 検定統計量は,自由度いくつの $\chi^2$ 分布に従うか,答えを解答欄に記入し,送信ボタンをクリックしなさい。
問題6 有意確率は 0.05 より大きいか小さいか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。
問題7 有意水準 $5\%$ で検定を行うとき,帰無仮説は棄却できるかできないか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。
問題8 最終的な結論はどうなるか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。
R で計算してみる応用問題: