分布の差の検定     Last modified: May 16, 2002

 クロス集計表(分割表)の形式でまとめられた結果に基づき,複数の群の分布に差があるかどうかを検定する。

 注:実質的には,「独立性の検定」と同じものである。


例題

 「ABO 式の血液型を調べたところ,表 1 のような結果であった。男女で血液型の分布がことなるだろうか。」

表 1.男女の血液型
性別 A B O AB 合計
20 15 16 4 55
15 7 9 4 35
合計 35 22 25 8 90


検定手順

  1. 前提

  2. $m$ 個のカテゴリーを持つ観察値が $k$ 群について調べられ,表 2 のようにまとめられているとする。

    例題では,$m = 4$,$k = 2$ である。

    表 2.記号の定義
    第 1 カテゴリー 第 2 カテゴリー  $\dots$  第 $m$ カテゴリー  合計 
    第 1 群 $O_{11}$ $O_{12}$ $\dots$ $O_{1m}$ $n_1$
    第 2 群 $O_{21}$ $O_{22}$ $\dots$ $O_{2m}$ $n_2$
    : : : : : :
    第 $k$ 群 $O_{k1}$ $O_{k2}$ $\dots$ $O_{km}$ $n_k$
    合計 $t_{1}$ $t_{2}$ $\dots$ $t_{m}$ $n$

  3. 全体としてみたとき,ある個体が第 $j$ カテゴリーに属する確率は $\displaystyle \frac{t_{j}}{n}$ である。

    例題では,たとえば A 型である確率は $\displaystyle \frac{35}{90} ≒ 0.389$ である。

  4. 第 $i$ 群の第 $j$ カテゴリーの期待値は $E_{ij} = n_i \times \displaystyle \frac{t_{j}}{n}$ である。

    例題では,A 型の男に対する期待値は $55 \times \displaystyle \frac{35}{90} ≒ 21.389$ である。

  5. 全ての桝目における,期待値からの変位の合計量(検定統計量)を,以下の式で計算する。 \[ \chi_0^2 = \sum_{i=1}^k \sum_{j=1}^m \frac{\left( O_{ij}-E_{ij} \right)^2}{E_{ij}} \] 例題では,$\chi^2_0 ≒ 1.1981$ となる。

  6. $\chi^2_0$ は,自由度が $(k-1) \times (m-1)$ の $\chi^2$ 分布に従う。

    例題では,$(2-1) \times (4-1) = 3$ である。

  7. 有意確率を $P = \Pr\{\chi^2 \geqq \chi^2_0\}$ とする。
    $\chi^2$ 分布表,または $\chi^2$ 分布の上側確率の計算を参照すること。

    例題では,自由度 $3$ の $\chi^2$ 分布において,$\Pr\{\chi^2 \geqq 7.81\}= 0.05$ であるから,$P = \Pr\{\chi^2 \geqq 1.1981 \}\gt 0.05$ である(正確な有意確率:$P = 0.75346$)。

  8. 帰無仮説の採否を決める。

    例題では,有意水準 $5\%$ で検定を行うとすれば($\alpha = 0.05$),$P \gt \alpha$ であるから,帰無仮説は棄却できない。すなわち,「男女で血液型の分布は同じでないとはいえない」。

・ R で計算してみる


演習問題

 「調査対象者の年齢分布を男女ごとに集計すると表 3 のようになった。対象者の年齢構成が同じであるとみなしてよいか,検定しなさい。」

表 3.調査対象者の性別年齢分布
性別 20 歳代 30 歳代 40 歳代 50 歳代 60 歳代  合計
11 24 35 43 27 140
16 30 46 53 17 162
合計 27 54 81 96 44 302


問題1 帰無仮説はどれか。a,b,c,d のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:男女の年齢分布は同じである b:男女の年齢分布は異なる c:男のほうが若いものが多い d:女のほうが若いものが多い
解答欄:    

問題2 40 歳代の女は全体の何パーセントくらいいると期待されるか。小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題3 30 歳代の男は何人くらいいると期待されるか。小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題4 $\chi^2$ 検定統計量を求め,小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題5 求められた $\chi^2$ 検定統計量は,自由度いくつの $\chi^2$ 分布に従うか,答えを解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題6 有意確率は 0.05 より大きいか小さいか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:0.05 より大きい b:0.05 より小さい
解答欄:    

問題7 有意水準 $5\%$ で検定を行うとき,帰無仮説は棄却できるかできないか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:棄却できる b:棄却できない
解答欄:    

問題8 最終的な結論はどうなるか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:男女の年齢分布が異なるとはいえない b:男女の年齢分布は異なる
解答欄:    
・ R で計算してみる

応用問題


・ 計算プログラム
・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI