適合度の検定−−ポアソン分布への適合度の検定

          Last modified: Jun 01, 2006


例題

 「表 1 は,ある都市の交通事故件数のデータである。これに,ポアソン分布をあてはめ,適合度の検定をせよ。」

表 1.交通事故件数
死亡者数 実測値 相対度数 ポアソン分布
$X_{i}$ $f_{i}$ $f_{i}\ /\ 365$ $f(X_i)$ 期待度数
0  27 0.074 0.050 18.322
1  61 0.167 0.150 54.816
2  77 0.211 0.225 81.999
3  71 0.195 0.224 81.774
4  54 0.148 0.168 61.163
5  35 0.096 0.100 36.597
6  20 0.055 0.050 18.248
7  11 0.030 0.021 7.799
8  6 0.016 0.008 2.917
9  2 0.005 0.003 0.970
10〜 1 0.003 0.001 0.395
合計  365 1.000 1.000 365.000

注:母平均(ポアソン定数)が既知の場合には以下の方法ではなく,名義尺度の場合 または 順序尺度以上の場合(1 標本コルモゴロフスミルノフ検定)により検定を行う。


検定手順

  1. 前提

  2. まず最初に,ポアソン分布のパラメータを推定する。

    注:測定値の分布にポアソン分布をあてはめるときには一般に母平均がわからないので,以下のように標本値で代用しなければならない。

    1. $n$ 個のケースが,$k$ 個のカテゴリーに分類されているとする。

      例題では,$n = 365$,$k = 11$ である。

    2. 与えられた度数分布表から,母平均(= 母分散)$\lambda$ を推定する。
      各階級の値を $X_{i}\ (i=0, 1, \dots , k-1)$,観測度数を $f_{i}$ とすれば, \[ \begin{align*} n & = \sum_{i=1}^k f_i \\ \hat{\lambda} & = \bar{X} = V = \frac{\displaystyle \sum_{i=1}^k f_i\ X_i}{n} \end{align*} \] 例題では,標本平均 $= \displaystyle \frac{0\cdot 27+1\cdot 61+2\cdot 77+\dots+9\cdot 2+10\cdot 1}{365} = 2.99178$ となる。これを $\lambda$ の推定値($\hat{\lambda}$)とする。

  3. 各カテゴリーの期待値は, \[ E_i = n \frac{\exp(-\hat{\lambda})\ \hat{\lambda}^i}{i!} \] 例題では,表 1 の 5 列目に計算結果を示す。

  4. 期待値が $1$ 以下のカテゴリーを併合する。併合後のカテゴリー数を $m$ とする。

    例題では,最後の 2 行をまとめる(死亡者数が $9$ 以上を一つのカテゴリーとする)。$m = 10$ になる。

  5. 以下の式で検定統計量を計算する。 \[ \chi^2_0 = \sum_{i=1}^m \frac{\left(\ f_i - E_i\ \right)^2}{E_i} \] 例題では,$\chi^2_0 = 14.143$ となる。

  6. $\chi^2_0$ は,自由度が $m-1-1$ の $\chi^2$ 分布に従う(母平均の推定を行ったため,自由度が $1$ 余分に減る)。

    例題では,自由度は $8$ である。

  7. 有意確率を $P = \Pr\{\chi^2 \geqq \chi^2_0\}$ とする。
    $\chi^2$ 分布表,または $\chi^2$ 分布の上側確率の計算を参照すること。

    例題では,自由度 $8$ の $\chi^2$ 分布において,$\Pr\{\chi^2 \geqq 15.51\}= 0.05$ であるから,$P = \Pr\{\chi^2 \geqq 14.143\}\gt 0.05$ である(正確な有意確率:$P = 0.078$)。

  8. 帰無仮説の採否を決める。

    例題では,有意水準 $5\%$ で検定を行うとすれば($\alpha = 0.05$),$P \gt \alpha$ であるから,帰無仮説は棄却できない。すなわち,「ポアソン分布に従っていないとはいえない」。

・ R で計算してみる


・ 計算プログラム [R] [Python]


演習問題


応用問題

 「表 1 のデータをポリア・エッゲンベルガー分布にあてはめ,適合度の検定を行いなさい。」


問題1 標本分散を求めなさい。答えは小数点以下 6 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題2 パラメータ $r$ を推定しなさい。答えは小数点以下 6 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題3 $\chi^2_0$ 検定統計量を求めなさい。答えは小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題4 求められた $\chi^2_0$ 検定統計量は,自由度いくつの $\chi^2$ 分布に従うか,答えを解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題5 有意確率は $0.05$ より大きいか小さいか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:0.05 より大きい b:0.05 より小さい
解答欄:    

問題6 有意水準 $5\%$ で検定を行うとき,帰無仮説は棄却できるかできないか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:棄却できる b:棄却できない
解答欄:    

問題7 最終的な結論はどうなるか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:ポリア・エッゲンベルガー分布に従わないとはいえない b:ポリア・エッゲンベルガー分布に従わない
解答欄:    


・ 計算プログラム [R] [Python]
・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI