二標本コルモゴロフ・スミルノフ検定     Last modified: Nov 07, 2002

  1. 両側検定では,代表値の差だけでなく,分布の違い(ちらばり,非対称度)も検出する。したがって,帰無仮説が棄却された場合に,分布の違いが検出されたのか代表値の違いが検出されたのかを検討する必要がある。

  2. この検定手法は 2 群の分布の違いがどのようなものであっても検出してしまう。代表値の差の検定を行うためには,代表値の差以外の分布の形(散布度など)が 2 群で同じでなければならない。

  3. 分布の形が大幅に異なるならば,検定結果が有意であっても,代表値に差があることを意味するのか,分布の形が違うのか解釈できない。

  4. 代表値に差がないときに,分布が異なる場合には,この検定は分布の差の検定になる。

  5. 代表値の差を比較する変数が間隔尺度以上の場合にはカテゴリー化して検定に用いるが,カテゴリー数が少なすぎると検出力が弱くなるので注意しなければならない。


例題

 「表 1 のような二群のデータがある。身長の代表値に差があるかどうか,有意水準 5% で検定しなさい。」

表 1.二群の身長
観察度数 累積度数 累積相対度数
階級 第1群 第2群 第1群 第2群 第1群 第2群  差 
142 1 0 1 0 0.005 0.000 0.005
143 2 1 3 1 0.014 0.005 0.009
144 1 2 4 3 0.019 0.016 0.003
145 3 2 7 5 0.032 0.026 0.007
146 2 4 9 9 0.042 0.047 -0.005
147 3 5 12 14 0.056 0.073 -0.017
148 3 6 15 20 0.069 0.104 -0.034
149 2 8 17 28 0.079 0.145 -0.066
150 7 10 24 38 0.111 0.197 -0.086
151 11 7 35 45 0.162 0.233 -0.071
152 10 16 45 61 0.208 0.316 -0.108
153 9 17 54 78 0.250 0.404 -0.154
154 13 17 67 95 0.310 0.492 -0.182
155 13 13 80 108 0.370 0.560 -0.189
156 22 19 102 127 0.472 0.658 -0.186
157 17 13 119 140 0.551 0.725 -0.174
158 23 18 142 158 0.657 0.819 -0.161
159 20 10 162 168 0.750 0.870 -0.120
160 17 4 179 172 0.829 0.891 -0.062
161 14 6 193 178 0.894 0.922 -0.029
162 13 6 206 184 0.954 0.953 0.000
163 5 5 211 189 0.977 0.979 -0.002
164 2 1 213 190 0.986 0.984 0.002
165 1 3 214 193 0.991 1.000 -0.009
166 1 0 215 193 0.995 1.000 -0.005
167 1 0 216 193 1.000 1.000 0.000
合計 216 193





検定手順:

  1. 前提

  2. 各群について累積相対度数分布を求め,各階級で差をとる。

    累積相対度数
    階級 第 1 群 第 2 群  差($d_i$)
    1 $P_{11}$ $P_{12}$ $P_{11} - P_{12}$
    2 $P_{21}$ $P_{22}$ $P_{21} - P_{22}$
    i $P_{i1}$ $P_{i2}$ $P_{i1} - P_{i2}$
    $k$ 1.0 1.0 0.0

  3. 両側検定の場合には,累積相対度数の差の絶対値 $| d_i |$ のうち最も大きいものを検定統計量 $D$ とする。

    例題では,$D = 0.189$ である。

  4. 各群の例数を,$n_1$,$n_2$ として,以下の検定統計量を計算する。

    \[ \chi^2_0 = 4\ D^2\frac{n_1\ n_2}{n_1\ + n_2} \] 例題では,$n_1 = 216$,$n_2 = 193$ であり,$\chi^2_0 ≒ 14.563$ である。

  5. $n_1,\ n_2 > 40$ のとき,$\chi^2_0$ は,近似的に自由度が $2$ の $\chi^2$ 分布に従う。

      注:$n_1,\ n_2 \leqq 40$ のとき,近似の程度は悪い。

  6. 有意確率を $P = 2 \times \Pr\{\chi^2 \geqq \chi^2_0\}$とする($P > 1$ のときは,$P = 1$ とする)。
    $\chi^2$分布の上側確率の計算を参照すること。

    例題では,有意確率 $P = 2 \times 0.000688153 = 0.001376306$。

  7. 帰無仮説の採否を決める。

    例題では,有意水準 5% で検定を行うとすれば($\alpha = 0.05$),$P < \alpha$ であるから,帰無仮説を棄却する。すなわち,「身長の母代表値に差がある」といえる。

・ R で計算してみる


演習問題


応用問題


・ 計算プログラム [R] [Python]
・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI