クラスカル・ウォリス検定     Last modified: Dec 03, 2001

例題

 「12 匹のラットに 3 種類の餌を与えたときの肝臓の重量は表 1 のようであった。餌の種類により肝臓の重量の平均値に差があるといえいるか,有意水準 5% で検定しなさい。」

表 1.餌の種類による肝臓の重量
A餌 3.42 3.84 3.96 3.76
B餌 3.17 3.63 3.47 3.44 3.39
C餌 3.64 3.72 3.91


検定手順:

  1. 前提

  2. $k$ 群の標本において,各群のケース数を $n_j\ (j = 1,2,\dots,k);\ \ n = \displaystyle \sum_{j=1}^k n_j$ とする。

  3. $n$ 個の観測値を全てこみにして小さい方から順位をつける(同順位がある場合には平均順位をつける)。

    例題では次の表のようになる。

    表 2.餌の種類による肝臓の重量の順位
    A餌 3 10 12 9
    B餌 1 6 5 4 2
    C餌 7 8 11

  4. 第 $j$ 群の第 $i$ ケースの順位を $r_{ij}$ とし,第 $j$ 群の順位の和を $R_j = \displaystyle \sum_{i=1}^{n_j} r_{ij}$ とする($\displaystyle \sum_{j=1}^k R_j = \frac{n ( n + 1 )}{2}$)。

    例題では,$R_1 = 34$,$R_2 = 18$,$R_3 = 26$ である。

  5. 次式で検定統計量 $S_x$ を計算する。

    \[ S_x = \frac{12 \displaystyle \sum_{j=1}^k \frac{R_j^2}{n_j}}{n(n+1)}-3(n+1) \] 注:同順位が多い場合には,検定統計量 $S_x$ の修正が必要である。
    $m$ 種類の同順位があったとき,それぞれの同順位の個数を $t_j\ ( j = 1, 2, \dots , m )$とする。例えば,順位が 5 となるものが 4 個,順位が 11 となるものが 5 個あった場合には,$m = 2$,$t_1 = 4$,$t_2 = 5$。

    \[ C = 1-\frac{\displaystyle \sum_{j=1}^m \left (t_j^3-t_j\right )}{n(n^2-1)} \] \[ S_0 = \frac{S_x}{C} \] 例題では,$\displaystyle S_x = \frac{12 \left (\displaystyle \frac{34^2}{4} + \frac{18^2}{5} + \frac{26^2}{3} \right )} {12 \ ( 12 + 1 ) } - 3 \ ( 12 + 1 ) = 5.54872$ となる(同順位はないので補正は必要ない。)。

  6. $S_0$(または $S_x$) は,自由度が $k - 1$ の $\chi^2$ 分布に従う。

    例題では,$S_x$ は,自由度 $2$ の $\chi^2$ 分布に従う。

  7. 有意確率を $P = \Pr\{\chi^2 \geqq S_0\}$ とする。
    $\chi^2$ 分布表,または $\chi^2$ 分布の上側確率の計算を参照すること。

    例題では,自由度 $2$ の $\chi^2$ 分布において,$\Pr\{\chi^2 \geqq 5.99\}= 0.05$ であるから,$P = \Pr\{\chi^2 \geqq 5.54872\} > 0.05$ である(正確な有意確率:$P = 0.06239$)。

  8. 帰無仮説の採否を決める。

    注:群の数が $3$ または $4$ で全ケース数が少ない場合には,統計数値表($k = 3$ のとき,$k = 4$ のとき)を参照すれば正確な検定結果が得られる。
    $S_0$ が,表から得られる棄却限界値より大きいときに帰無仮説を棄却する。

    例題では,有意水準 $5\%$ で検定を行うとすれば($\alpha = 0.05$),$P > \alpha$ であるから,帰無仮説は棄却できない。すなわち,「母代表値に差があるとはいえない」。

    統計数値表からは,棄却限界値 $5.6564$ が得られるので,$S_x = 5.54872 < 5.6564$ ゆえ,同じ結果となる。

・ R で計算してみる


対比較の手順:

 全体の代表値の差の検定が有意なときには,シェッフェの方法による対比較を行える。

  1. 全順位の平均値は $\bar{a} = \displaystyle \frac{n+1}{2}$ である。

    例題の場合,$\displaystyle \frac{12 + 1}{2} = 6.5$ である。

  2. 各群の順位の平均を $\bar{R}_j = \displaystyle \frac{R_j}{n_j}$ とする。

    例題の場合,それぞれ,$8.5$,$3.6$,$8.666667$ である。

  3. 各群の順位の分散を $V = \displaystyle \frac{\displaystyle \sum_{j=1}^k \sum_{i=1}^{n_j} (r_{ij}-\bar{a})^2}{n-1}$ とする。
    例題の場合,$\displaystyle \frac{ ( 3 - 6.5 )^{2} + ( 10 - 6.5 )^{2} + \dots + ( 11 - 6.5 )^{2} } { 12 - 1 } = 13$

  4. $i$ 群と $j$ 群の対比較のための検定統計量 $S_{ij}$ を次式で計算する。

    \[ S_{ij} = \frac{\left (\bar{R}_i-\bar{R}_j \right )^2}{V\ \displaystyle \left(\frac{1}{n_i}+\frac{1}{n_j} \right )} \] 例題において,1 群と 2 群の比較は,$S_{12} = \displaystyle \frac{( 8.5 - 3.6 )^2} {13 \ \left( \displaystyle \frac{1}{4} + \frac{1}{5} \right) } = 4.104274$

  5. $S_{ij}$ は,自由度が $k - 1$ の $\chi^2$ 分布に従う。
    例題では,自由度は $3 - 1 = 2$

  6. 有意確率を $P_{ij} = \Pr\{\chi^2 \geqq S_{ij}\}$ とする。
    例題において,1 群と 2 群の比較では,$P_{12} = \Pr\{\chi^2 \geqq 4.104274 \}= 0.128460$

  7. 帰無仮説の採否を決める。

    例題の場合は $P_{12} > \alpha$ ゆえ,帰無仮説は棄却できない。「$1$ 群と $2$ 群の母代表値に差があるとはいえない」。

 全ての群の組合せについて対比較を行ったときでも,検定全体の危険率が $\alpha$ 以下であることが保証される。

・ R で計算してみる


演習問題

 「4 つの群についてある測定をおこなったところ,表 3 のような結果が得られた。代表値に差があるか有意水準 5% で検定しなさい。また,多重比較を行いなさい。」

表 3.測定値
群 1 13 10 12 19
群 2 21 26 15 14 21
群 3 27 28 21
群 4 13 16 19 10 12 19

問題1 帰無仮説はどれか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:母代表値に差はない b:母代表値に差がある
解答欄:    

問題2 検定統計量 $S_0$ を求めなさい。答えは小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題3 求められた $S_0$ 検定統計量は,自由度いくつの $\chi^2$ 分布に従うか,答えを解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題4 有意確率は 0.05 より大きいか小さいか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:0.05 より大きい b:0.05 より小さい
解答欄:    

問題5 有意水準 5% で検定を行うとき,帰無仮説は棄却できるかできないか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:棄却できる b:棄却できない
解答欄:    

問題6 最終的な結論はどうなるか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:母代表値に差があるとはいえない b:母代表値に差がある
解答欄:    

問題7 第 1 群と第 2 群の代表値の比較をするときの $S_{12}$ 検定統計量を求めなさい。答えは小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題8 第 1 群と第 2 群の代表値に差はあるといえるだろうか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:母代表値に差があるとはいえない b:母代表値に差がある
解答欄:    

・ R で計算してみる


応用問題


・ 計算プログラム [R] [Python]
・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI