平均値の多重比較
 対比較−−テューキーの方法
     Last modified: Aug 03, 2009

 本来は各群の例数の等しい場合をテューキーの方法と呼び,例数が等しくない場合に拡張したものをテューキー・クレーマーの方法と呼ぶことが多い。
 古い本には,「各群の例数が等しくない場合にはテューキー・クレーマーの方法は使えない」と書いてあるが,現在(1984年以降)では「対比較を行う場合にはテューキー・クレーマーの方法を使うべきである」ということになっている。

 対比較される二群の分散が等しくない場合には,Welch の方法をとる Games-Howell の方法を用いることもできる。

例題

 「都道府県を 4 つに分けてそれぞれの群における癌による死亡率(人口 10 万人あたり)の集計結果は表 1 のようであった。各群の平均値の全ての組み合わせに対して対比較を行いなさい。」

表 1.47 都道府県における癌死亡率

都道府県数  平均値 標準偏差(注)
第1群 8   135.83 19.59
第2群 11   160.49 12.28
第3群 22   178.35 15.01
第4群 6   188.06 9.81
全体 47   168.17 22.40
注:ここに表示した標準偏差は「不偏分散」の平方根である。


検定手順:

  1. 前提

  2. 誤差分散 $V_{w}$(一元配置分散分析における群内平均平方と同じ)を計算する。

  3. 全ての $2$ 群の組み合わせについて検定統計量を計算する。
    第 $i$ 群と第 $j$ 群($i \lt j$)の平均値をそれぞれ $\bar{X}_{i}$,$\bar{X}_{j}$,サンプルサイズを $n_i$,$n_j$ とすると,検定統計量 $t_{ij}$ は次の式で計算される。
    \[ t_{ij} = \frac{\left | \bar{X}_i-\bar{X}_j \right |} {\sqrt{V_w \displaystyle \left ( \displaystyle \frac{1}{n_i}+\frac{1}{n_j} \right ) }} \]
  4. “ステューデント化した範囲の表”($\alpha = 0.05$$\alpha = 0.01$)から,「群の数」が $k$,自由度 $\nu$(誤差分散 $V_{w}$ に対応する自由度。すなわち,一元配置分散分析における群内平均平方の自由度と同じ)に対応する数値を読みとり,この値を $q(k, \nu, \alpha)$ とする。

    なお,対応する自由度が表にない場合には,もよりの $2$ 個の自由度に対する値から自由度の逆数補間で求める。

  5. 比較する群間に平均値の差があるかどうか判断する。

Games-Howell 法は,検定手順の 3 において,$t$ 統計量と自由度は以下の式で計算する。
\[ t_{ij} = \frac{\left | \bar{X}_i-\bar{X}_j \right |}{\sqrt{\displaystyle \frac{U_i}{n_i}+\frac{U_j}{n_j} }} \] \[ df_{ij} = \frac{\left ( \displaystyle \frac{U_i}{n_i}+\frac{U_j}{n_j} \right )^2} {\displaystyle\frac{U_i^2}{n_i^2\ (n_i-1)}+\frac{U_j^2}{n_j^2\ (n_j-1)}} \]  この $t$ 統計量を $\sqrt{2}$ 倍したものは,「群の数が $k$,自由度 $df_{ij}$ のステューデント化した範囲の分布」に従う。 例えば R では,ptukey 関数で有意確率を計算できる(Tukey の方法の $t$ 統計量からも,自由度が $\nu$ として,有意確率を計算できる)。


例題の解

  1. 誤差分散 $V_{w} = \displaystyle \frac { (8-1)\times 19.56^{2}+(11-1)\times 12.28^{2}+(22-1)\times 15.01^{2}+(6-1)\times 9.81^{2} } {47-4} = \frac{9406.8433}{43} = 218.7638$。
    対応する自由度 $\nu$ は $47-4 = 43$。

  2. 検定統計量 $t_{ij}$ は以下の通り。
    表 2.47 都道府県における癌死亡率に対するテューキーの方法による検定統計量
    $j$\$i$第 1 群 第 2 群 第 3 群
    第 2 群 3.588*

    第 3 群 6.963* 3.270*
    第 4 群 6.593* 3.673* 1.425

  3. 群の数($k$)$= 4$,$\nu = 43$ のときの $q(k, \nu, \alpha) = 3.779$ は,“ステューデント化した範囲の表”($\alpha = 0.05$)にないので,補間する。
    $\nu_{b} = 43$,$\nu_{a} = 40$,$\nu_{c} = 60$,$a = 3.79$,$c = 3.74$ として,逆数補間 により,$\nu_{b} = 43$ のときの $q(k, \nu, \alpha)$ は $3.779534884$ である。
    R で直接求めると以下のようになる。
    > qtukey(0.95, 4, 43)
    [1] 3.779376
  4. $q(k, \nu, \alpha)\ /\ \sqrt{2} = 2.672534746$ と表の検定統計量を比較する。有意な差が認められるものに * をつけておく。
 ステューデント化した範囲の分布から R により有意確率を直接求めると以下のようになる。第 $1$ 群と第 $2$ 群の比較においては,
> ptukey(3.588*sqrt(2), 4, 43, lower.tail=FALSE)
[1] 0.004538206
 Games-Howell 法では,第 $1$ 群と第 $2$ 群の比較においては,$t_{12}=3.139938$,$df_{12}=10.94674$ より,有意確率は,
> ptukey(3.139938*sqrt(2), 4, 10.94674, lower.tail=FALSE)
[1] 0.04041523
となる。


演習問題


応用問題


・ 計算プログラム [R]
・ 計算プログラム2 [R]
・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI