平均値の多重比較
対比較−−テューキーの方法 Last modified: Aug 03, 2009
本来は各群の例数の等しい場合をテューキーの方法と呼び,例数が等しくない場合に拡張したものをテューキー・クレーマーの方法と呼ぶことが多い。
古い本には,「各群の例数が等しくない場合にはテューキー・クレーマーの方法は使えない」と書いてあるが,現在(1984年以降)では「対比較を行う場合にはテューキー・クレーマーの方法を使うべきである」ということになっている。
対比較される二群の分散が等しくない場合には,Welch の方法をとる Games-Howell の方法を用いることもできる。
例題:
「都道府県を 4 つに分けてそれぞれの群における癌による死亡率(人口 10 万人あたり)の集計結果は表 1 のようであった。各群の平均値の全ての組み合わせに対して対比較を行いなさい。」
表 1.47 都道府県における癌死亡率
| 都道府県数 | 平均値 | 標準偏差(注) |
第1群 | 8 | 135.83 | 19.59 |
第2群 | 11 | 160.49 | 12.28 |
第3群 | 22 | 178.35 | 15.01 |
第4群 | 6 | 188.06 | 9.81 |
全体 | 47 | 168.17 | 22.40 |
注:ここに表示した標準偏差は「不偏分散」の平方根である。
検定手順:
- 前提
- 帰無仮説 $H_0$:「母平均値に差はない」。
- 対立仮説 $H_1$:「母平均値に差がある(母平均の組の少なくとも一つで等号が成り立たない)」。
- 有意水準 $\alpha$ で両側検定を行う。
- 誤差分散 $V_{w}$(一元配置分散分析における群内平均平方と同じ)を計算する。
- 全ての $2$ 群の組み合わせについて検定統計量を計算する。
第 $i$ 群と第 $j$ 群($i \lt j$)の平均値をそれぞれ $\bar{X}_{i}$,$\bar{X}_{j}$,サンプルサイズを $n_i$,$n_j$ とすると,検定統計量 $t_{ij}$ は次の式で計算される。
\[
t_{ij} = \frac{\left | \bar{X}_i-\bar{X}_j \right |}
{\sqrt{V_w \displaystyle \left ( \displaystyle \frac{1}{n_i}+\frac{1}{n_j} \right ) }}
\]
- “ステューデント化した範囲の表”($\alpha = 0.05$,$\alpha = 0.01$)から,「群の数」が $k$,自由度 $\nu$(誤差分散 $V_{w}$ に対応する自由度。すなわち,一元配置分散分析における群内平均平方の自由度と同じ)に対応する数値を読みとり,この値を $q(k, \nu, \alpha)$ とする。
なお,対応する自由度が表にない場合には,もよりの $2$ 個の自由度に対する値から自由度の逆数補間で求める。
- 比較する群間に平均値の差があるかどうか判断する。
- $t_{ij} \lt q(k, \nu, \alpha)\ /\sqrt{2}$ のとき,帰無仮説を保留する。「群 $i$ と群 $j$ の母平均値に差があるとはいえない」。
- $t_{ij} \geqq q(k, \nu, \alpha)\ / \sqrt{2}$ のとき,帰無仮説を棄却する。「群 $i$ と群 $j$ の母平均値に差がある」。
Games-Howell 法は,検定手順の 3 において,$t$ 統計量と自由度は以下の式で計算する。
\[
t_{ij} = \frac{\left | \bar{X}_i-\bar{X}_j \right |}{\sqrt{\displaystyle \frac{U_i}{n_i}+\frac{U_j}{n_j} }}
\]
\[
df_{ij} = \frac{\left ( \displaystyle \frac{U_i}{n_i}+\frac{U_j}{n_j} \right )^2}
{\displaystyle\frac{U_i^2}{n_i^2\ (n_i-1)}+\frac{U_j^2}{n_j^2\ (n_j-1)}}
\]
この $t$ 統計量を $\sqrt{2}$ 倍したものは,「群の数が $k$,自由度 $df_{ij}$ のステューデント化した範囲の分布」に従う。
例えば R では,ptukey 関数で有意確率を計算できる(Tukey の方法の $t$ 統計量からも,自由度が $\nu$ として,有意確率を計算できる)。
例題の解:
- 誤差分散 $V_{w} = \displaystyle \frac { (8-1)\times 19.56^{2}+(11-1)\times 12.28^{2}+(22-1)\times 15.01^{2}+(6-1)\times 9.81^{2} } {47-4} = \frac{9406.8433}{43} = 218.7638$。
対応する自由度 $\nu$ は $47-4 = 43$。
- 検定統計量 $t_{ij}$ は以下の通り。
表 2.47 都道府県における癌死亡率に対するテューキーの方法による検定統計量
$j$\$i$ | 第 1 群 | 第 2 群 | 第 3 群 |
第 2 群 | 3.588* |
|
|
第 3 群 | 6.963* | 3.270* |
|
第 4 群 | 6.593* | 3.673* | 1.425 |
- 群の数($k$)$= 4$,$\nu = 43$ のときの $q(k, \nu, \alpha) = 3.779$ は,“ステューデント化した範囲の表”($\alpha = 0.05$)にないので,補間する。
$\nu_{b} = 43$,$\nu_{a} = 40$,$\nu_{c} = 60$,$a = 3.79$,$c = 3.74$ として,逆数補間 により,$\nu_{b} = 43$ のときの $q(k, \nu, \alpha)$ は $3.779534884$ である。
R で直接求めると以下のようになる。> qtukey(0.95, 4, 43)
[1] 3.779376
- $q(k, \nu, \alpha)\ /\ \sqrt{2} = 2.672534746$ と表の検定統計量を比較する。有意な差が認められるものに * をつけておく。
ステューデント化した範囲の分布から R により有意確率を直接求めると以下のようになる。第 $1$ 群と第 $2$ 群の比較においては,
> ptukey(3.588*sqrt(2), 4, 43, lower.tail=FALSE)
[1] 0.004538206
Games-Howell 法では,第 $1$ 群と第 $2$ 群の比較においては,$t_{12}=3.139938$,$df_{12}=10.94674$ より,有意確率は,> ptukey(3.139938*sqrt(2), 4, 10.94674, lower.tail=FALSE)
[1] 0.04041523
となる。
演習問題:
応用問題:
計算プログラム [R]
計算プログラム2 [R]
直前のページへ戻る E-mail to Shigenobu AOKI