平均値の多重比較
ライアンの方法 Last modified: Jan 14, 2007
一元配置分散分析の結果,全体としての平均値に有意な差が認められたときにも,全ての群間に平均値の差があるわけではない。
対比較とは,どの 2 群の平均値の間に有意な差があるかを検定するための方法である。
例題:
「都道府県を 4 つに分けてそれぞれの群における癌による死亡率(人口 10 万人あたり)の集計結果は表 1 のようであった。平均値に差があるといえいるか,有意水準 $5\%$ で検定しなさい。また,多重比較を行いなさい。」
表 1.47 都道府県における癌死亡率
| 都道府県数 | 平均値 | 標準偏差 |
第1群 | 8 | 135.83 | 19.59 |
第2群 | 11 | 160.49 | 12.28 |
第3群 | 22 | 178.35 | 15.01 |
第4群 | 6 | 188.06 | 9.81 |
全体 | 47 | 168.17 | 22.40 |
検定手順:
- 前提
- 帰無仮説 $H_0$:「平均値に差はない」。
- 対立仮説 $H_1$:「平均値に差がある」。
- 有意水準 $\alpha$ で両側検定を行う(片側検定も定義できる)。
- ライアンの方法では,名義的有意水準($\alpha'$)という概念が使われる。$k$ 群の場合,全ての $2$ 群の平均値の差を検定する場合には,${}_{k}C_{2}$ 回の検定を行わなければならない。検定結果全体としての有意水準を $\alpha$ とするためには,個々の検定において有意水準を $\alpha\ /\ {}_{k}C_{2}$ まで下げておけばよい。しかし,もし平均値の最大値と最小値に有意な差が認められたときには,次の段階で $k - 1$ 個の平均値の差を検定するときには,有意水準をもう少し大きくしてもよいであろう。このように考えると,個々の検定に使用する有意水準として,次式で表される名義的有意水準 $\alpha'$ を使用すればよい。
\[
\alpha' = \frac{2\ \alpha}{ k\ ( m - 1 ) }
\]
ここで,$m$ は比較する $2$ 個の平均値を $\bar{X}_{i}$,$\bar{X}_{j}$ としたとき,$\bar{X}_{i} \geqq \bar{X}_{p} \geqq \bar{X}_{j}$ を満たす $\bar{X}_{p}$ の個数である。
- $\bar{X}_{i}$ と $\bar{X}_{j}$ の平均値の差の検定には,次式による $t_{0}$ 統計量を用いる。ここで,$V_{w}$ は群内平均平方(群内分散),$n_i$,$n_j$ は群 $i$,群 $j$ のケース数である。
\[
t_0 = \frac{\left | \bar{X}_i-\bar{X}_j \right |}{\sqrt{V_w} \sqrt{\displaystyle \frac{1}{n_i}+\frac{1}{n_j}}}
\]
- $t_{0}$ 統計量は,自由度が $n-k$(すなわち $V_{w}$ の自由度と同じ)の $t$ 分布に従う。
- 有意確率を $P = \Pr\{|t|\geqq t_{0}\}$ とする。
- 帰無仮説の採否を決める。
- $P \gt \alpha'$ のとき,帰無仮説は棄却できない。「平均値に差はない」。
- $P \leqq \alpha'$ のとき,帰無仮説を棄却する。「平均値に差がある」。
対比較は,以下のように行われる。
- まず,平均値が最大である群と,最小である群について検定を行う。
このとき,$m = k$ である。もし有意差なしならば,検定終了。結論は「個々の平均値対に差はない」とする。
もし有意差ありならば,次へ進む。
- $m = k - 1$ となるような $2$ 個の平均値の比較を行う。このような平均値の組合せは $2$ 通りある。すなわち,最大の平均値 vs. $2$ 番目に小さい平均値,$2$ 番目に大きい平均値 vs. 最小の平均値の検定を行うことになる。
名義的有意水準は,1. の場合よりも大きくなる。
- $m = k - 2, k - 3, \dots , 2$ となるような $2$ 個の平均値の比較を行う。ここで注意すべきことは,対象となる $2$ 個の平均値が,それまでの検定実施の過程で有意差なしとされた平均値に挟まれている場合には,検定を実施せずにただちに有意差なしと結論する。例えば,$\bar{X}_{a} \geqq \bar{X}_{b} \geqq \bar{X}_{c} \geqq \bar{X}_{d}$ ($a = b$ または $c = d$ の場合を含む)で,$a$ 群と $d$ 群の平均値に有意差がなかったとしたら,無条件に $a:b$,$a:c$,$b:c$,$b:d$,$c:d$ 群にも平均値に有意差がないとする。これは,前述の 1. の検定結果に対する解釈規定と同じである。
以上のようにして得られた全ての結論,すなわち「群 $x$ と群 $y$,群 $u$ と群 $v \dots$ に平均値の差が認められた。そのほかの平均値の組合せには有意差は認められなかった」は,全体としての有意水準が $\alpha$ になる。
例題の解:
- 一元配置分散分析の結果,全体として平均値の差があることがわかる。
- 多重比較の結果は以下のようになる。これ以外の組合せでは有意な差はない。
47 都道府県における癌死亡率に対するライアンの方法による多重比較
比較する群 | 名義的有意水準 | $t$ 値(Ryan) | 自由度 | 有意確率 |
第 4 群:第 1 群 | 0.00833333 | 6.538662 | 43 | $\lt$0.0000001 |
第 4 群:第 2 群 | 0.01250000 | 3.672794 | 43 | 0.0006595 |
第 3 群:第 1 群 | 0.01250000 | 6.963078 | 43 | $\lt$0.0000001 |
第 3 群:第 2 群 | 0.02500000 | 3.269975 | 43 | 0.0021219 |
第 2 群:第 1 群 | 0.02500000 | 3.588144 | 43 | 0.0008472 |
演習問題:
応用問題:
計算プログラム [R]
直前のページへ戻る E-mail to Shigenobu AOKI