線形比較によれば,平均値のあらゆる比較ができる。
線形比較とは,次式で表される $\theta$ である。
$\theta = c_{1} \mu_{1} + c_{2} \mu_{2} + \dots + c_{k} \mu_{k}$
ただし,$c_{1} + c_{2} + \dots + c_{k} = 0$
例えば,全体で $5$ 群あり,第 $1$,$2$,$3$ 群をこみにしたものと第 $4$,$5$ 群をこみにしたものの比較の場合には,
$c_{1} = c_{2} = c_{3} = 1 / 3$,$c_{4} = c_{5} = -1 / 2$
とする。
得られる平均値の線形結合値の信頼区間を求め,信頼区間に $0$ が含まれない場合には,プールした $2$ 群の平均値に差があるとする。
なお,対比較も,$c_{i} = 1$,$c_{j} = -1$,$c_{a} = 0\ (a \ne i, j)$ のようにすれば可能であるが,検出力は対比較の方が高い。
事前にまとめる群が決まっている場合には t 検定でもよいが,結果をみてから検定を行う場合には線形比較によらなければならない。
群のケース数は等しくなくてもよい。
例題:
「都道府県を 4 つに分けてそれぞれの群における癌による死亡率(人口 10 万人あたり)の集計結果は表 1 のようであった。平均値に差があるといえいるか,有意水準 $5\%$ で検定しなさい。また,多重比較を行いなさい。」
都道府県数 | 平均値 | 標準偏差 | |
---|---|---|---|
第1群 | 8 | 135.83 | 19.59 |
第2群 | 11 | 160.49 | 12.28 |
第3群 | 22 | 178.35 | 15.01 |
第4群 | 6 | 188.06 | 9.81 |
全体 | 47 | 168.17 | 22.40 |
検定手順:
$\hat{\theta} = c_{1} \bar{X}_{1} + c_{2} \bar{X}_{2} + \dots + c_{k} \bar{X}_{k}$
ただし,$c_{1} + c_{2} + \dots + c_{k} = 0$
\[ V(\hat{\theta}) = V_w \sum_{i=1}^k \frac{c_i^2}{n_i} \]
$F$ 分布表($\alpha = 0.05$,$\alpha = 0.025$,$\alpha = 0.01$,$\alpha = 0.005$),または $F$ 分布のパーセント点の計算を参照すること。
\[ \hat{\theta} \pm \sqrt{(k-1)\ F_0\ V(\hat{\theta})} \]
全ての可能な線形比較の結果は,指定された有意水準のもとで正しい(全ての可能な線形比較をした場合には,この方法は,一元配置分散分析検定と等価である。)。
4 以降の手順は以下のようにしてもよい。
\[ F_0 = \frac{\hat{\theta}^2}{(k-1)\ V(\hat{\theta})} \]
例題の解:
比較する群 | $\hat{\theta}$ | 信頼区間 | $F$ 値 | 自由度 | 有意確率 |
---|---|---|---|---|---|
(1,2):(3,4) | $-$35.04500 | [ $-$49.12185 ,$-$20.96815 ] | 17.4880302 | ( 3,43 ) | 0.0000001 |
(1,2,3):(4) | $-$29.83667 | [ $-$48.87380 ,$-$10.79954 ] | 6.9310236 | ( 3,43 ) | 0.0006583 |
(2,3):(4) | $-$18.64000 | [ $-$37.92121 ,0.6412072 ] | 2.6370791 | ( 3,43 ) | 0.0616931 |
演習問題:
応用問題: