線形比較−−シェッフェの方法     Last modified: Mar 18, 2004

 線形比較によれば,平均値のあらゆる比較ができる。
 線形比較とは,次式で表される $\theta$ である。

   $\theta = c_{1} \mu_{1} + c_{2} \mu_{2} + \dots + c_{k} \mu_{k}$
    ただし,$c_{1} + c_{2} + \dots + c_{k} = 0$

 例えば,全体で $5$ 群あり,第 $1$,$2$,$3$ 群をこみにしたものと第 $4$,$5$ 群をこみにしたものの比較の場合には,

   $c_{1} = c_{2} = c_{3} = 1 / 3$,$c_{4} = c_{5} = -1 / 2$

とする。
 得られる平均値の線形結合値の信頼区間を求め,信頼区間に $0$ が含まれない場合には,プールした $2$ 群の平均値に差があるとする。
 なお,対比較も,$c_{i} = 1$,$c_{j} = -1$,$c_{a} = 0\ (a \ne i, j)$ のようにすれば可能であるが,検出力は対比較の方が高い。
 事前にまとめる群が決まっている場合には t 検定でもよいが,結果をみてから検定を行う場合には線形比較によらなければならない。

 群のケース数は等しくなくてもよい。


例題

 「都道府県を 4 つに分けてそれぞれの群における癌による死亡率(人口 10 万人あたり)の集計結果は表 1 のようであった。平均値に差があるといえいるか,有意水準 $5\%$ で検定しなさい。また,多重比較を行いなさい。」

表 1.47 都道府県における癌死亡率

都道府県数  平均値 標準偏差
第1群 8   135.83 19.59
第2群 11   160.49 12.28
第3群 22   178.35 15.01
第4群 6   188.06 9.81
全体 47   168.17 22.40


検定手順:

  1. 前提

  2. 線形比較の推定値 $\hat{\theta}$ を次式により求める。

    $\hat{\theta} = c_{1} \bar{X}_{1} + c_{2} \bar{X}_{2} + \dots + c_{k} \bar{X}_{k}$
    ただし,$c_{1} + c_{2} + \dots + c_{k} = 0$

  3. $\hat{\theta}$ の分散を次式により求める。

    \[ V(\hat{\theta}) = V_w \sum_{i=1}^k \frac{c_i^2}{n_i} \]

  4. 第 $1$ 自由度が $df_{b}\ ( = k - 1 )$,第 $2$ 自由度が $df_{w}\ ( = n - k )$ である $F$ 分布の 上側 $\alpha$ パーセント点を $F_0$ とする。

    $F$ 分布表($\alpha = 0.05$$\alpha = 0.025$$\alpha = 0.01$$\alpha = 0.005$),または $F$ 分布のパーセント点の計算を参照すること。

  5. $\theta$ の信頼限界を次式により求める。

    \[ \hat{\theta} \pm \sqrt{(k-1)\ F_0\ V(\hat{\theta})} \]

  6. 帰無仮説の採否を決める。

    全ての可能な線形比較の結果は,指定された有意水準のもとで正しい(全ての可能な線形比較をした場合には,この方法は,一元配置分散分析検定と等価である。)。

4 以降の手順は以下のようにしてもよい。

  1. 次式で $F_0$ 検定統計量を求める。

    \[ F_0 = \frac{\hat{\theta}^2}{(k-1)\ V(\hat{\theta})} \]

  2. 検定統計量 $F_0$ は,第 $1$ 自由度が $df_{b} = k - 1 $,第 $2$ 自由度が $df_{w} = n - k $ の $F$ 分布に従う。

  3. 第 $1$ 自由度が $df_{b}$,第 $2$ 自由度が $df_{w}$ の $F$ 分布において,有意確率を $P = \Pr\{F \geqq F_0\}$ とする。
    $F$ 分布表($\alpha = 0.05$$\alpha = 0.025$$\alpha = 0.01$$\alpha = 0.005$),または $F$ 分布の上側確率の計算を参照すること。

  4. 帰無仮説の採否を決める。


例題の解

  1. 一元配置分散分析の結果,全体として平均値の差があることがわかる。

  2. 群内分散 $V_{w} = 218.763798$,その自由度は $43$ である。

  3. 第 $1$,$2$ 群をプールした平均値と,第 $3$,$4$ 群をプールした平均値の差の検定を行うときは,$c_{1} = c_{2} = \displaystyle \frac{1}{2} = 0.5$,$c_{3} = c_{4} = \displaystyle -\frac{1}{2}= -0.5$ とする。
  4. $\hat{\theta} = \displaystyle \frac{135.83+160.49}{2}-\frac{178.35+188.06}{2}=-35.045$ となる。

  5. $V(\hat{\theta}) = 218.763798\times 0.25\times \left( \displaystyle \frac{1}{8}+\frac{1}{11}+\frac{1}{22}+\frac{1}{6} \right) = 23.4093837$ となる。

  6. 自由度 $(3, 43)$ の $F$ 分布において,上側確率が $5\%$ となるパーセント点は $2.82162915$ である。

  7. $\theta$ の信頼区間は $-35.045 \pm \sqrt{(4-1)\times 2.82162915 \times 23.4093837} = [ -49.12185, -20.96815 ]$ となり,$0$ を含まないので,平均値に差があるとする。

  8. 別法では,$F_0 = 17.4880302$ となり,これが自由度 $(3, 43)$ の $F$ 分布に従うので,$P = \Pr\{F \gt 17.4880302\}\lt 0.0001$ ゆえ,$5\%$ の有意水準で平均値に差があるとする。

  9. 多重比較の結果(一部分)は以下のようになる。

比較する群 $\hat{\theta}$ 信頼区間 $F$ 値 自由度 有意確率
(1,2):(3,4) $-$35.04500 [ $-$49.12185 ,$-$20.96815 ] 17.4880302 ( 3,43 ) 0.0000001
(1,2,3):(4) $-$29.83667 [ $-$48.87380 ,$-$10.79954 ] 6.9310236 ( 3,43 ) 0.0006583
(2,3):(4) $-$18.64000 [ $-$37.92121 ,0.6412072 ] 2.6370791 ( 3,43 ) 0.0616931


演習問題


応用問題


・ 計算プログラム [R]
・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI