一元配置分散分析     Last modified: Aug 07, 2009

 一元配置分散分析は,各群の分散が等しいことを前提にしている。分散の均一性をまえもって検定しておく方がよい。
 等分散でないときの平均値の差の検定によれば,「等分散を仮定しない検定法(Welch の方法の拡張)」を採用するのが良さそうである。
 等分散性を確かめてから一元配置分散分析という手順は,検定の多重性という点でも問題がある。最初から等分散を仮定しない一元配置分散分析を行う方がよい。


例題

 「12 匹のラットに 3 種類の餌を与えたときの肝臓の重量は表 1 のようであった。餌の種類により肝臓の重量の母平均値に差があるといえいるか,有意水準 $5\%$ で検定しなさい。」

表 1.餌の種類による肝臓の重量
A餌 3.42 3.84 3.96 3.76
B餌 3.17 3.63 3.47 3.44 3.39
C餌 3.64 3.72 3.91


検定手順:

  1. 前提

  2. 群の数を $k$,全ケース数を $n$,各群のケース数を $n_j$,全体の平均値を $\bar{X}$,第 $j$ 群における平均値を $\bar{X}_j$ とする($j=1, 2, \dots , k;\ \displaystyle \sum_{j=1}^k n_j = n$)。

  3. 平方和 $S_{t}$ を求める(全体の不偏分散 $U_{t}$ が求められていれば,$S_{t} = ( n - 1 ) U_{t}$ としてもよい)。

    \[ S_t = \sum_{j=1}^k \sum_{i=1}^{n_j} (X_{ij}-\bar{X})^2 \] 例題の場合は,$S_{t} = 0.6278$ である。

  4. 平方和 $S_{b}$ を求める。

    \[ S_b = \sum_{j=1}^k n_j\ (\bar{X}_j-\bar{X})^2 \] 例題の場合は,$S_{b} = 0.3179$ である。

  5. 平方和 $S_{w}$ を求める。$S_{w} = S_{t} - S_{b}$ の関係式から求めてもよい。

    \[ S_w = \sum_{j=1}^k \sum_{i=1}^{n_j} (X_{ij}-\bar{X}_j)^2 \] 例題の場合は,$S_{w} = S_{t} - S_{b} = 0.3100$ である。

  6. 表 2 に示すような分散分析表を作る。

    表 2. 一元配置分散分析表
    変動要因 平方和 自由度 平均平方 F 値
    群間 $S_{b}$ $df_{b} = k - 1$ $V_{b} = S_{b}\ /\ df_{b}$ $F_0 = V_{b}\ /\ V_{w}$
    群内 $S_{w}$ $df_{w} = n - k$ $V_{w} = S_{w}\ /\ df_{w}$
    全体 $S_{t} = S_{b} + S_{w}$ $df_{t} = n - 1$ $V_{t} = S_{t}\ /\ df_{t}$

    例題の場合,以下のような分散分析表を得る。

    変動要因 平方和 自由度 平均平方 $F$ 値
    群間 0.3179 2 0.1589 4.6146
    群内 0.3100 9 0.0344
    全体 0.6278 11 0.0571

    $F_0 = 4.6146$ となる。

  7. 検定統計量 $F_0$ は,第 $1$ 自由度が $df_{b}( = k - 1 )$,第 $2$ 自由度が $df_{w}( = n - k)$の $F$ 分布に従う。

    例題の場合,自由度は $df_{b}= 2$,$df_{w} = 9$ である。

  8. 第 $1$ 自由度が $df_{b}$,第 $2$ 自由度が $df_{w}$ の $F$ 分布において,有意確率を $P = \Pr\{F \geqq F_0\}$ とする。
    $F$ 分布表($\alpha = 0.05$$\alpha = 0.025$$\alpha = 0.01$$\alpha = 0.005$),または $F$ 分布の上側確率の計算を参照すること。

    例題では,自由度が $(2, 9)$ の $F$ 分布において,$\Pr\{F \geqq 4.26\}= 0.05$ であるから,$P = \Pr\{F \geqq 4.6146\}\lt 0.05$ である(正確な有意確率:$P = 0.0417488$)。

  9. 帰無仮説の採否を決める。

    例題では,有意水準 $5\%$ で検定を行うとすれば($\alpha = 0.05$),$P \lt \alpha$ であるから,帰無仮説を棄却する。すなわち,「各群の平均値は等しくない」。


各群の等分散性を仮定しない場合の検定(二群の平均値の差の検定 Welch の方法の拡張)

 各群のケース数,平均値,不偏分散をそれぞれ $n_i$, $m_i$, $u_i$ として,以下のようにして計算される $F$ が,自由度 $(df_1, df_2)$ の $F$ 分布に従うことを利用する。

$w_i = \displaystyle \frac{n_i}{u_i}$

$w = \displaystyle \sum_{i=1}^k w_i$

$m = \displaystyle \frac{1}{w} \sum_{i=1}^k w_i\ m_i$

$a = \displaystyle \frac{1}{k^2-1} \sum_{i=1}^k\left \{ \frac{1}{n_i-1} \Bigl (1-\frac{w_i}{w} \Bigr )^2 \right \}$

$F = \displaystyle \frac{1}{(k-1)\{1+2a\ (k-2)\}} \sum_{i=1}^k w_i\ (m_i-m)^2$

$df_1 = k-1$

$df_2 = \displaystyle \frac{1}{3a}$

wi = (74.4879, 181.1594, 155.9792)
w = 411.6265
m = 3.606386
a = 0.06185509
F = 5.004541
df1 = 2
df2 = 5.388939
p = 0.05907792
・ R で計算してみる


演習問題

 「$4$ つの群におけるある変数の測定値の集計結果は表 2 のようであった。母平均値に差があるといえいるか,有意水準 $5\%$ で検定しなさい。」

表 2.架空データ例

件数  平均値 標準偏差
第1群 8 135.83 19.59
第2群 11 160.49 12.28
第3群 22 178.35 15.01
第4群 6 188.06 9.81
全体 47 168.17 22.40


問題1 帰無仮説はどれか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:各群の平均値は等しい b:各群の平均値は等しくない
解答欄:    

問題2 $F_0$ 検定統計量を求めなさい。答えは小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。

解答欄:    

問題3 有意確率は 0.05 より大きいか小さいか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:0.05 より大きい b:0.05 より小さい
解答欄:    

問題4 有意水準 $5\%$ で検定を行うとき,帰無仮説は採択されるか,棄却されるか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:棄却される b:採択される
解答欄:    

問題5 最終的な結論はどうなるか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。

選択肢 a:各群の母平均値は等しくないとはいえない b:各群の母平均値は等しくない
解答欄:    

・ R で計算してみる


応用問題


・ 計算プログラム [CGI(C)] [R]
・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI