一元配置分散分析は,各群の分散が等しいことを前提にしている。分散の均一性をまえもって検定しておく方がよい。
等分散でないときの平均値の差の検定によれば,「等分散を仮定しない検定法(Welch の方法の拡張)」を採用するのが良さそうである。
等分散性を確かめてから一元配置分散分析という手順は,検定の多重性という点でも問題がある。最初から等分散を仮定しない一元配置分散分析を行う方がよい。
例題:
「12 匹のラットに 3 種類の餌を与えたときの肝臓の重量は表 1 のようであった。餌の種類により肝臓の重量の母平均値に差があるといえいるか,有意水準 $5\%$ で検定しなさい。」
A餌 | 3.42 | 3.84 | 3.96 | 3.76 | |
---|---|---|---|---|---|
B餌 | 3.17 | 3.63 | 3.47 | 3.44 | 3.39 |
C餌 | 3.64 | 3.72 | 3.91 |
検定手順:
\[ S_t = \sum_{j=1}^k \sum_{i=1}^{n_j} (X_{ij}-\bar{X})^2 \] 例題の場合は,$S_{t} = 0.6278$ である。
\[ S_b = \sum_{j=1}^k n_j\ (\bar{X}_j-\bar{X})^2 \] 例題の場合は,$S_{b} = 0.3179$ である。
\[ S_w = \sum_{j=1}^k \sum_{i=1}^{n_j} (X_{ij}-\bar{X}_j)^2 \] 例題の場合は,$S_{w} = S_{t} - S_{b} = 0.3100$ である。
変動要因 | 平方和 | 自由度 | 平均平方 | $F$ 値 |
---|---|---|---|---|
群間 | $S_{b}$ | $df_{b} = k - 1$ | $V_{b} = S_{b}\ /\ df_{b}$ | $F_0 = V_{b}\ /\ V_{w}$ |
群内 | $S_{w}$ | $df_{w} = n - k$ | $V_{w} = S_{w}\ /\ df_{w}$ | |
全体 | $S_{t} = S_{b} + S_{w}$ | $df_{t} = n - 1$ | $V_{t} = S_{t}\ /\ df_{t}$ |
例題の場合,以下のような分散分析表を得る。
変動要因 | 平方和 | 自由度 | 平均平方 | $F$ 値 |
---|---|---|---|---|
群間 | 0.3179 | 2 | 0.1589 | 4.6146 |
群内 | 0.3100 | 9 | 0.0344 | |
全体 | 0.6278 | 11 | 0.0571 |
$F_0 = 4.6146$ となる。
例題の場合,自由度は $df_{b}= 2$,$df_{w} = 9$ である。
例題では,自由度が $(2, 9)$ の $F$ 分布において,$\Pr\{F \geqq 4.26\}= 0.05$ であるから,$P = \Pr\{F \geqq 4.6146\}\lt 0.05$ である(正確な有意確率:$P = 0.0417488$)。
例題では,有意水準 $5\%$ で検定を行うとすれば($\alpha = 0.05$),$P \lt \alpha$ であるから,帰無仮説を棄却する。すなわち,「各群の平均値は等しくない」。
各群の等分散性を仮定しない場合の検定(二群の平均値の差の検定 Welch の方法の拡張)
各群のケース数,平均値,不偏分散をそれぞれ $n_i$, $m_i$, $u_i$ として,以下のようにして計算される $F$ が,自由度 $(df_1, df_2)$ の $F$ 分布に従うことを利用する。
$w_i = \displaystyle \frac{n_i}{u_i}$R で計算してみる$w = \displaystyle \sum_{i=1}^k w_i$
$m = \displaystyle \frac{1}{w} \sum_{i=1}^k w_i\ m_i$
$a = \displaystyle \frac{1}{k^2-1} \sum_{i=1}^k\left \{ \frac{1}{n_i-1} \left (1-\frac{w_i}{w} \right )^2 \right \}$
$F = \displaystyle \frac{1}{(k-1)\{1+2a\ (k-2)\}} \sum_{i=1}^k w_i\ (m_i-m)^2$
$df_1 = k-1$
$df_2 = \displaystyle \frac{1}{3a}$
wi = (74.4879, 181.1594, 155.9792) w = 411.6265 m = 3.606386 a = 0.06185509 F = 5.004541 df1 = 2 df2 = 5.388939 p = 0.05907792
演習問題:
「$4$ つの群におけるある変数の測定値の集計結果は表 2 のようであった。母平均値に差があるといえいるか,有意水準 $5\%$ で検定しなさい。」
件数 | 平均値 | 標準偏差 | |
---|---|---|---|
第1群 | 8 | 135.83 | 19.59 |
第2群 | 11 | 160.49 | 12.28 |
第3群 | 22 | 178.35 | 15.01 |
第4群 | 6 | 188.06 | 9.81 |
全体 | 47 | 168.17 | 22.40 |
問題1 帰無仮説はどれか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。
問題2 $F_0$ 検定統計量を求めなさい。答えは小数点以下 4 桁目で四捨五入した値を解答欄に記入し,送信ボタンをクリックしなさい。
問題3 有意確率は 0.05 より大きいか小さいか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。
問題4 有意水準 $5\%$ で検定を行うとき,帰無仮説は棄却できるかできないか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。
問題5 最終的な結論はどうなるか。a,b のいずれかを解答欄に記入し,送信ボタンをクリックしなさい。
応用問題: