二元配置分散分析
 各水準の繰返し数が等しく,2 以上である場合
     Last modified: Nov 07, 2002

例題

 「年齢と季節がホルモンの分泌量と関係するかどうかについて,年齢階級および各季節ごとにそれぞれ別々に 3 人ずつ,計 60 人の被検者のホルモン分泌量を測定した結果は表 1 のようになった。$5\%$ の有意水準で二元配置分散分析をしなさい。」

表 1 .年齢と季節がホルモン分泌量に与える影響
20〜24歳 25〜29歳 30〜34歳 35〜39歳 40〜45歳
24.8
23.9
24.1
25.0
26.6
27.9
27.5
32.5
29.5
29.8
26.7
30.7
28.5
25.7
28.7
28.8
22.6
28.0
28.5
27.1
25.2
26.3
28.2
31.8
28.5
26.5
26.7
31.3
29.4
29.8
26.4
27.4
29.4
27.9
29.2
26.7
30.2
31.7
29.2
31.7
27.2
25.5
30.3
29.6
31.7
30.0
28.7
29.2
25.0
29.9
29.4
30.3
30.9
28.4
29.9
27.3
28.8
33.6
32.0
34.3


検定手順:
  1. 前提

  2. 繰返し数を $n$,各セルの測定値を $X_{ijk}\ (i=1, 2, \dots, a\;\ j=1, 2, \dots, b\ ;\ k=1, 2, \dots, n)$ とする。

    例題では,$n = 3$,$a = 4$,$b = 5$ である。

  3. 表 1 の各水準の平均値は,$\bar{X}_{i \cdot \cdot }$,$\bar{X}_{\cdot j \cdot }$ のように “${}_{\cdot}$” が最後にもう $1$ 個つき,それは各水準の組み合わせでの繰返し数 $n_{ij}$ を意味する。また,$\bar{X}_{ij \cdot }$ は各水準の組み合わせでの平均値を意味する。

  4. この場合には,分析対象変数 $X$ の全変動 $SS_{t}$ は以下のように $4$ 個の独立な変動に分解できる。

    全変動 = 要因 A の効果 + 要因 B の効果 + 要因 A と要因 B の交互作用 + 残差

    $SS_{t} = SS_{a} + SS_{b} + SS_{ab} + SS_{e}$

    \[ \begin{align*} \sum_{i=1}^a \sum_{j=1}^b \sum_{k=1}^n (X_{ijk} - \bar{X}_{\cdot \cdot \cdot})^2 &=\ n\ b \sum_{i=1}^a (\bar{X}_{i\cdot \cdot} - \bar{X}_{\cdot \cdot \cdot})^2\\ &+\ n\ a \sum_{j=1}^b (\bar{X}_{\cdot j \cdot} - \bar{X}_{\cdot \cdot \cdot})^2\\ &+\ n \sum_{i=1}^a \sum_{j=1}^b (\bar{X}_{i j \cdot} - \bar{X}_{i\cdot \cdot} - \bar{X}_{\cdot j \cdot} + \bar{X}_{\cdot \cdot \cdot})^2\\ &+ \sum_{i=1}^a \sum_{j=1}^b \sum_{k=1}^n (X_{ijk} - \bar{X}_{i j \cdot})^2 \end{align*} \]

  5. この場合,二元配置分散分析は表 2 のような分散分析表で表される。

    表 2.分散分析表
     変動要因   平方和  自由度 平均平方
    要因 A $SS_{a}$ $df_{a} = a - 1$ $MS_{a} = \displaystyle \frac{SS_{a}}{df_{a}}$
    要因 B $SS_{b}$ $df_{b} = b - 1$ $MS_{b} = \displaystyle \frac{SS_{b}}{df_{b}}$
    交互作用 $SS_{ab}$  $df_{ab} = ( a - 1 )\ ( b - 1 )$   $MS_{ab} = \displaystyle \frac{SS_{ab}}{df_{ab}}$ 
    残差 $SS_{e}$ $df_{e} = a\ b\ ( n - 1 )$ $MS_{e} = \displaystyle \frac{SS_{e}}{df_{e}}$
    全体 $SS_{t}$ $df_{t} = a\ b\ n - 1$

    表 3.分散分析表 を解釈する 3 つのモデル
    $F$ 値
     変動要因   モデルI   モデルII   混合モデル 
    要因 A  $F_{a} =$  $\displaystyle \frac{MS_{a}}{MS_{e}}$ $\displaystyle \frac{MS_{a}}{MS_{ab}}$ $\displaystyle \frac{MS_{a}}{MS_{ab}}$
    要因 B  $F_{b} =$  $\displaystyle \frac{MS_{b}}{MS_{e}}$ $\displaystyle \frac{MS_{b}}{MS_{ab}}$ $\displaystyle \frac{MS_{b}}{MS_{e}}$
    交互作用  $F_{ab} =$  $\displaystyle \frac{MS_{ab}}{MS_{e}}$ $\displaystyle \frac{MS_{ab}}{MS_{e}}$ $\displaystyle \frac{MS_{ab}}{MS_{e}}$

    モデル I母数モデル とも呼ばれる。要因 A,B の各水準を固定された不動のものとみなす。

    モデル II変量モデル とも呼ばれる。要因 A,B の各水準は無数の水準の内の標本とみなし,そこから得られる推測結論を,標本以外の広い範囲へも適用しようとするものである。

    混合モデル は,片方の要因に母数モデル,もう一方の要因に変量モデルを考えるものである。

  6. それぞれの自由度を持つ $F$ 分布において,有意確率を $P = \Pr\{F \geqq F_0\}$ とする。
    $F$ 分布表($\alpha = 0.05$$\alpha = 0.025$$\alpha = 0.01$$\alpha = 0.005$),または $F$ 分布の上側確率の計算を参照すること。

  7. 帰無仮説の採否を決める。

    例題では,それぞれのモデルごとに以下のようになる。各表の右端の欄に帰無仮説を棄却できるかできないかを示す。

    n.s. は有意確率が $0.05$ 以上なので,帰無仮説は棄却できない。
    * は有意確率が $0.05$ 以下なので,帰無仮説を棄却する。
    ** は有意確率が $0.01$ 以下なので,帰無仮説を棄却する。

    表 4.モデル I( 母数モデル )
    要因  平方和   自由度   平均平方    F値    有意確率     
    季節 51.39733 3 17.13244 4.937067 0.00520 **
    年齢 106.2873 4 26.57183 7.657221 0.00011 **
     交互作用  52.85267 12 4.404389 1.269215 0.27389 n.s.
    残差 138.8067 40 3.470167
    合計 349.3440 59 5.921085

    表 5.モデル II( 変量モデル )
    要因  平方和   自由度   平均平方    F値    有意確率     
    季節 51.39733 3 17.13244 3.889857 0.03739 *
    年齢 106.2873 4 26.57183 6.033035 0.00672 **
     交互作用  52.85267 12 4.404389 1.269215 0.27389 n.s.
    残差 138.8067 40 3.470167
    合計 349.3440 59 5.921085


演習問題


応用問題


・ 計算プログラム [R] [Python]
・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI