二元配置分散分析
 各水準の繰返し数が等しくなく,周辺度数にも比例しない場合

          Last modified: Nov 07, 2002


 二元配置分散分析において,「各水準の繰返し数が等しくなく,周辺度数にも比例しない」という状況は,データ採取後に 2 要因でケースを 2 重分類して要因効果を検討するような場合には最もありうる。
 このようなものを,非直交要因計画といい,要因の主効果が互に独立ではなく,交互作用も主効果と独立ではないので平方和( 変動 )の加法性はそのままでは成立しない。要因間に因果的順序がなく,主効果は交互作用よりはるかに大きい場合( 古典的要因計画法 )には以下のように分析が行われる。


例題

 「表 1 のデータについて二元配置分散分析を行いなさい。」

表 1.非直交要因計画による観察データ
要因 B
  $b_{1}$     $b_{2}$  
 要因 A   $a_{1}$   17 
16 
25 
22 
  $a_{2}$   18 
26 
34 
30 
34 
30 


検定手順:
  1. 前提

  2. 解析対象変数の変動が $SS_{t}$ である。

    例題では,$SS_{t} = 415.6$ である。

  3. 分析対象変数 $X$ の全変動 $SS_{t}$ は,次式のように $4$ 個の独立な変動に分解できる。

    全変動 = 要因 A の効果 + 要因 B の効果 + 要因 A と要因 B の交互作用 + 残差

    二元配置分散分析の結果は,表 2 のような分散分析表で表される。

    表 2.分散分析表
    変動要因 平方和 自由度 平均平方 $F$ 値
    要因 A $SS_{a \cdot b}$ $df_{a \cdot b} = a - 1$ $MS_{a \cdot b} = \displaystyle \frac{SS_{a \cdot b}}{df_{a \cdot b}}$ $F_{a \cdot b} = \displaystyle \frac{MS_{a \cdot b}}{MS_{e}}$
    要因 B $SS_{b \cdot a}$ $df_{b \cdot a} = b - 1$ $MS_{b \cdot a} = \displaystyle \frac{SS_{b \cdot a}}{df_{b \cdot a}}$ $F_{b \cdot a} = \displaystyle \frac{MS_{b \cdot a}}{MS_{e}}$
     交互作用   $SS_{ab}$   $df_{ab} = ( a - 1 )\ ( b - 1 )$   $MS_{ab} = \displaystyle \frac{SS_{ab}}{df_{ab}}$   $F_{ab} = \displaystyle \frac{MS_{ab}}{MS_{e}}$ 
    残差 $SS_{e}$ $df_{e} = n_{ \cdot \cdot } - a\ b$ $MS_{e} = \displaystyle \frac{SS_{e}}{df_{e}}$
    全体 $SS_{t}$ $df_{t} = n_{ \cdot \cdot } - 1$

  4. 2 要因の加法的効果を $SS_{a,b}$ としたとき 2 要因は非直交であるから,$SS_{a,b} \ne SS_{a} + SS_{b}$ である( したがって,$SS_{a} + SS_{b} + SS_{ab} + SS_{e} \ne SS_{t}$ である )。そこで,$SS_{a,b}$ のうち要因 B で説明されない部分を要因 A に割当て,要因 A で説明されない部分を要因 B に割当てる。具体的には,各要因についてダミー変数を用いた重回帰分析を行い,対応する変動を抽出する。

    例題では,要因 A,B の水準の数はそれぞれ 2 であるので,主効果を表すダミー変数はそれぞれ $1$ 個ずつ考えればよい。水準 1 の場合に $1$,水準 2 の場合に $0$ を取るようなダミー変数を考える。また,交互作用を表すダミー変数も $1$ 個考えればよく,要因 A,B とも水準 1 の場合に $1$,そうでない場合に $0$ を取るようなダミー変数を考える。

    重回帰分析に用いるデータ行列は表 3 のようになる。

    表 3.重回帰分析に用いるデータ行列
    水準 観察値
     (従属変数) 
    ダミー変数(独立変数)
     要因A   要因B   A の主効果   B の主効果   A, Bの 交互作用 
    1 1 17 1 1 1
    1 1 16 1 1 1
    1 2 25 1 0 0
    1 2 22 1 0 0
    2 1 18 0 1 0
    2 1 26 0 1 0
    2 2 34 0 0 0
    2 2 30 0 0 0
    2 2 34 0 0 0
    2 2 30 0 0 0

  5. 要因 A,B およびその交互作用を表す $( a - 1 ) + ( b - 1 ) + ( a - 1 )\ ( b - 1 )$ 個のダミー変数を独立変数とし,解析対象変数を従属変数とした重回帰分析を行う。これは「飽和モデル」であり,2 つの要因の全ての効果を抽出するものである。重回帰分散分析表の残差平方和の項が $SS_{e}$ である。全てのダミー変数によって説明される平方和の項が $SS_{a,b,ab}$ である。$SS_{t} = SS_{a,b,ab} + SS_{e}$ という関係が成り立つ。

    例題では,飽和モデルとして,A の主効果,B の主効果,A, B の交互作用を表す 3 つのダミー変数を独立変数として重回帰分析を行う。

    表 4 から,残差平方和 $SS_{e} = 53.0$ を得る。

    また,回帰により説明される平方和は $SS_{a,b,ab} = 362.6$ である。

    表 4.飽和モデルの
    回帰分析における分散分析表
     要因    平方和    自由度   平均平方    $F$ 値  
    回帰 362.6000 3 120.8667 13.68302
    残差 53.00000 6 8.833333
    全体 415.6000 9

  6. 要因 A,B を表す $( a - 1 ) + ( b - 1 )$ 個のダミー変数を独立変数とし,解析対象変数を従属変数とした重回帰分析を行う。これは要因 A と B の「加法モデル」である。全てのダミー変数によって説明される平方和の項は $SS_{a,b}$ である。

    例題では,要因 A と B の加法モデルとして,A の主効果,B の主効果を表す 2 つのダミー変数を独立変数として重回帰分析を行う。

    表 5 の回帰により説明される平方和は $SS_{a,b} = 357.4571$ である。

    表 5.加法モデルの
    回帰分析における分散分析表
     要因    平方和    自由度   平均平方    $F$ 値  
    回帰 357.4571 2 178.7286 21.51769
    残差 58.14286 7 8.306122
    全体 415.6000 9

  7. 要因 A,B の交互作用は,$SS_{ab} = SS_{a,b,ab} - SS_{a,b}$ で定義する。

    例題では,表 4 の回帰により説明される平方和( $SS_{a,b,ab} = 362.6$ )と,表 5 の回帰により説明される平方和( $SS_{a,b} = 357.4571$ )の差( $5.142857$ )が,交互作用の平方和 $SS_{ab} = 362.6 - 357.4571 = 5.1429$ である。

  8. 要因 A を表す $( a - 1 )$ 個のダミー変数を独立変数とし,解析対象変数を従属変数とした重回帰分析を行う。全てのダミー変数によって説明される平方和の項は要因 A の主効果 $SS_{a}$ である。

    例題では,要因 A を表す 1 つのダミー変数を独立変数として重回帰分析を行う。

    表 6 の回帰により説明される平方和が $SS_{a} = 180.2667$ である。

    表 6.要因 A の
    回帰分析における分散分析表
     要因    平方和    自由度   平均平方    $F$ 値  
    回帰 180.2667 1 180.2667 6.128045
    残差 235.3333 8 29.41667
    全体 415.6000 9

  9. 要因 B を表す $( b - 1 )$ 個のダミー変数を独立変数とし,解析対象変数を従属変数とした重回帰分析を行う。全てのダミー変数によって説明される平方和の項は要因 B の主効果 $SS_{b}$ である。

    例題では,要因 B を表す 1 つのダミー変数を独立変数として重回帰分析を行う。

    表 7 の回帰により説明される平方和が $SS_{b} = 236.0167$ である。

    表 7.要因 B の
    回帰分析における分散分析表
     要因    平方和    自由度   平均平方    $F$ 値  
    回帰 236.0167 1 236.0167 10.51397
    残差 179.5833 8 22.44792
    全体 415.6000 9

  10. 加法モデルにより説明される変動のうち,要因 B で説明されない部分を,「B で調整された A の主効果」として $SS_{a \cdot b} = SS_{a,b} - SS_{b}$ で定義する。

    例題では,表 5 の回帰により説明される平方和( $SS_{a,b} = 357.4571$ )と,表 7 の回帰により説明される平方和( $SS_{b} = 236.0167$ )の差が,$SS_{a \cdot b} = 357.4571 - 236.0167 = 121.4404$ である。

  11. 加法モデルにより説明される変動のうち,要因 A で説明されない部分を,「A で調整された B の主効果」として $SS_{b \cdot a} = SS_{a,b} - SS_{a}$ で定義する。

    例題では,表 5 の回帰により説明される平方和( $SS_{a,b} = 357.4571$ )と,表 6 の回帰により説明される平方和( $SS_{a} = 180.2667$ )の差が $SS_{b \cdot a} = 357.4571 - 180.2667 = 177.1904$ である。

  12. 要因 A の有意性の検定は,$F_{a \cdot b}$ が第 $1$ 自由度が $df_{a \cdot b}$,第 $2$ 自由度が $df_{e}$ である $F$ 分布に従うことを利用する。

  13. 要因 B の有意性の検定は,$F_{b \cdot a}$ が第 $1$ 自由度が $df_{b \cdot a}$,第 $2$ 自由度が $df_{e}$ である $F$ 分布に従うことを利用する。

  14. 交互作用 の有意性の検定は,$F_{ab}$ が第 $1$ 自由度が $df_{ab}$,第 $2$ 自由度が $df_{e}$ である $F$ 分布に従うことを利用する。

  15. それぞれの自由度を持つ $F$ 分布において,有意確率を $P = \Pr\{F \geqq F_0\}$ とする。
    $F$ 分布表($\alpha = 0.05$$\alpha = 0.025$$\alpha = 0.01$$\alpha = 0.005$),または $F$ 分布の上側確率の計算を参照すること。

  16. 以上をまとめて分散分析表を完成させる。

    例題では,表 8 のようになる。

    表 8.表 1 のデータに対する分散分析表 - モデル I( 母数モデル )
      要因   平方和  自由度   平均平方    $F$値    有意確率 
    要因 A  $SS_{a \cdot b}$   121.4405 1 121.4405 13.74798 0.01000
    要因 B  $SS_{b \cdot a}$   177.1905 1 177.1905 20.05930 0.00420
    交互作用  $SS_{ab}$   5.142857 1 5.142857 0.5822102 0.47437
    残差  $SS_{e}$   53.00000 6 8.833333
    合計  $SS_{t}$   415.6000 9 46.17778

  17. 帰無仮説の採否を決める。

    例題では,有意水準 $5\%$ で検定を行うとすれば($\alpha = 0.05$),要因 A の効果は, $P \lt \alpha$ であるから,帰無仮説を棄却する。すなわち,「要因効果がある」とする。要因 B の効果は, $P \lt \alpha$ であるから,帰無仮説を棄却する。すなわち,「要因効果がある」とする。交互作用は, $P \gt \alpha$ であるから,帰無仮説は棄却できない。すなわち,「交互作用があるとはいえない」。


演習問題


応用問題


・ 計算プログラム [R] [Python]
・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI