因子分析が有効であるためには変数間の相関係数( の絶対値 )がある程度大きくなければならない。小さな相関係数が多い場合には共通因子があるとは仮定しにくいからである。
変数間の相関関係の強さは偏相関係数で判定することができる。変数が共通因子を持つ場合には偏相関係数は小さくなるはずである。
偏相関係数の符号を逆転したものは反イメージ相関係数と呼ばれ,この値がゼロに近いときは因子分析が有効であることを示すが,そうでない場合には得られたデータに対して因子分析を適用するのは不適切であることを意味する。
$r_{ij}$,$a_{ij}$ をそれぞれ,変数 $i$ と変数 $j$ の間の相関係数および偏相関係数としたとき, $(1)$ 式で計算される,観察された相関係数と偏相関係数の比は,因子分析を用いることの適切性を判定する。 \[ \text{KMO} = \frac{{{\large \sum \sum} \atop {\scriptsize i \ne j}} {{\large{r_{ij}^2} \atop {}}}} {{{\large \sum \sum} \atop {\scriptsize i \ne j}} {{\large{r_{ij}^2} \atop {}}} { + \atop {}} {{\large \sum \sum} \atop {\scriptsize i \ne j}} {{\large{a_{ij}^2} \atop {}}}} \tag{1} \] もし,全ての変数間の偏相関係数の二乗和が相関係数の二乗和に比べて小さいときは $\text{KMO}$ の値は 1 に近くなる。
$\text{KMO}$ の値が小さいということは,2 変数間の相関関係を他の変数によって説明することができにくいということを意味するので,因子分析を適用することが不適切であることを示す。
Kaiser は表 1 のような判定基準を提案している。
Kaiser, H. F.: An index of factorial simplicity. Psychometrika, 39 , 31 - 36, 1974.
$\text{KMO}$ | 判 定 | |
---|---|---|
0.9以上 | marvelous | 素晴らしい |
0.8以上 | meritorious | 価値がある |
0.7以上 | middling | まずまず |
0.6以上 | mediocre | 並み |
0.5以上 | miserable | 惨め |
0.5未満 | unacceptable | ふさわしくない |
また,個々の変数についても $(2)$ 式によってサンプリング適切性(measurement of sampling adequacy) $\text{MSA}_{i}$ が評価できる。 \[ \text{MSA}_i = \frac{{{\large \sum} \atop {\scriptsize i \ne j}} {{\large{r_{ij}^2} \atop {}}}} {{{\large \sum} \atop {\scriptsize i \ne j}} {{\large{r_{ij}^2} \atop {}}} { + \atop {}} {{\large \sum} \atop {\scriptsize i \ne j}} {{\large{a_{ij}^2} \atop {}}}} \tag{2} \] 因子分析が有効であるためには個々の変数に対する $\text{MSA}_{i}$ が十分に大きいことが必要である。
$\text{MSA}_{i}$ の小さい変数は因子分析から除去する必要もあろう。
演習問題:
応用問題: