カテゴリーデータに基づき,ケースおよび変数の似通ったものをまとめる。
分析に使用する変数が間隔尺度以上の場合の主成分分析に相当する。コレスポンデンス分析あるいは双対尺度法によるものと同じ結果が得られる。 また,ダミー変数を用いた主成分分析と関連がある。
分析に用いるデータには 2 種類ある。
ケース番号 | $I_{1}$ | $I_{2}$ | $I_{3}$ |
---|---|---|---|
1 | 1 | 2 | 2 |
2 | 2 | 1 | 1 |
3 | 1 | 3 | 1 |
4 | 3 | 4 | 2 |
5 | 3 | 1 | 2 |
ケース番号 | $I_{1}$ | $I_{2}$ | $I_{3}$ | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
$C_{11}$ | $C_{12}$ | $C_{13}$ | $C_{21}$ | $C_{22}$ | $C_{23}$ | $C_{24}$ | $C_{31}$ | $C_{32}$ | |||
1 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | ||
2 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | ||
3 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | ||
4 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 1 | ||
5 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 1 |
ケース番号 | $C_{1}$ | $C_{2}$ | $C_{3}$ | $C_{4}$ | $C_{5}$ |
---|---|---|---|---|---|
1 | 1 | 0 | 1 | 1 | 0 |
2 | 0 | 1 | 1 | 0 | 1 |
3 | 1 | 0 | 0 | 1 | 0 |
4 | 0 | 1 | 1 | 0 | 0 |
5 | 1 | 0 | 1 | 1 | 0 |
アイテムデータも,分析に利用される時点ではカテゴリーデータに展開されるので,以下では表 3 の例を用いて説明する。
数量化 III 類では,表 3 の行と列を入れ替え,互いに似ているケースとカテゴリーが隣り合わせになるように配置しなおすことを目標とする。例えば,表 4 はそのようなものの 1 例である。これを見ると,対角線上に 1 が集まっていることがわかる。
ケース番号 | $C_{1}$ | $C_{4}$ | $C_{3}$ | $C_{2}$ | $C_{5}$ |
---|---|---|---|---|---|
3 | 1 | 1 | 0 | 0 | 0 |
1 | 1 | 1 | 1 | 0 | 0 |
5 | 1 | 1 | 1 | 0 | 0 |
4 | 0 | 0 | 1 | 1 | 0 |
2 | 0 | 0 | 1 | 1 | 1 |
表 4 は,各ケースとカテゴリーを等間隔に配置する場合であるが,さらに,各ケースとカテゴリーにケースとカテゴリーは等間隔に配置される必要性はない。
そこで,ケースに割当てられる数値を $Y_{i}\ ( i = 1, 2, \dots , n )$ ,カテゴリーに割当てられる数値を $X_{j}\ ( j = 1, 2, \dots , p )$ とする。
全ケースの反応のあるカテゴリーについて $Y$ と $X$ の組合せを作る。
すなわち,表 4 の場合には,ケース 1 については $(Y_{1}, X_{1})$,$(Y_{1}, X_{3})$,$(Y_{1}, X_{4})$ の 3 組,ケース 3 については $(Y_{3}, X_{1})$,$(Y_{3}, X_{4})$ の 2 組などとなる。
全体でこのような $X$,$Y$ の組が $N$ 個あったとき,$X$ と $Y$ の相関が最も高くなるようにすれば $N$ 個の点は互に似ているもの同士が近くに配置されることになる。
なお,ケースとカテゴリーの相関が高くなるような数値の与えかたは何通りか考えられるので,最も相関が高くなる場合,次に相関が高くなる場合 $\dots$ という具合に,何通りかの解が存在する。それぞれの解は互に他と直交する( 相関がない )ように選ばれるので,1 通りの解で解釈が十分できない場合には,いくつかの解を組合せて解釈するとよい。
補足説明
演習問題:
応用問題: