類似度行列を元にして,対象の二次元配置を求める。
任意の基準による類似度行列を使用できるが,類似度行列は対称行列でなくてもよい。類似の方法として主座標分析がある。
n 個の対象間の類似度を表す類似度行列を $\mathbf{S} = ( S_{ij} )$ とする。
$S_{ii} = 0$,対象 $i$ と対象 $j$ が似ていないほど負の,絶対値の大きな値をとるとする。類似度行列は対称行列でなくてもよい。
数量化 IV 類は,各対象に数値を割当て,対象間のユークリッド距離が類似度の高い対象間では小さく,類似度の低い対象間では大きくなるようにすることを目的とする。
まず,1 次元の数量化を考える。対象 $i$ に $c_{i}$,対象 $j$ に $c_{j}$ という数値を割当てると,対象 $i$ と対象 $j$ の間のユークリッド平方距離は $\Delta_{ij}^{2} = ( c_{i} - c_{j} )^{2}$ となる。対象間のユークリッド距離が,類似度の高い対象間では小さく,類似度の低い対象間では大きくなるようにするので,(1) 式で定義される $Q$ が最大になるように $c_{i}$,$c_{j}$ を定めればよいわけである。
\[ Q = -\sum_{i=1}^n\sum_{j=1}^n S_{ij}\ (c_i-c_j)^2 \tag{1} \] 1 次元だけでは類似度を十分説明できない場合には,対象 $i$ に $( c_{i1}, c_{i2}, \dots , c_{im} )$,対象 $j$ に$( c_{j1}, c_{j2}, \dots , c_{jm} )$ のように数値を割り当てる。このとき,対象 $i$ と対象 $j$ の間の $m$ 次元空間でのユークリッド平方距離 $\Delta_{ij}^{2}$ は(2)式のようになるので,これを(1)式に用いる。
\[ \Delta_{ij}^2 = \sum_{k=1}^m(c_{ik}-c_{jk})^2 \tag{2} \] (1)式は固有値問題を解くことになる。
演習問題:
応用問題: