数量化 IV 類     Last modified: Nov 07, 2002

 類似度行列を元にして,対象の二次元配置を求める。

 任意の基準による類似度行列を使用できるが,類似度行列は対称行列でなくてもよい。類似の方法として主座標分析がある。


 n 個の対象間の類似度を表す類似度行列を $\mathbf{S} = ( S_{ij} )$ とする。

 $S_{ii} = 0$,対象 $i$ と対象 $j$ が似ていないほど負の,絶対値の大きな値をとるとする。類似度行列は対称行列でなくてもよい。

 数量化 IV 類は,各対象に数値を割当て,対象間のユークリッド距離が類似度の高い対象間では小さく,類似度の低い対象間では大きくなるようにすることを目的とする。

 まず,1 次元の数量化を考える。対象 $i$ に $c_{i}$,対象 $j$ に $c_{j}$ という数値を割当てると,対象 $i$ と対象 $j$ の間のユークリッド平方距離は $\Delta_{ij}^{2} = ( c_{i} - c_{j} )^{2}$ となる。対象間のユークリッド距離が,類似度の高い対象間では小さく,類似度の低い対象間では大きくなるようにするので,(1) 式で定義される $Q$ が最大になるように $c_{i}$,$c_{j}$ を定めればよいわけである。

\[ Q = -\sum_{i=1}^n\sum_{j=1}^n S_{ij}\ (c_i-c_j)^2 \tag{1} \]  1 次元だけでは類似度を十分説明できない場合には,対象 $i$ に $( c_{i1}, c_{i2}, \dots , c_{im} )$,対象 $j$ に$( c_{j1}, c_{j2}, \dots , c_{jm} )$ のように数値を割り当てる。このとき,対象 $i$ と対象 $j$ の間の $m$ 次元空間でのユークリッド平方距離 $\Delta_{ij}^{2}$ は(2)式のようになるので,これを(1)式に用いる。

\[ \Delta_{ij}^2 = \sum_{k=1}^m(c_{ik}-c_{jk})^2 \tag{2} \] (1)式は固有値問題を解くことになる。


演習問題


応用問題


・ 計算プログラム [CGI(C)] [R] [Python]
・ 直前のページへ戻る  ・ E-mail to Shigenobu AOKI