主座標分析 Last modified: Nov 07, 2002
類似度行列を元にして,対象の二次元配置を求める。
任意の基準による類似度行列を使用できるが,類似度行列は対称行列でなければならない(同様の目的を達成する手法として数量化 IV 類がある。数量化 IV 類では,分析に用いる類似度行列は対称行列でなくともよい。)。
- $n$ 個の対象間の類似度を表す類似度行列を $\mathbf{S}= ( S_{ij} )$ とする。$S_{ii} = 0$,$S_{ij} = S_{ji}$,対象 $i$ と対象 $j$ が似ていないほど負の,絶対値の大きな値をとるとする。
- $\mathbf{S}$ の固有値が $\lambda_{1} \geqq \lambda_{2}\geqq \dots \geqq \lambda_{n} \geqq 0$,第 $k$ 固有値に対応する固有ベクトルを $\mathbf{c}_{k} = ( c_{1k}, c_{2k}, \dots , c_{nk} )'$,$||\mathbf{c}_{k}||^{2} = \lambda_{k}$ とする。
- 対象 $i$ の座標を $(c_{i1}, c_{i2}, \dots , c_{in} )$,対象 $j$ の座標を $( c_{j1}, c_{j2}, \dots , c_{jn} )$ としたとき,対象 $i$ と対象 $j$ の間のユークリッド平方距離 $\Delta_{ij}^{2}$ は以下のようになる。
\[
\Delta_{ij}^{2} = \sum_{k=1}^n (c_{ik}-c_{jk})^2 = S_{ii}^2+S_{jj}^2 - 2\ S_{ij} = -2\ S_{ij}
\]
- もし,類似度行列 $\mathbf{S}$ の固有値の $m$ 番目以降の固有値が小さいならば,$n$ 次元空間に対象を配置するかわりに $m$ 次元空間に配置しても対象間の位置関係に大きな誤差はないであろう。
\[
\Delta_{ij}^{2} ≒ \sum_{k=1}^m (c_{ik}-c_{jk})^2
\]
- 主座標分析では特に $m = 2$ すなわち二次元平面上に対象を布置することが行われる。この場合に,次式により,二次元までの近似の効率を判定できる。
\[
寄与率 = \frac{\lambda_1+\lambda_2}{\lambda_1+\lambda_2+\cdots+\lambda_n}
\]
応用例
演習問題:
応用問題:
計算プログラム [R] [Python]
直前のページへ戻る E-mail to Shigenobu AOKI