No.03267 Re: 主成分分析における固有値の意味 【青木繁伸】 2007/04/26(Thu) 08:31
二変数の場合について考えると良いでしょう。
No.03269 Re: 主成分分析における固有値の意味 【iwamoto】 2007/04/26(Thu) 09:46
返信ありがとうございます。
わかりやすい図を提供してくださったので,これを利用してもう一度自分の質問を整理してみました。
なぜ固有ベクトルが図のf1'とf2'ではなく,f1とf2になるのかという事です。
つまり,Var(f1)+Var(f2) が Var(f1')+Var(f2') より大きくなる,または
Var(f1) が すべての可能な軸に対する分散,Var(fk) where k!=1 より大きくなる根拠が良く理解できていません。
ページ http://aoki2.si.gunma-u.ac.jp/lecture/PCA/pca1.html の2に
* 各合成変量の相関が 0 である。
* 合成変量の分散 Var( Zi ) は,Var( Z1 ) ≧ Var( Z2 ) ≧ … ≧ Var( Zm ) である。
とありますが,f1'とf2'もこの条件を満たしていないでしょうか。
No.03271 Re: 主成分分析における固有値の意味 【青木繁伸】 2007/04/26(Thu) 10:41
x1:x2軸上でデータの変動を考えると,点線で描いた各軸への垂線の足までの長さ(座標値)の二乗和は原点からデータまでの長さの二乗に等しい(ピタゴラスの定理)。
f1: f2軸上では,原点から d1, d2 までの距離の二乗和は原点からデータまでの長さの二乗に等しい。d1 を最大にすれば,d2は最小になる。そう言う意味で f1 軸上での二乗和(d1の二乗和)が最大になるのは,確率楕円の長軸になるとき。そのときf2軸上での二乗和は最小になる。
3次元以上の場合も同様。
言葉で書くとわかりにくいかな。
No.03272 Re: 主成分分析における固有値の意味 【iwamoto】 2007/04/26(Thu) 11:35
早速の対応,ありがとうございます。
たいへんよくわかりました。
> Var(f1) が すべての可能な軸に対する分散,Var(fk) where k!=1 より大きくなる根拠が良く理解できていません。
f1上で分散 Var(f1) が最大になる事は理解できました。
最後の質問です。
曖昧で同じ質問の繰り返しのようにも聞こえますが,もう一度だけ質問させてください。
Var(f1)+Var(f2)=Var(f1')+Var(f2') のようなケースは起こりえないのでしょうか?
例えば,f1:λ1=5,f2:λ2=1で分散の和を6(最大)だとした場合,f1':λ1=4,f2':λ2=2と言う軸のペアはあり得ないと言う事でしょうか。
何度もすみません。
No.03273 Re: 主成分分析における固有値の意味 【青木繁伸】 2007/04/26(Thu) 11:52
直交するどのような軸を考えても,二つの軸(変数)での分散の和は元の軸での分散の和に変わりないわけです。
そのような座標軸のうち,一つの軸での分散が最も大きいというのは一つしかなく,それが楕円の長軸。直交する軸での分散は最小になり,それは楕円の短軸であるということ。
そして,固有値は長軸方向(第一主成分)での分散と短軸方向(第二主成分)での分散になっているということです。
● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る