No.00405 第一主成分と標準化変量の足し算の違い  【リーチ】 2006/06/20(Tue) 21:09

お邪魔します。
統計学,多変量解析などを独学している社会人です。
以前こちらで質問させていただき,貴重な回答をありがとうございました。

この度は標準化変量の足し算を考えている時にふと疑問に思い,悩んでも解決できなかったので質問させていただきました。
3種類の変数で主成分分析を行い,第一主成分の固有ベクトルの符号が全て+で寄与率が十分に高く,かつ第一主成分が総合力を表すと考えられる場合なのですが,
この3種類の変数を標準化して,3つを合計すれば,その絶対値の大きさで主成分得点のような比較ができてしまうのではないかと思い,主成分分析との違いがわからなくなってしまいました。
数学的には全く異なるものだと思いますが,上記の場合,標準化変量の合計値で主成分得点の代わりができるものなのでしょうか?

No.00407 Re: 第一主成分と標準化変量の足し算の違い  【青木繁伸】 06/06/20(Tue) 23:15

> 標準化変量の合計値で主成分得点の代わりができるものなのでしょうか

そのような状況下では,おっしゃるとおりではないでしょうか。
二つの方法で算出した数値の相関係数を計算してみるのも一興でしょう。

おっしゃるような総合指標の算出を理論化したものが主成分分析だと思います。

No.00408 Re: 第一主成分と標準化変量の足し算の違い  【リーチ】 06/06/21(Wed) 00:21

早速の回答をありがとうございます。

このような状況下では,やはりそうですか。少しショックです。
以前にこのような状況下で,大げさにも主成分分析を用いて発表したものですから。。。
でも,主成分分析を行うまで,固有ベクトルの符号が+かどうかわからないですよね。
そういう意味で主成分分析を行う一定の意義があるように捉えることにします。

No.00409 Re: 第一主成分と標準化変量の足し算の違い  【青木繁伸】 06/06/21(Wed) 08:12

> 主成分分析を行うまで,固有ベクトルの符号が+かどうかわからないですよね

そういうことはないでしょう。
相関係数行列の要素が全て正(負のものがあっても,絶対値は小さい)というような場合,主成分得点係数は正のものが大多数ということは分かるはずですが。

No.00410 Re: 第一主成分と標準化変量の足し算の違い  【青木繁伸】 06/06/21(Wed) 08:30

以下のようなシミュレーションプログラムを何回か実行してみればよく分かりますね。
なお,主成分得点係数(主成分負荷量)が全部マイナスになることがありますが,これは問題ないですね。
> r <- matrix(runif(9),3) # 3×3の相関係数行列を作る
> r[upper.tri(r)] <- r[lower.tri(r)]
> diag(r) <- 1
> x <- gendat(100, r) # 相関係数行列を再現するデータ行列を作る
> cor(x) # 相関係数行列
[,1] [,2] [,3]
[1,] 1.00000000 0.01495934 0.4998427
[2,] 0.01495934 1.00000000 0.8351601
[3,] 0.49984268 0.83516014 1.0000000
> ans <- princomp(x) # 主成分分析を行う
> ans$loadings # 主成分負荷量

Loadings:
Comp.1 Comp.2 Comp.3
[1,] 0.369 0.858 0.357
[2,] 0.606 -0.513 0.607
[3,] 0.705 -0.709

Comp.1 Comp.2 Comp.3
SS loadings 1.000 1.000 1.000
Proportion Var 0.333 0.333 0.333
Cumulative Var 0.333 0.667 1.000
> cor(ans$scores[,1], apply(x, 1, sum)) # 第1主成分得点と3変数の合計値の相関係数
[1] 0.9899063

● 「統計学関連なんでもあり」の過去ログ--- 038 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る