★ 因子分析の手法選択 ★

 78 因子分析の手法選択  ランチ  2001/03/09 (金) 11:26
  80 Re: 因子分析の手法選択  ディナー  2001/03/09 (金) 20:40
   82 Re^2: 因子分析の手法選択  中原  2001/03/09 (金) 22:45
    83 Re^3: 因子分析の手法選択  ディナー  2001/03/10 (土) 08:43
     85 Re^4: 因子分析の手法選択  中原  2001/03/10 (土) 23:08
      88 Re^5: 因子分析の手法選択  ディナー  2001/03/12 (月) 07:18


78. 因子分析の手法選択  ランチ  2001/03/09 (金) 11:26
アドバイス下さい。

因子分析を行うときに,手法を選択しますよね。
当然ながら,分析にかける前のデータは問題ないものです。
主因子解で解いて,固有値1.0以上で軸を抽出した結果,累積寄与率は32%。
主成分解で解いて,固有値1.0以上で軸を抽出した結果,先と同じ軸数で累積寄与率が51%。

それでは,どっちの結果を使うべきか?
分析目的によるという・・・・お話になると思いますが,32%の主因子解の結果を用いるのはまずいですかね。累積寄与率は50%以上ないと・・・・ってお話がよく書いてあったりしますが。
恐らく,主成分解の方が,共通性の推定を「1」と置くので,累積寄与率は高めに出る傾向があると思うのですが・・・・。

     [このページのトップへ]


80. Re: 因子分析の手法選択  ディナー  2001/03/09 (金) 20:40
> それでは,どっちの結果を使うべきか?
> 分析目的によるという・・・・お話になると思いますが,32%の主因子解の結果を用いるのはまずいですかね。

いいえ,因子数の判断が同じなら,主因子解を使うべきです.
第一に,主成分分析ではなく因子分析をしているのですから.
第二に,因子推定法としての統計的性質の良さは,主成分解<主因子解<最尤解,だから.

>累積寄与率は50%以上ないと・・・・ってお話がよく書いてあったりしますが。

そんな,きまりは,ありません.

> 恐らく,主成分解の方が,共通性の推定を「1」と置くので,累積寄与率は高めに出る傾向があると思うのですが・・・・。

主因子解でも「1」を初期値にすることがあります.収束すればいいのです.

また,3変数1因子では,主成分解の寄与率の方が低くなります.

     [このページのトップへ]


82. Re^2: 因子分析の手法選択  中原  2001/03/09 (金) 22:45
> >累積寄与率は50%以上ないと・・・・ってお話がよく書いてあったりしますが。
>
> そんな,きまりは,ありません.

決まりはないけど,それくらいの累積寄与率のデータではなにが言えるんでしょうかね。
SPSSでは何か基準値が計算されると思いますが,そちらはどうでしょうかね。

     [このページのトップへ]


83. Re^3: 因子分析の手法選択  ディナー  2001/03/10 (土) 08:43
>> そんな,きまりは,ありません.
>
>決まりはないけど,それくらいの累積寄与率のデータではなにが言えるんでしょうかね。

数値例がいいでしょうか?.
国語 1   
外語 .34 1  
社会 .31 .25  
計算 .19 .25 .16  
代数 .33 .22 .19 .40 
図形 .30 .23 .18 .27 .36 1  
この主因子解の2因子累積寄与率は33%です.これくらいの累積寄与率のデータで「なにが言えるか」というと,文系因子と理系因子がある,というようなことが言える.というようなことを因子分析では言います.また残差はほとんど0で,この相関行列を2因子がよく説明しており,カイ2乗検定でもモデルが受容される,というようなことが言えます(n=200).
この主成分解の2因子累積寄与率は55%です.

こういう状況は,ランチさんの分析している相関行列の要素が,おしなべて小さ目であることを示しているのです.累積寄与率が大きくなるのは,元の相関行列の要素が大きいときです.そういうときは因子に分解するのではなく,主成分を合成するのもいいでしょう.

     [このページのトップへ]


85. Re^4: 因子分析の手法選択  中原  2001/03/10 (土) 23:08
この例だと,初期固有値は大きいものから順に,2.334,0.98 ですね。ここまでで累積パーセントは55.3%くらいです。第2因子小さいですね。よく,固有値が1以上であることなどという基準がありますが,ぎりぎりです。

共通性の反復推定が終わった後ではもう少し悲惨になって,負荷量の二乗和は1.70と0.33になってしまう。第二因子はごみ同然です(^_^;)。

バリマックス回転すると,それが平均化され,1.053 と 0.975 になります。
共通性も低いものがあります。0.223,0.269,0.272 ですが,それ以外のもの 0.307,0.436,0.520 と,決してたかいものではありません。
一応,おっしゃるように第一因子は「国語・外語・社会」の因子負荷量が高く,第二因子は「計算・代数・図形」の因子負荷量が高いですが,あまりいいデータ(例)ではないように思います。

確かに相関係数行列の中に低い相関係数が多いときには累積寄与率が低いことになるのはそうでしょう。そして,そのようなときには,分析に使用する変数相互間の関係が弱いと言うことであって,それはそれぞれの変数が影響を受けている潜在因子があったとしても,その影響が弱いと言うことでしょう。

     [このページのトップへ]


88. Re^5: 因子分析の手法選択  ディナー  2001/03/12 (月) 07:18
同じデータ・同じ因子数で累積寄与率が「主成分解(50%)>主因子解(30%)」だから,主成分解を採用すべきだと判断する因子分析的根拠はありません.主成分分析は寄与率を大きくするように計算するのが目標なのです.因子分析は相関行列を因子分析モデルで説明するのが計算目標なのです.因子分析を目標としている時に,主成分分析の判断基準は使いません.
ガットマンルールは1つのよい目安ですが,目安であって,「0.98」だから「1」に満たないと判断する程,厳密に考えなくてもよいのです.2因子目はゴミとはいえません.数値例はランチさんのデータ状況を再現するための架空例ですが,1因子モデルは棄却され,2因子モデルが適合します(n=220).共通性が低いことは,この相関行列が独自因子によって説明される割合が大きいと解釈するのです.また,寄与率の大小と,因子分析モデルがデータとよく適合しているかという統計学的判定とは別のことです.因子は相関(共分散)を説明するのが目標であって,観測変数の分散を説明しようとするものではありません.

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 013 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る