★ 因子分析の適合度について ★

5010. 因子分析の適合度について 白井 2004/11/21 (日) 17:47
├5033. Re: 因子分析の適合度について にゃんちゅう 2004/11/22 (月) 17:07
│└5041. Re^2: 因子分析の適合度について 白井 2004/11/23 (火) 13:10
│ └5043. Re^3: 因子分析の適合度について 青木繁伸 2004/11/23 (火) 13:47
│  └5044. Re^4: 因子分析の適合度について 白井 2004/11/23 (火) 22:07
└5011. Re: 因子分析の適合度について 若輩者 2004/11/21 (日) 17:58
 └5030. Re^2: 因子分析の適合度について 白井 2004/11/22 (月) 10:52
  └5031. Re^3: 因子分析の適合度について 若輩者 2004/11/22 (月) 11:32
   └5036. Re^4: 因子分析の適合度について 白井 2004/11/22 (月) 23:45
    ├5038. Re^5: 因子分析の適合度について 若輩者 2004/11/23 (火) 00:52
    │└5045. Re^6: 因子分析の適合度について 白井 2004/11/23 (火) 22:14
    │ └5047. Re^7: 因子分析の適合度について 若輩者 2004/11/24 (水) 00:23
    │  └5063. Re^8: 因子分析の適合度について 白井 2004/11/24 (水) 22:38
    └5037. Re^5: 因子分析の適合度について にゃんちゅう 2004/11/23 (火) 00:02
     └5046. Re^6: 因子分析の適合度について 白井 2004/11/23 (火) 22:22


5010. 因子分析の適合度について 白井  2004/11/21 (日) 17:47
学習動機の因子分析を試みています。抽出法,回転ともにいくつかの方法で試みたのですが,いずれの場合にも適合度検定における有意確率は0.00でした。その後の処理の仕方についてお聞きします。
1.その場合,χ2乗値÷自由度の値がせめて3未満であれば許容度の範囲内であると聞きましたが,3を超えてはやはりまずいのでしょうか。
2. 探索的因子分解においては,因子数は2つ(固有値1以上)となるのですが,適合度検定におけるχ2乗値÷自由度を計算するとかなり高い数字になり,固有値 がどんどん1を下回っても,因子数を増やしていくとだんだん2に近い数字になります。私としては解釈可能性から因子数を3にしたいのですが,それでは値が 4以上になってします。そういうものなのでしょうか。どこを基準にして決定していけばよいのか教えてください。個々の項目は記述統計,因子分析における過 程ですでにいくつか除外した上で行っています。
3.過去ログでこの件に関するものはないかとかなりさかのぼって探したのですが,見つけられません でした。SPSSの本にもあまり詳しくは載っていませんでした。それで,ものすごい勝手な解釈なのですが,これは分析をする上で大して重要なことではない とか...なんてことはありませんよね?

すみません,長くなりましたがよろしくお願いいたします。

     [このページのトップへ]


5033. Re: 因子分析の適合度について にゃんちゅう  2004/11/22 (月) 17:07
>いずれの場合にも適合度検定における有意確率は0.00でした。その後の処理の仕方についてお聞きします。

適合度は因子数の変更だけが関係します.
また,サンプルサイズが大きい場合は適合度を使用しません.

> 2.探索的因子分解においては,因子数は2つ(固有値1以上)と

固有値1以上の基準は因子数を多く推測することが多いのでそれなら2か1のどちらかがいいでしょう.

因子間相関がかなり高いなら少なめに見積もっていることもあります.
http://www.ec.kagawa-u.ac.jp/~hori/spss/spss.html#nfactors
で一度チェックを入れてみてはどうですか.

     [このページのトップへ]


5041. Re^2: 因子分析の適合度について 白井  2004/11/23 (火) 13:10
お答えありがとうございます。

> 適合度は因子数の変更だけが関係します.
> また,サンプルサイズが大きい場合は適合度を使用しません.

ということは,サンプルサイズが大きい場合は,何を使用するという意味でしょうか。はじめにお聞きした,χ2乗値/自由度の値についてはいかがでしょうか。

> 因子間相関がかなり高いなら少なめに見積もっていることもあります.

因子間相関は,かなり高いと思います。(.760)

> http://www.ec.kagawa-.ac.jp/~hori/spss/spss.html#nfactors
> で一度チェックを入れてみてはどうですか.

すみません,こちらの,どこを見たらよいのかよくわからないのですが,教えていただけますか。

     [このページのトップへ]


5043. Re^3: 因子分析の適合度について 青木繁伸  2004/11/23 (火) 13:47
> > http://www.ec.kagawa-.ac.jp/〜hori/spss/spss.html#nfactors
> > で一度チェックを入れてみてはどうですか.
>
> すみません,こちらの,どこを見たらよいのかよくわからないのですが,教えていただけますか。

u が抜けているのですが,推測は容易。
http://www.ec.kagawa-u.ac.jp/%7ehori/spss/spss.html
の「因子分析の因子数決定法 script」でしょうね。
#nfactors が,ここを指しています。この掲示板は#以降をURLの一部と見ないので,そこへジャンプできませんが,お使いのブラウザで,url 入力欄に付加してやれば良いと思います。

     [このページのトップへ]


5044. Re^4: 因子分析の適合度について 白井  2004/11/23 (火) 22:07
ありがとうございました。早速やってみましたところ,PA SMCで,4因子,他ので1から2とでました。ですので,やはり,3か4因子で行いたいのですが,適合度の問題は解決しません。

つ いでに,おなじサイトにありました,カイ2乗値以外の適合度指標のスクリプトをダウンロードしました。サンプル数が多い場合,カイ2乗値はあまりうまくい かないということでしたので,他のも見たいと思ったので。ところが,ダウンロードは確かにされているし,指示通りにやったつもりなのですが,出力されませ ん。今までのFAの出力表を開き,実行させると,説明にあるように,一番下の出力表から順に上に移動しながら実行されているような状態になるのですが,そ れが終わってもどこにも新しい適合度指標は見当たらないのです。どこかやり方が間違っているのでしょうか。

よろしくお願いします。


     [このページのトップへ]


5011. Re: 因子分析の適合度について 若輩者  2004/11/21 (日) 17:58
> 適合度検定における有意確率は0.00でした。

分析に使っているデータ件数(サンプル数)はどのくらいでしょうか.

     [このページのトップへ]


5030. Re^2: 因子分析の適合度について 白井  2004/11/22 (月) 10:52
> > 適合度検定における有意確率は0.00でした。
>
> 分析に使っているデータ件数(サンプル数)はどのくらいでしょうか.

ご 返答ありがとうございます。サンプル数は全部で470人ですが,学年が高校1年,中学3年,中学2年と3学年にまたがっており,内訳は70人,200人, 200人です。全部でやったり,3つ,2つに分けてやったりいろいろしているのですが,一番小さいグループはどれでやっても有意でなく,最もデータを出し たいあとの2つ,つまり中学生のグループでは,有意になってしまいます。

いかがでしょうか。

     [このページのトップへ]


5031. Re^3: 因子分析の適合度について 若輩者  2004/11/22 (月) 11:32
たかだかn=200でも有意だと,やはりあまり上手くいってないんでしょうね.

> 個々の項目は記述統計,因子分析における過程ですでにいくつか除外した上で行っています。

どういう基準で変数選択したのか分かりませんが,関心のあるデータセットで,予想される因子数を指定したときの因子負荷行列を見て,共通性の低いもの,あるいは単純構造を示さない項目を,1つずつ外しながら試してみるといったところでしょうか.

ちなみに,項目数はいくつでしょう.

関心のあるデータセット,因子数のとき,累積寄与率はどのくらいですか.

     [このページのトップへ]


5036. Re^4: 因子分析の適合度について 白井  2004/11/22 (月) 23:45
> たかだかn=200でも有意だと,やはりあまり上手くいってないんでしょうね.

それは,200という 数は因子分析をするには多すぎるということですか?統計初心者の私は,統計分析をするには何にしても数は多ければ多いほどいいと思っていたのですが... しかも,中2,中3の差は記述統計においてあまり差がないので,できれば一緒にして,つまりサンプル数400で行いたいと考えているのですが。

> どういう基準で変数選択したのか分かりませんが,関心のあるデータセットで,予想される因子数を指定したときの因子負荷行列を見て,共通性の低いもの,あるいは単純構造を示さない項目を,1つずつ外しながら試してみるといったところでしょうか.

記述統計で,フロア効果の見られるもの2つをそのまま入れたり,除いたりしましたが,現在のところは除いて行っています。また,共通性が0.22というものを,これも入れたり,除外したりしながら,今のところ,除いてやる方向です。
>
> ちなみに,項目数はいくつでしょう.

17項目です。
>
> 関心のあるデータセット,因子数のとき,累積寄与率はどのくらいですか.

400名で,因子数4ですと,最尤法,バリマックス回転で,63.8%です。EFAでやると因子数は2つになってしまうので,4つにすると固有値がかなり低くなるのですが。

それから,本当は回転は斜交回転にしたいのですが,出力表に回転後の寄与率が出ないため,どうお答えしたらわからないのですが,抽出後の負荷量平方和における分散の累積%は,63.5%でした。

何度もすみませんが,よろしくお願いします。


     [このページのトップへ]


5038. Re^5: 因子分析の適合度について 若輩者  2004/11/23 (火) 00:52
> 200という数は因子分析をするには多すぎるということですか?

因子分析をするには多くて構いません.カイ二乗値を評価する場合,あまりサンプル数が多いと,役に立たない(なんでも有意になってしまう)という意味です.

しかし,伺った範囲だと,やっぱり上手く当てはまってないんでしょうね.その17項目のなかで,ある程度共通している因子は2つだけで,だけど,それだけではあまり十分に説明できていない.そのまんまですね....

その2つの因子に対する負荷の大きい項目の他は,それぞれ他の項目との相関がそもそも低いんじゃないでしょうか.だとすると,項目を減らしても,2因子だけでの当てはまりはマシに見える結果を出せても,そこまでですね.

もし,17項目自体は,たとえば4因子くらいに上手くまとまるはずだということでしたら,
データセットの群分けを検討することになりますね.関心のある項目群について考えるためには,単純に「中学生」でデータを切るのではなくて,たとえば男女別に見るべきというような,何か,別のデータの切り方がなされるべきということかも知れません.

     [このページのトップへ]


5045. Re^6: 因子分析の適合度について 白井  2004/11/23 (火) 22:14
何度もすみません,ありがとうございます。

> データセットの群分けを検討することになりますね.関心のある項目群について考えるためには,単純に「中学生」でデータを切るのではなくて,たとえば男女別に見るべきというような,何か,別のデータの切り方がなされるべきということかも知れません.

学 年を分けるのはやっていますが,今のところ,男女はやっていません。男女差を見ることを目的としていないからなのですが,やってみてそのほうが当てはまり がよければ考えたいと思います。でもそれでもだめな場合,どう考えればよいのか...このデータは使えないということもあるのでしょうか。

     [このページのトップへ]


5047. Re^7: 因子分析の適合度について 若輩者  2004/11/24 (水) 00:23
> でもそれでもだめな場合,どう考えればよいのか...このデータは使えないということもあるのでしょうか。

もしデータ自体は信頼できるものであり,データの処理にも問題がないのであれば,適合が悪い事実とともに結果を報告するしかないでしょう.

ただ,それにしても,どうして満足な結果が得られないのか,その理由は考察すべきでしょう.

     [このページのトップへ]


5063. Re^8: 因子分析の適合度について 白井  2004/11/24 (水) 22:38
ありがとうございました。

もう少しいろいろ考えて見たいと思います。

     [このページのトップへ]


5037. Re^5: 因子分析の適合度について にゃんちゅう  2004/11/23 (火) 00:02

> それは,200という数は因子分析をするには多すぎるということですか?

少ないとは言えない数であることは確かです.いろんな考え方がありますが望ましい数です.

統計初心者の私は,統計分析をするには何にしても数は多ければ多いほどいいと思っていたのですが.

分散分析やχ2検定は多すぎるのは望ましくありません.因子分析で最尤法をやる場合1000以上という考えもあります.500以上なら文句はないと言えます.それに近い数ですからいいでしょう.


> > どういう基準で変数選択したのか分かりませんが,関心のあるデータセットで,予想される因子数を指定したときの因子負荷行列を見て,共通性の低いもの,あるいは単純構造を示さない項目を,1つずつ外しながら試してみるといったところでしょうか.

これは不適切なコメントです.とりあえずは無視した方がいい.因子数を決定した後に変数の削除はあります.そのときはあらためて因子数を決定します.

> 400名で,因子数4ですと,最尤法,バリマックス回転で,63.8%です。EFAでやると因子数は2つになってしまうので,4つにすると固有値がかなり低くなるのですが。

斜交回転したほうがいいでしょう,
>
> それから,本当は回転は斜交回転にしたいのですが,出力表に回転後の寄与率が出ないため,どうお答えしたらわからないのですが,抽出後の負荷量平方和における分散の累積%は,63.5%でした。

これは初期解のことを言っているのですか? 斜交回転後は寄与率についてあまり考えないほうがいいです.そうでなく,いくつの項目に負荷しているかなどを検討します.

なお,真の意味で初心者なら分析するのは危険です.本を読みましょう.
>
> 何度もすみませんが,よろしくお願いします。

     [このページのトップへ]


5046. Re^6: 因子分析の適合度について 白井  2004/11/23 (火) 22:22
ありがとうございます。

> > それから,本当は回転は斜交回転にしたいのですが,出力表に回転後の寄与率が出ないため,どうお答えしたらわからないのですが,抽出後の負荷量平方和における分散の累積%は,63.5%でした。
>
> これは初期解のことを言っているのですか? 斜交回転後は寄与率についてあまり考えないほうがいいです.そうでなく,いくつの項目に負荷しているかなどを検討します.

おっしゃるとおり,私も斜交回転で考えるつもりでおります。ただ,他のところでも申し上げたのですが,適合度をどうしたらよいのか,どう考えたらよいのかそれがわかりません。しつこくてすみません。
>
> > 何度もすみませんが,よろしくお願いします。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 031 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る