★ 主成分分析,重回帰分析のデータ数について ★

 190 主成分分析,重回帰分析のデータ数について  MH  1999/10/22 (金) 10:13
  194 Re: 主成分分析,重回帰分析のデータ数について  堀 啓造  1999/10/23 (土) 07:19
   198 Re^2: 主成分分析,重回帰分析のデータ数について  MH  1999/10/24 (日) 13:54
    199 Re^3: 主成分分析,重回帰分析のデータ数について  堀 啓造  1999/10/24 (日) 14:46


190. 主成分分析,重回帰分析のデータ数について  MH  1999/10/22 (金) 10:13
多変量解析の勉強をしている学生です。
主成分分析や重回帰分析の際,変量よりもデータ数(観測数)が大きくなければならないという考え方がある。正しいかどうか。

この問題について自分なりに考えているのですが,よくわかりません。列の数に限らず行の数でランクが決まってしまうということを昔ならった気がするのですが,それに関連することなのでしょうか?

     [このページのトップへ]


194. Re: 主成分分析,重回帰分析のデータ数について  堀 啓造  1999/10/23 (土) 07:19
重回帰分析についてはどのようなことが言われているか知りません。主成分分析とは同じ問題ではないはずです。

主成分分析に関しては,逆行列を求めるわけではないので,上記のタイプの制約はありません。また,因子分析の場合も,SMCを求める必要性はなくなっているので,逆行列の制約はかかりません。

主成分分析は相関行列から出発するとすると,因子分析と同じものと考えていいでしょう。因子分析・主成分分析のサンプル数問題はシミュレーション実験で行われています。
ただし,主成分分析だと,不適解が生じないというメリットがあるので,因子分析よりは問題が少ない。

次のところでコメント・リンクしています。
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc002/275.html#277

     [このページのトップへ]


198. Re^2: 主成分分析,重回帰分析のデータ数について  MH  1999/10/24 (日) 13:54
早速のお返事ありがとうございます。

ご指摘頂いたリンクの中に,

「相関係数の信頼区間からして,サンプル数は200程度はほしい。Kline(1994,p73)に
よると,明確な因子構造をもっている場合は100でもいい。50以下は考えられない」という内容のものもありましたが,変数よりもサンプルの数が多ければ良いというような単純なものではないのですね。そうなると,サンプルが50以下で因子分析をするのはナンセンスなんでしょうか?

それから,重回帰分析の場合は,全く別の問題になるということですが,サンプル数が幾つ以上ないと有効でないというような定説はあるのかご存知でしたら教えてください。

     [このページのトップへ]


199. Re^3: 主成分分析,重回帰分析のデータ数について  堀 啓造  1999/10/24 (日) 14:46
> 50以下は考えられない」という内容のものもありましたが,変数よりもサンプルの数が多ければ良いというような単純なものではないのですね。そうなると,サンプルが50以下で因子分析をするのはナンセンスなんでしょうか?

もし,学会に投稿するならそうでしょうね。テキストの例題や練習でする分にはべつにいいのでは。

また,心理データのような安定しないものではなく,地質学や生態学などでもともと信頼性の高いデータの場合はサンプル数が少なくてもいいかもしれないけど,そういう分野の問題としてやるほうがいいでしょう。

ま,シミュレーション研究はあくまでシミュレーションの設定が問題ですから。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 003 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る