No.01341 多変量解析における観測数について  【波音】 2006/10/17(Tue) 00:08

多変量解析を行う際に必要となる観測数はどのようにして決めているのでしょうか。

例えば,因子分析は変数の10倍以上の観測数が望ましい,というのは経験的に分かっていることなのですか?

数学的というか,計算上の問題で変数の数より観測数のほうが少ないと計算できない場合もありますが(重回帰分析など),かといって,変数の数より1つだけ観測数が多いというのは計算できても信頼できるものであるかは謎ですよね。

比率や平均値に関する検定などのサンプルサイズについて書かれている本はいくつか見かけますが,多変量解析の本の中でも必要な観測数について解説されているものは見たことがないのですが。。。

No.01345 Re: 多変量解析における観測数について  【にゃんちゅう】 2006/10/17(Tue) 15:41

多変量解析の場合,何を基準としてサンプルサイズを決めるかという問題がまずあります。基準が分散分析やt検定のように1つではないのです。それ故に絶対的な基準はありません。

因 子分析についてはいろんなことがいわれていますが,変数の数との関係は昔よくいわれていたことですが,いいかげんです。1つの因子に多くの変数が負荷して いる場合は少ないサンプルサイズでいいことになることがある理論では分かっています。また,相関係数は100サンプルでは安定しないことも知られていま す。10変数だからといって100サンプルでは問題があります。ただし,構造がきわめて安定していれば100サンプルでもいいのです。

そういうことを考えながらサンプルサイズを考えると200〜500程度は必要です。最尤法を使う場合は多い方が望ましい。1000という人もいます。

重回帰分析も基準によって違っていて最近もサンプルサイズに関する論文がでています。
例えば,
Sample Size Tables for Correlation Analysis with Applications in Partial Correlation and Multiple Regression Analysis.
By Algina, James; Olejnik, Stephen
Multivariate Behavioral Research. 38(3), Jul 2003, 309-323.
はプログラムが
http://plaza.ufl.edu/algina/index.programs.html
にあります。

また,こんな論文もあります。
Sample Size for Multiple Regression: Obtaining Regression Coefficients That Are Accurate, Not Simply Significant.
By Kelley, Ken; Maxwell, Scott E.
Psychological Methods. 8(3), Sep 2003, 305-321.

共分散構造分析についてはSugihara らの有名なプログラムがありますが,これが絶対的というわけではありません。
Power analysis and determination of sample size for covariance structure modeling.
By MacCallum, Robert C.; Browne, Michael W.; Sugawara, Hazuki M.
Psychological Methods. 1(2), Jun 1996, 130-149

いまのところ自分で(英語)論文を探すのがいいでしょう。

No.01346 Re: 多変量解析における観測数について  【波音】 2006/10/17(Tue) 17:10

回答ありがとうございます。

なるほど,多変量解析については「これだけ必要」という絶対的な基準がない(まだ定まっていない)のですね。だから,観測数に関する話が出ていても「〜程度,場合によってはもっと必要かもしれない」などという濁した言い方をされていたわけですか。

私は英語が達者ではない(というか苦手)のですが,少し論文を探してみることにします。

● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る