★ 例数が大きく異なる場合の二元配置分散分析 ★

1575. 例数が大きく異なる場合の二元配置分散分析 みや 2004/01/03 (土) 10:07
└1576. Re: 例数が大きく異なる場合の二元配置分散分析 青木繁伸 2004/01/03 (土) 10:19
 └1577. Re^2: 例数が大きく異なる場合の二元配置分散分析 みや 2004/01/03 (土) 10:34
  └1578. Re^3: 例数が大きく異なる場合の二元配置分散分析 青木繁伸 2004/01/03 (土) 12:26
   └1579. Re^4: 例数が大きく異なる場合の二元配置分散分析 みや 2004/01/03 (土) 12:36


1575. 例数が大きく異なる場合の二元配置分散分析 みや  2004/01/03 (土) 10:07
初歩的な質問で恐縮ですが,二元配置の分散分析で,各水準の組み合わせにおける例数が大きく異なる(最小が25,最大が180)といった場合でも,GLMのタイプIIIなどを用いれば,検定値に大きな歪みは生じないのでしょうか。
ランダムサンプリングにより例数を揃えることも考えたのですが,その是非もよく分かりません。
過去の記事も検索させていただいたのですが,私の理解力不足により,よく把握できません。
ちなみにソフトはSPSSを使用しています。
もしよろしければご教示ください。

     [このページのトップへ]


1576. Re: 例数が大きく異なる場合の二元配置分散分析 青木繁伸  2004/01/03 (土) 10:19
「検定にゆがみが生じる」というのは意味不明ですが。

「多い水準のデータを捨てる」などというのは,統計学の上から見るともってのほかでしょう。

そもそも,実験計画においては,各水準のデータ数はよく管理されるはずです。

ただ,調査データなどで,事前に各水準のデータ数を制御できない(事後に決まる)場合には,データ数のアンバランスは起きて当然。

     [このページのトップへ]


1577. Re^2: 例数が大きく異なる場合の二元配置分散分析 みや  2004/01/03 (土) 10:34
ご回答どうもありがとうございました。
「検定値に歪みが生じる」という表現は不適切でした。
F比が不当に大きくなるのでは‥ということです。
ちなみに調査データなのですが,あまり気にせず全データを用いればよいということなのでしょうか。
よろしければ,再度ご教示くださいm(__)m

     [このページのトップへ]


1578. Re^3: 例数が大きく異なる場合の二元配置分散分析 青木繁伸  2004/01/03 (土) 12:26
全体の例数が同じなら,各水準均等に割り当てる場合にもっとも検出力が高くなるということです。

調査データなら,そのようにできないが,データを捨てると検出力は下がるということ。

過去ログ
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc014/248.html
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc014/133.html
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc002/013.html
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc013/236.html

     [このページのトップへ]


1579. Re^4: 例数が大きく異なる場合の二元配置分散分析 みや  2004/01/03 (土) 12:36
ご丁寧にどうもありがとうございました。
過去ログも参照してみます。
本当にありがとうございました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 027 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る