No.12302 変則的なデータでの分散分析の可否  【くすのき】 2010/03/22(Mon) 17:17

くすのきと申します。

このデータで分散分析をして問題がないか教えてください。

例えば,ある小学校があり,各学年は3クラスから成り立ってます。
それぞれのクラスは,ある特定の根拠に基づいてクラスわけされています。
ただし,3年生だけはクラスわけされておらず,1クラスでなりたっています。
各クラスの構成人数は同数とします。

このような状態で一斉に行ったテストの結果があるとして,学年による差異と,クラスの基準の効果を評価したいとします。

例えば,実際に行ったテストのクラスごとの平均点は以下のようになったとします。
           1年  2年 3年 4年  5年  6年
Aクラス 5 6 8 9 10
Bクラス 1 4 7 10 13 16
Cクラス 3 3 10 10 14
このようなデータの場合,「仮に3年が3クラスだったと仮定して」分散分析を行ってもよいものでしょうか?

すなわち,3年A組,B組,C組にまったく同じデータを割り振って分散分析を行うということです。3年のデータが同じになるので,クラスわけの主効果が小さくなるかもしれませんが,どちらかといえば,学年の効果が見たいので,そこは目をつむれます。

あるいは,いったん3年生だけを除いたデータで分散分析を行い,もし,クラスの主効果がなければ,各学年の3クラスをひとまとめにして,学年の効果だけを見る,というやり方のほうがよいでしょうか。

ご意見をお聞かせ願えれば幸いです。どうぞよろしくお願いいたします。

No.12305 Re: 変則的なデータでの分散分析の可否  【青木繁伸】 2010/03/23(Tue) 10:47

> 3年が3クラスだったと仮定して

ということはできないでしょう。

> どちらかといえば,学年の効果が見たいので

クラス編成はランダムでしょう?だったら,クラスはプールして,学年について一元配置分散分析をすればよろしいのではないかと思います。

No.12306 Re: 変則的なデータでの分散分析の可否  【くすのき】 2010/03/23(Tue) 11:05

青木先生,ご回答ありがとうございます。
(表の修正もしていただいたようで,ありがとうございました)

>クラス編成はランダムでしょう?

いえ「それぞれのクラスは,ある特定の根拠に基づいてクラスわけされています。」ということになっております。

実は,学校の話を持ち出したのは,わかりやすくするためのたとえのつもりだったのですが,先行知識があるようなたとえだと,逆にわかりにくいかもしれません。

あらためてたとえ直してみますが,

a3 b3 c3 d3 e3 ←アルファベットのみ変化
a1 b2 c3 d4 e5 ←アルファベット数字の両方が変化
c1 c2 c3 c4 c5 ←数字のみ変化

のようなデータだとお考えください。

例えば,各組み合わせに対しての好感度調査をするとします。
(組み合わせパターンは上述以外はないと考えてください)

この場合,どの列にもc3ができてしまいます。
好感度調査なので,なんどもやるのは変です。
なので,c3は1回だけになってしまいますが,3回やったと仮定して,分散分析をしてもよいでしょうか?

No.12307 Re: 変則的なデータでの分散分析の可否  【青木繁伸】 2010/03/23(Tue) 11:28

> 3回やったと仮定して

「仮定する」ということと,「データの水増し」が同じことになる でしょう。データがないのにあるとすること,あるいは,「じゃあ3分割して使えばよいのか?」ということになっても,「サンプルサイズ」は統計処理で重要 な意味を持っているので単に3倍したり1/3にしたりということはできないんですよ。

> あらためてたとえ直してみますが,

変なたとえをすると話が混乱するというのは,過去にあまたの例があります。
新たなたとえも,どういう意味なのか分からないですね。

2要因を独立変数として,重回帰分析を行えばよいのでは?

No.12309 Re: 変則的なデータでの分散分析の可否  【くすのき】 2010/03/23(Tue) 11:51

ありがとうございました。

うまく例えられなくて,話を混乱させてしまって申し訳ありません。

仮定をする=水増しというのは確かにその通りです。
しかし,2要因のままで分析する方法はないだろうかと思い,そういうことが可能かどうか,教えていただきたく思った次第です。
明確に否定していただいたので,すっきりいたしました。

なお,重回帰分析にはちょっとなじまないデータなのです。
元データの情報を出せたらわかりやすいのでしょうが,それ自体の説明がややこしいので・・・。

とりあえず,共通するデータ(c3に相当)を省いて,2要因(3×4)で分散分析をしたところ,3水準の要因の主効果はなかったので,3水準のほうはまとめてしまって,一元配置分散分析をしたいと思います。

次回,質問をさせていただくときには,もっとわかりやすい表現をするように気をつけます。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る