★ 繰り返しのある二元配置の分散分析表 ★

8470. 繰り返しのある二元配置の分散分析表 波音 2005/11/26 (土) 18:15
└8471. Re: 繰り返しのある二元配置の分散分析表 青木繁伸 2005/11/26 (土) 20:19
 └8475. Re^2: 繰り返しのある二元配置の分散分析表 波音 2005/11/26 (土) 21:44
  └8481. Re^3: 繰り返しのある二元配置の分散分析表 マスオ 2005/11/28 (月) 02:03
   └8485. Re^4: 繰り返しのある二元配置の分散分析表 波音 2005/11/28 (月) 19:02


8470. 繰り返しのある二元配置の分散分析表 波音  2005/11/26 (土) 18:15
繰り返しのある二元配置分散分析について質問させていただきます。

ある病気をもつマウスを症状によって3段階I,II,IIIに分類し,4種類の処置A,B,C,Dをとったときの生存日数を測定した表について分析しています(という練習問題をしています)。

R で二元配置分散分析を行った結果と書籍の結果とでSSが異なります。例えばRで行った結果は,行間変動(要因A)=621.29,列間変動(要因B)= 4842.25,となるのですが,書籍の方では行間変動(要因A)=530.0,列間変動(要因B)=4551.0,のようになっています。

SAS で同じように計算してみてもRの結果と同じになりますし,自分で計算しなおしてみても同じ結果になっています。計算の仕方(データ処理の仕方)によって微 妙に計算結果が異なることはありえるのでしょうか。何か誤りの原因として考えられることでもよいので教えてください。

     [このページのトップへ]


8471. Re: 繰り返しのある二元配置の分散分析表 青木繁伸  2005/11/26 (土) 20:19
> Rで二元配置分散分析を行った結果と書籍の結果とでSSが異なります。例えばRで行った結果は,行間変動(要因A)=621.29,列間変動(要因B)= 4842.25,となるのですが,書籍の方では行間変動(要因A)=530.0,列間変動(要因B)=4551.0,のようになっています。

その書籍が特定できなければ,どちらが正しいかわかりませんね。
書籍情報をお書き頂けるか,
著作権の問題がクリアできる形でデータを提供頂くか
(著作権の問題というのは,今回の場合は殆ど問題ないと思います。分析に関わるデータを,書名,引用箇所を明示して提示するのは,著作権に関わらない正当な引用になると思います。意義のある場合はお知らせ下さい。念のため,しばらくの猶予期間後に行動を起こして下さい)。
著作権の問題があるとお考えの場合には,著書名,引用ページを明記下さい。
必要なら,その情報を元に,私が必要な情報を掲示します(私が責任を負うと言うことですが)

     [このページのトップへ]


8475. Re^2: 繰り返しのある二元配置の分散分析表 波音  2005/11/26 (土) 21:44
先ほどの書籍の件ですが,

稲垣宣生著 2004『数学シリーズ数理統計学改訂版』裳華房

使用したデータ表は,

| A  | B   | C   | D |
I| 31,24,26,22 | 62,40,68,52 | 23,25,42,55 | 26,51,43,44|
II| 16,19,20,25 | 42,50,39,68 | 24,35,31,40 | 36,60,52,28|
III| 5,14,18,30 | 30,37,46,50 | 48,35,23,29 | 30,46,21,33|
(稲垣宣生著 2004『数学シリーズ数理統計学改訂版』裳華房 p253より引用)

そして問題の分散分析表は,

変動|SS |DF|MS |F |棄却限界|
行 |530.0 |2 |265.0 |2.44 |F=3.26 |
列 |4551.0 |3 |1517.0|13.94|F=2.86 |
交互|327.13 |6 |54.52 |0.50 |F=2.36 |
誤差|3917.5 |36|108.82|
総 |8363.52|47|
(稲垣宣生著 2004『数学シリーズ数理統計学改訂版』裳華房 p254より引用)

です。よろしくお願いします。

     [このページのトップへ]


8481. Re^3: 繰り返しのある二元配置の分散分析表 マスオ  2005/11/28 (月) 02:03
データ数値の誤植みたいですね.
練習でやっていると,結構あったりします.

桁落ちや桁の入れ替わり.実務でも発生するエラーです.
外れ値には常に注意を払うようにしましょう.
経験で,あやしい数値はある程度わかるようになります.

Rで,

y <- c(
31,24,26,22,62,40,68,52,23,25,42,55,26,51,43,44,
16,19,20,25,42,50,39,68,24,35,31,40,36,60,52,28,
15, #### 5 → 15, おそらく誤植
14,18,30,30,37,46,50,48,35,23,29,30,46,21,33)

a <- gl(3,4*4)
b <- rep(gl(4,4),3)

summary(aov(y~a*b))
Df Sum Sq Mean Sq F value Pr(>F)
a 2 530.0 265.0 2.4354 0.1019
b 3 4551.0 1517.0 13.9405 3.446e-06 ***
a:b 6 327.1 54.5 0.5010 0.8033
Residuals 36 3917.5 108.8
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

     [このページのトップへ]


8485. Re^4: 繰り返しのある二元配置の分散分析表 波音  2005/11/28 (月) 19:02
回答ありがとうございます。

今し方,Rで5→15になおしてやってみたら,書籍に載っている分散分析表と同じ結 果になりました。確かに言われてみると,1つだけ5というのはおかしいですね。素人だとどうしても活字を信用してしまうので,これからは外れ値にも気を配 りながら読んでいきたいとおもいます。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 035 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る