No.10546 glmのサマリー  【wkox】 2009/07/31(Fri) 19:24

Rを用いて,自分のデータをフィッティングしております。
サンプル数は186あり,2つの説明変数(condition, power)を用いています。
conditionはAないしはBの2値化データ,speedは数値データです。
下記が私が行ったテストです。

質 問なのですが,前回教えていただいた帰無仮説「母回帰係数(回帰係数の推定値)は0である」についてです。下記のようなglmテストを行った際,P値に関 して,補正(post-hoc test)が必要だと思われるのですが,どのような方法が良いのでしょうか。同じような実験をしているグループはbonferroni correctedを用いています。
もし私のデータでbonferroni correctedを用いるとしたら,P<0.05/186であれば,帰無仮説に対して有意であると言えるのでしょうか。
よろしくお願いいたします。

g<-glm(power ~ condition + speed)
> summary(g)

Call:
glm(formula = power ~ condition + speed)

Deviance Residuals:
Min 1Q Median 3Q Max
-2.99757 -0.81225 -0.05231 0.76457 3.75325

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 79.67444 1.02726 77.560 < 2e-16 ***
conditiongf 0.93265 0.20090 4.642 6.55e-06 ***
speed 0.02653 0.01588 1.670 0.0966 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 1.343642)

Null deviance: 307.08 on 185 degrees of freedom
Residual deviance: 245.89 on 183 degrees of freedom
AIC: 587.76

Number of Fisher Scoring iterations: 2

No.10548 Re: glmのサマリー  【青木繁伸】 2009/07/31(Fri) 21:04

> 0.05/186

なぜ 186 で割るんですか?

No.10550 Re: glmのサマリー  【wkox】 2009/07/31(Fri) 21:13

青木 先生
正直どのように補正するのかが分っておりません。
私の理解では,真のP値を得るには, P値をサンプルの個数(テストの回数)で割るのがbonferroni correctedなのですが。いろいろなページを閲覧したのですが,確信を得れる情報がなかったため,エントリーしました。申し訳ありませんが,ご教授 お願い申し上げます。

No.10553 Re: glmのサマリー  【wkox】 2009/07/31(Fri) 22:34

すいません,間違いがありました。
危険率を0.05とした場合,bonferroni correctedにおいては,有意とみなせるのは,0.05をテストの回数で割った数値より低い場合のみと理解しております。これは正しいのでしょうか。よろしくお願いします。

No.10555 Re: glmのサマリー  【後医は名医】 2009/07/31(Fri) 22:56

>危険率を0.05とした場合,bonferroni correctedにおいては,有意とみなせるのは,0.05をテストの回数で割った数値より低い場合のみと理解しております。これは正しいのでしょうか。
「テスト」を「検定」におきかえれば,正しいでしょう。
>私の理解では,真のP値を得るには,P値をサンプルの個数(テストの回数)で割るのがbonferroni correctedなのですが。
サンプルの個数とテストの回数とは同じではないと思いますが。wkoxさんの行っているのは186の「サンプルの個数」を1回の「テスト」(検定)で解析しているので補正の必要はないと思います。

No.10557 Re: glmのサマリー  【wkox】 2009/08/01(Sat) 00:42

後医は名医 様 
ありがとうございます。もう少しで分るような気がしてきましたが,
No. 8794の議論を読んで,また少し分らなくなりました。
http://aoki2.si.gunma-u.ac.jp/taygeta/statistics.cgi?mode=res&no=8728
分 らない点は,そのエントリーにおいて「管理方法(TRT)」と「ブロック(REP)」が説明変数なのですが,両者共にdiscreat numberです。すなわち,条件の数が3つずつになっているようです。で,最後の方に移り,bonferroni correctedの話が出てくるのですが,この際3つの条件があるから,「補正した有意水準は3組共通で α=0.05/3=0.0167」とあります。もしこのエントリーが正しいようでしたら,自分のデータの補正はパラメーター毎に変えないといけないという 事だと思いました。
すなわち,conditionはAないしはBなので2で補正,speedは全て異なる数値のため186で補正と思ったのですが,これは正しいのでしょうか。
どうかよろしくお願いいたします。

No.10563 Re: glmのサマリー  【後医は名医】 2009/08/01(Sat) 17:19

No.8794の議論では条件が3つあるために多重比較の必要性があるのだと思います(すいません,詳しくは理解できてません。この議論に参加されている方で解説出来る方がいましたらお願いします)
wkoxさんのデータをみると
power=condition+speed  のダミー変数を含む重回帰分析だと思いますがいかがでしょうか。この場合,conditionの条件はA,Bの2つですので,多重比較の必要はないよう に思います。A,B,Cの3つになると問題になるかもしれませんが。データからすると,powerはspeedに影響されず,conditionに影響さ れると結論してよいように思いますが。量的データ(speed)を質的データ(condition)のように扱っているのが原因ではないでしょうか。

No.10567 Re: glmのサマリー  【wkox】 2009/08/02(Sun) 20:27

後医は名医 様

ありがとうございます。量的データを質的データのように扱っているというご指摘はその通りだと思います。ヒントを頂けましたので,再考してみます。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る