No.05878 回帰モデルの係数推定値の解釈  【もも】 2008/02/16(Sat) 15:26

基本的なことで恐縮ですが,
たとえば,
y <-c(5,9,8,6,5,7,6,3,7,8,6,9,5,4,7,3,5,2,6,4,5,7,9,3,1,2,4,2,5,3)
x <-c(rep(1,15),rep(2,15))
glm(y~factor(x))
としたたきに,結果は,
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 6.3333 0.5077 12.474 5.94e-13 ***
factor(x)2 -2.2667 0.7180 -3.157 0.0038 **
となり,xが1である時に比べて2である時の方がyが小さくなることがいえると思いますが,このとき,xが1である時に比べて,2である時にどの程度yが小さくなるかを言うには,
6.3333-2.2667=4.0666
4.0666/6.3333=0.6421
より,「xが1である時のyを100%とすると,それに比べてxが2である時のyの値は64%である」といえるのでしょうか。

No.05879 Re: 回帰モデルの係数推定値の解釈  【青木繁伸】 2008/02/16(Sat) 17:37

この場合は,glm を使うまでもなく,x の種類別の y の平均値(要するに群別の平均値)を求めれば
> by(y,x, mean)
INDICES: 1
[1] 6.333333
------------------------------------------------------------
INDICES: 2
[1] 4.066667
となるわけで,そのようにすれば,あなたの推論が正しいのは分かりやすいことであると思います

No.05885 Re: 回帰モデルの係数推定値の解釈  【もも】 2008/02/16(Sat) 23:31

わかりやすい説明をありがとうございました。
単純な例をと思いましたが,単純すぎたようです。
念のため,確認させて頂きます。
こ の例では,説明変数が1つなので,平均値をとればご指摘のようになりますが,説明変数が複数ある時には,単純に,ある説明変数の水準毎に平均すると,他の 説明変数の影響も入ってきてしまいます。そこで,glmやlmにより解析した場合に,各説明変数の水準間の効果の大きさの比較については,5878のよう な考え方でよろしいでしょうか。

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る