★ 頻度データのGLM ★

9133. 頻度データのGLM けい 2006/01/20 (金) 16:53
├9159. Re: 頻度データのGLM 774 2006/01/23 (月) 10:30
└9135. Re: 頻度データのGLM sb 2006/01/20 (金) 18:17
 └9165. Re^2: 頻度データのGLM けい 2006/01/23 (月) 18:08


9133. 頻度データのGLM けい  2006/01/20 (金) 16:53
以前お世話になり再び教えていただきたく投稿いたします
動物が起こすある行動の生起頻度が,動物の置かれた状況により違いがあるのかどうかをRを用いて一般化線形モデルで検討しようと思っています
行動は1回2回と数えられるカウントデータなので誤差構造をポアソン分布としリンク関数をlogにしたGLMの典型例だと思うのですが,データに少しだけ厄介な点があり困っています。
問 題というのは,データ自体はカウントデータなのですが動物の観察時間が異なる点です。観察時間が異なるので,例えばある個体において観察時間が増えれば行 動の生起回数は増加します。観察時間が少なかった動物個体においては記録された生起回数は減少します。当然,頻度を比べるときは,観察時間をそろえる必要 があるのですがそれが不十分なときもあるのです。そこで一定時間内の生起頻度を比べる必要があると思うので,(生起回数/観察時間)とした生起頻度 Frequencyを従属変数に取り,おかれた状況を独立変数にとりGLMにはかりたいのですが,Rにおけるポアソン分布のGLMでは従属変数に整数値し か取れないので読んでくれません(あるいはおかしな値が計算されます)。
こういった場合はどういった対処法があるでしょうか?色々調べてみました が未だ解決できていません。結局いつものとおり,行動の生起頻度を連続変数の形で出して,ANOVAにかけるのも問題があるだろうと思っています。他の方 もよく直面しそうな問題(の割には解説する具体例が少ない)なので,とりあえずはご意見を伺いたいです。

     [このページのトップへ]


9159. Re: 頻度データのGLM 774  2006/01/23 (月) 10:30
こういった場合はオフセットを用いるのが良いという記述を見た覚えがあります.
Rのglmでポワソン分布の回帰を行う場合,観察時間の対数をオフセットに指定して,

glm(カウントデータ~説明変数+offset(log(観察時間)),data)

みたいな感じではなかったですか?

     [このページのトップへ]


9135. Re: 頻度データのGLM sb  2006/01/20 (金) 18:17
> 問題というのは,データ自体はカウントデータなのですが動物の観察時間が異なる点です。

観察時間を独立変数の1つとして,モデルに入れたら如何でしょう。

     [このページのトップへ]


9165. Re^2: 頻度データのGLM けい  2006/01/23 (月) 18:08
sbさん,774さん有難うございました
オフセットという手法をあたって見ます

ちなみに観察時間をモデ ルに入れる方法は考えてやってみていたのですが大幅なoverdispersionになってしまったので(なぜかは分からない),単純に観察時間をモデル に入れるのはよくないのではないかと考えています。まだGLM初学者なのでおそらく観察時間をモデルに組み込むときに間違ったことをしている可能性もあり ますしよく理解できていないこともあるのでもう少し勉強します
また質問させていただくかもしれません

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 036 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る