★ ポアソン回帰について ★

 356 ポアソン回帰について  原田@北九州  2002/08/29 (木) 01:14
  361 Re: ポアソン回帰について  原田@北九州  2002/08/30 (金) 00:13
   363 Re^2: ポアソン回帰について  竹澤邦夫  2002/08/30 (金) 09:42
    375 Re^3: ポアソン回帰について  原田@北九州  2002/08/31 (土) 02:27


356. ポアソン回帰について  原田@北九州  2002/08/29 (木) 01:14
心事故と気象の関係を調べています。ある時点i(1ヶ月)の心事故発生率λi,その月の平均最高気温Mi,その月の平均温度差(=最高ー最低)Di,その月の最高気温の分散Viとして
 ln λi=β0 + β1・M i+ β2・Di + β3・Vi
というモデルを仮定し,関連を検討しようとしたのですが,事故発生がゼロ(λi=0)という月があり,どう扱うべきか悩んでいます。対象のリスク人口は約20万人と推測しています。5年間の発生件数(λ)が分かっているので,ポアソン分布関数から発生数=0のときの期待値を求めて代用してもいいのでしょうか。グラフにしてみると,推定値と実測値はよく一致しているようなのですが。
なお,5年間の発生件数は約250件です。

     [このページのトップへ]


361. Re: ポアソン回帰について  原田@北九州  2002/08/30 (金) 00:13
> 心事故と気象の関係を調べています。ある時点i(1ヶ月)の心事故発生率λi,その月の平均最高気温Mi,その月の平均温度差(=最高ー最低)Di,その月の最高気温の分散Viとして
>  ln λi=β0 + β1・M i+ β2・Di + β3・Vi
> というモデルを仮定し,関連を検討しようとしたのですが,

自己レスです。いろいろ調べてたら,zero inflated poisson regressionという方法があることがわかりました。手持ちの本には詳細が書いていないのですが,ご存知の方教えていただけませんか。特に,観測値にオフセットとして加える数の決め方はどうしたらいいのでしょうか(単に1/1000くらいの値でいいのでしょうか)。
それから,poisson回帰でover dispersionがみられたら,どうやって補正したらいいのでしょうか。

     [このページのトップへ]


363. Re^2: ポアソン回帰について  竹澤邦夫  2002/08/30 (金) 09:42
 竹澤(中央農業総合研究センター・農業情報研究部・
営農情報システム研究室)です。

 zero inflated poisson regression については,例えば,以下の
ところで公開されている論文に書かれています。

http://www.ukc.ac.uk/IMS/statistics/people/M.S.Ridout/ibc_fin.pdf

0の値をとるところには別のモデルをあてはめるわけです。
当然ながら,このモデルを使うには,データがこのモデルに従っている,
という背景が必要でしょう。
 overdispersionについては一般化線形回帰に関する大抵の入門書に
書いてあると思います。例えば,以下の本です。

Raymond H. Myers, Douglas C. Montgomery, G. Geoffrey Vining(2001):
Generalized Linear Models: With Applications in Engineering
and the Sciences, John Wiley & Sons, ISBN: 0471355739.

要するに,scale parameterの値を別の方法で求める,ということです。

     [このページのトップへ]


375. Re^3: ポアソン回帰について  原田@北九州  2002/08/31 (土) 02:27
>  竹澤(中央農業総合研究センター・農業情報研究部・
> 営農情報システム研究室)です。
>
> 0の値をとるところには別のモデルをあてはめるわけです。
> 当然ながら,このモデルを使うには,データがこのモデルに従っている,
> という背景が必要でしょう。

コメントありがとうございます。
イベント発生率については,ヒストグラムで見る限り,ポアソン分布に従っているようです。発生がゼロという項目は,60ヶ月中で2回しかありませんから,わずかなoffsetを加えてもあまり影響しないと思います。文献を参考にして検討したいと思います。幸い,標本の平均と分散は,近い数字となったので,overdispersionの問題は考えなくてもよさそうです。
温度については,最高気温,日内温度差,分散よりも,これらから主成分分析で求めた「季節変動」,「日内変動」,「日差変動」(と勝手に命名しましたが)のほうが当てはまりがよさそうです。これからAICなどを求めて見たいと思います。どうも,心臓発作というのは,気温が低いのが数日続くより,大きく変化した時のほうが発生しやすいようです。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 020 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る