No.12226 ロジスティック回帰におけるモデルの選択について  【あこ】 2010/03/05(Fri) 11:01

こんにちはあこと申します。
どなたかにご教授願えばと思い投稿させていただきました。

植物の発病の有無について実験を行いロジスティック回帰による分析を行っています。
複数の植物種に濃度を変えた病原菌を接種し,発病数を調べました。
また発病に影響する要因として植物のサイズを測定しました。

植物種,菌濃度,サイズを組み合わせてモデルを作成し,SASのLogisticプロシジャを用いてAICを算出し,Hosmer and Lemeshowの適合度の検定を行いました。

その結果植物種,菌濃度およびサイズが含まれるモデルでAICが最も小さくなったのですが(AIC=2091),そのモデルではHosmer and Lemeshowの検定のP値が0.0152となり,モデルはデータに適合していない可能性が高いと考えられました。

植物種と菌濃度のみを含むモデルではAICが2443となりHosmer and Lemeshowの検定でP値が0.05以上となりました。このような場合どちらのモデルを採用した方がよいのでしょうか?結果をどの様に考えたらよいのか分からず投稿させて頂きました。
ご教授下さい

No.12228 Re: ロジスティック回帰におけるモデルの選択について  【taipapa】 2010/03/05(Fri) 13:06

Hosmer-Lemeshow検定について良く知っている訳ではないですが,
http://www.iic.tuis.ac.jp/edoc/journal/ron/r8-1-2/r8-1-2d.html
http://www.iic.tuis.ac.jp/edoc/journal/ron/r8-1-2/r8-1-2g.html
を見ると,この方法には仰るような問題があることが記載されてます.

No.12229 Re: ロジスティック回帰におけるモデルの選択について  【あこ】 2010/03/05(Fri) 13:31

taipapaさん返信ありがとうございます。

リンク先の情報にあるように私のデータは例数が多いのかもしれません(2000以上のデータがあります)。
この論文に従ってRu^2の値を算出してみます。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る