No.12399 ロジスティック回帰分析の変数選択法  【ごうだ】 2010/04/07(Wed) 00:38

はじめまして,初心者で恐縮ですが宜しければご教授下さい。
ロジスティック回帰についてです。

医療機関受診時の血圧などのデータを独立変数とし,「入院14日後に自宅に復帰できている(=従属変数)」かどうかを予測する目的で,ロジスティック回帰分析を選びました(StatViewで,対象約100例)。

変 数選択をどうしたらいいのかが分からず,こちらのログや他のサイトを参照して,StepWise法,強制投入法,総当たり法などがあるというところまでは 何とかたどり着いたのですが「医学の研究現場では(略)対象とする全検査項目を組み込んだロジスティック回帰分析を行うべきであり,逐次変数選択を行うべ きではありません。 」という文面も見つけました
http://www.snap-tck.com/room04/c01/stat/stat10/stat1004.html

そこで,強制投入法で変数を全て投入したいのですが医学的に重要な順が一部不明の場合,どのように絞れば良いでしょうか?
全部強制投入した場合の尤度比検定のP値が小さい順に投入していくので良いでしょうか?
Rでも試してみたのですが,2値でないカテゴリー変数もあり,ダミー化が良く分かりませんでした…。

よろしくお願いいたします。

No.12400 Re: ロジスティック回帰分析の変数選択法  【青木繁伸】 2010/04/07(Wed) 00:41

> 2値でないカテゴリー変数もあり,ダミー化が良く分かりませんでした

この部分についてのみ。R では,カテゴリー変数は factor にすればよいのです。自分でダミー変数を作る必要はありません。

No.12406 Re: ロジスティック回帰分析の変数選択法  【ごうだ】 2010/04/07(Wed) 18:44

ご返信ありがとうございます,頑張ってみます。

No.12411 Re: ロジスティック回帰分析の変数選択法  【surg】 2010/04/08(Thu) 04:22

>「医学の研究現場では(略)対象とする全検査項目を組み込んだロジスティック回帰分析を行うべきであり,逐次変数選択を行うべきではありません。 」という文面も見つけました

これは,研究の目的が注目している項目がリスクファクターとしてどの程度寄与しているのかを調べる場合には,注目している項目をすべて組み込んだモデルを使うといっているにすぎません。

研究の目的が予測にあるのであれば,こんなことにとらわれずに変数選択を行うべきと考えます。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る