★ ロジスティック回帰分析の変数選択_2 ★

 260 ロジスティック回帰分析の変数選択_2  とほほ  2001/11/22 (木) 16:14
  263 Re: ロジスティック回帰分析の変数選択_2  青木繁伸  2001/11/22 (木) 18:42
   264 Re^2: ロジスティック回帰分析の変数選択_2  とほほ  2001/11/22 (木) 18:43
    265 Re^3: ロジスティック回帰分析の変数選択_2  青木繁伸  2001/11/22 (木) 18:44


260. ロジスティック回帰分析の変数選択_2  とほほ  2001/11/22 (木) 16:14
(質問2)
ロジスティック回帰分析を行うと以下の結果を得ましたが,
  偏回帰係数
X1 0.044 **
X2 0.236
X3 0.000
X4 -0.044 **
X5 0.080
X6 -0.143
X7 -0.703 *
(* < 0.05, ** < 0.01)

従属変数と独立変数の相関係数を算出すると
X1 0.287
X2 0.006
X3 0.078
X4 -0.222
X5 -0.036
X6 -0.282
X7 -0.138

となりX5の符号が異なるのですが,これは抑圧が生じていると考えてよいのでしょうか? もし抑圧が生じているとすれば,どのような方法で抑圧が生じない変数選択をすることができるのでしょうか?

(質問3)
本をみても(有意といえる)判別分析の正判別率には確かな基準はないと書いていましたが,一般的な話でよいのですが,癌などののスクリーニングにどの程度の値なら許容できるのでしょうか? 

     [このページのトップへ]


263. Re: ロジスティック回帰分析の変数選択_2  青木繁伸  2001/11/22 (木) 18:42
> となりX5の符号が異なるのですが,これは抑圧が生じていると考えてよいのでしょうか?

「抑圧」というのは聞き慣れない名前ですね。
多重共線性のことでしょうか。つまり,用いた独立変数間に相関の高いものが含まれているため,変なことが起きたわけです。

> もし抑圧が生じているとすれば,どのような方法で抑圧が生じない変数選択をすることができるのでしょうか?

変数選択をやってくれる機能があれば,多重共線性を引き起こすような独立変数は自動的にはじいてくれるでしょう。
そのような機能がないときには,相関の高い独立変数がともに含まれることがないように,自分で独立変数のセットを決めて分析してみて,満足のいく結果が得られるようにしてください。

> (質問3)
> 本をみても(有意といえる)判別分析の正判別率には確かな基準はないと書いていましたが,一般的な話でよいのですが,癌などののスクリーニングにどの程度の値なら許容できるのでしょうか? 

これはまさに本に書いてある通り,あなた(あるいは,その癌のスクリーニングのことについてよくわかっている人)が決めるしかないですね。

     [このページのトップへ]


264. Re^2: ロジスティック回帰分析の変数選択_2  とほほ  2001/11/22 (木) 18:43
> そのような機能がないときには,相関の高い独立変数がともに含まれることがないように,自分で独立変数のセットを決めて分析してみて,満足のいく結果が得られるようにしてください。

自分で独立変数のセットを決める場合,因子分析をおこないカテゴリーに分け,その因子の中でもっとも他のカテゴリーとの関連の薄い因子を選んで,そのカテゴリーの代表値としても問題ありませんか? つまり,因子分析により,(X1, X2, X3) (X4, X5) (X6, X7)の3カテゴリーに分類されたとしたら,その中から他のカテゴリーを関連の薄い独立変数X1, X4, X6を選択し,その3変数を用いてロジスティック回帰分析を行うことは妥当だといえるのでしょうか?

     [このページのトップへ]


265. Re^3: ロジスティック回帰分析の変数選択_2  青木繁伸  2001/11/22 (木) 18:44
> その因子の中でもっとも他のカテゴリーとの関連の薄い因子を選んで,そのカテゴリーの代表値としても問題ありませんか?

というような,極端なことはしないでもよいでしょう。

相互に無関係な独立変数なんて,現実の場では考えられないし,モデルに含めるか含めないかは実際的な意味合いで決めるしかないでしょう。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 016 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る