★ ダミー変数はステップワイズで変数選択する場合全部入れるべきか ★

6622. ダミー変数はステップワイズで変数選択する場合全部入れるべきか 北海道 2005/05/13 (金) 21:11
└6623. Re: ダミー変数はステップワイズで変数選択する場合全部入れるべきか 青木繁伸 2005/05/13 (金) 21:20
 └6627. Re^2: ダミー変数はステップワイズで変数選択する場合全部入れるべきか 北海道 2005/05/13 (金) 21:48
  └6630. Re^3: ダミー変数はステップワイズで変数選択する場合全部入れるべきか 青木繁伸 2005/05/13 (金) 21:56
   └6631. Re^4: ダミー変数はステップワイズで変数選択する場合全部入れるべきか 北海道 2005/05/13 (金) 22:05
    ├6638. Re^5: ダミー変数はステップワイズで変数選択する場合全部入れるべきか 青木繁伸 2005/05/13 (金) 22:19
    └6635. Re^5: ダミー変数はステップワイズで変数選択する場合全部入れるべきか 青木繁伸 2005/05/13 (金) 22:14


6622. ダミー変数はステップワイズで変数選択する場合全部入れるべきか 北海道  2005/05/13 (金) 21:11
ダミー変数について
過去のスレッドになかったのでご助言下さい。

ある連続の数を段階別に分けてダミー変数を作りました。ダミー1からダミー4まで
もちろん数のままロジスティック回帰分析の説明変数として入れるのは望ましいのですが,あまりにSDがひらいているのでその数の程度別に見ようと思い段階別にしました(データを減らしてしまいましたが)
ロジスティック回帰分析にてダミー1とダミー2で有意な結果が得られました。そこで,他の変数と一緒に多重ロジスティック解析をするとき
このばあいダミー1から4まで投入するべきでしょうか?それとも有意であったダミー1とダミー2とその他の有意な変数を入れて多重ロジスティック回帰分析をすべきでしょうか?

     [このページのトップへ]


6623. Re: ダミー変数はステップワイズで変数選択する場合全部入れるべきか 青木繁伸  2005/05/13 (金) 21:20
同一変数に属するダミー変数はまとめて,追加・除去すべきということになっていると思います。

しかし,別の考え方では,あるダミー変数を除去するとなった場合には,ダミー変数の構成からやり直すという方法が採られるべきではないかと思っております(まだ試していない)。
つまり,
A という変数が4つのダミー変数A1,A2,A3,A4になっていて,もし変数選択の段階で A2 がはずされたとすると,A2 は A1,A3,A4 のどこかへ吸収されるべきと思うのです。理論的に決められる場合はそれに従えば良いのでしょうが,そうでない場合は,A1,A3,A4 に含めた場合を検討しなければならないのかなとも思います。
とにかく,ダミー変数の選択・除去は一筋縄ではいかないだろうという予測ですが。実例に沿った例があれば,是非教えてください。というか,論文になるかも??

     [このページのトップへ]


6627. Re^2: ダミー変数はステップワイズで変数選択する場合全部入れるべきか 北海道  2005/05/13 (金) 21:48
早速のご助言ありがとうございました。
同一の変数なのでまとめて入れます。

> 同一変数に属するダミー変数はまとめて,追加・除去すべきということになっていると思います。
>
> しかし,別の考え方では,あるダミー変数を除去するとなった場合には,ダミー変数の構成からやり直すという方法が採られるべきではないかと思っております(まだ試していない)。

なるほど,数字を段階別にしているのですが,ダミー1からダミー6にしたところ分布が少ない所があり有意にならないのでダミー1からダミー4にしました。そうするとダミー1とダミー2が有意な結果でした。
この場合構成からやりなおした??になるのでしょうか?それとも
もっと,やり直すべき・・になるのでしょうか?奥が深いですね・・・

ありがとうございました。


> つまり,
> Aという変数が4つのダミー変数A1,A2,A3,A4になっていて,もし変数選択の段階で A2 がはずされたとすると,A2 は A1,A3,A4 のどこかへ吸収されるべきと思うのです。理論的に決められる場合はそれに従えば良いのでしょうが,そうでない場合は,A1,A3,A4 に含めた場合を検討しなければならないのかなとも思います。
> とにかく,ダミー変数の選択・除去は一筋縄ではいかないだろうという予測ですが。実例に沿った例があれば,是非教えてください。というか,論文になるかも??

     [このページのトップへ]


6630. Re^3: ダミー変数はステップワイズで変数選択する場合全部入れるべきか 青木繁伸  2005/05/13 (金) 21:56
> なるほど,数字を段階別にしているのですが,ダミー1からダミー6にしたところ分布が少ない所があり有意にならないのでダミー1からダミー4にしました。そうするとダミー1とダミー2が有意な結果でした。
> この場合構成からやりなおした??になるのでしょうか?それとも
> もっと,やり直すべき・・になるのでしょうか?奥が深いですね・・・

あれれ?
もとのデータは数値データなんですか?
数値データをカテゴリー化して分析に使用しているのですか?
分析というのは数量化理論?
ダミー変数を使う分析では,名義尺度,順序尺度,間隔尺度・比例尺度を同時に混合して利用できますよ。
名義尺度,順序尺度はダミー変数にしてやらないといけませんが,間隔尺度・比例尺度はそのまま数値データとして使えばいいだけでしょう??

間隔尺度・比例尺度をカテゴリー変数にダウングレードする必要はさらさら無いですよ。。。。

     [このページのトップへ]


6631. Re^4: ダミー変数はステップワイズで変数選択する場合全部入れるべきか 北海道  2005/05/13 (金) 22:05
>
> あれれ?
> もとのデータは数値データなんですか?
> 数値データをカテゴリー化して分析に使用しているのですか?
> 分析というのは数量化理論?
> ダミー変数を使う分析では,名義尺度,順序尺度,間隔尺度・比例尺度を同時に混合して利用できますよ。
> 名義尺度,順序尺度はダミー変数にしてやらないといけませんが,間隔尺度・比例尺度はそのまま数値データとして使えばいいだけでしょう??
>
> 間隔尺度・比例尺度をカテゴリー変数にダウングレードする必要はさらさら無いですよ。。。。

もちろんデータを小さくするのはもったいないのですが
その数量のSDが20.7もあるので人によって違いが大きい
のですね。なので段階別カテゴライズしないと明確な結果が出ないのです。

     [このページのトップへ]


6638. Re^5: ダミー変数はステップワイズで変数選択する場合全部入れるべきか 青木繁伸  2005/05/13 (金) 22:19
> その数量のSDが20.7もあるので人によって違いが大きい
> のですね。なので段階別カテゴライズしないと明確な結果が出ないのです。

よく分からないのですが,平均値+k*SD〜平均値+m*SD の範囲にあるものを全部カテゴリー A とするなどの方が,測定値そのままを用いるよりも識別能は高いのですか?
情報量の損失と結果としての利得どっちが大きいのでしょう。

     [このページのトップへ]


6635. Re^5: ダミー変数はステップワイズで変数選択する場合全部入れるべきか 青木繁伸  2005/05/13 (金) 22:14
> もちろんデータを小さくするのはもったいないのですが
> その数量のSDが20.7もあるので人によって違いが大きい
> のですね。なので段階別カテゴライズしないと明確な結果が出ないのです。

段階別カテゴライズすると明確な結果が出るということなら,そちらの方が変なのではないかという気もしますが。
分析結果がよいのなら良いのかも。

かえって,最適な分割点を求めることに恣意的な作用が働きそうな気がしますね。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 033 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る