★ ダミー変数(二値データ)の相関 ★

5414. ダミー変数(二値データ)の相関 MH 2005/01/04 (火) 13:08
└5415. Re: ダミー変数(二値データ)の相関 青木繁伸 2005/01/04 (火) 13:43
 └5419. Re^2: ダミー変数(二値データ)の相関 MH 2005/01/04 (火) 15:57


5414. ダミー変数(二値データ)の相関 MH  2005/01/04 (火) 13:08
重回帰分析の説明変数の選択の際,説明変数間の相関が高い場合は多重共線性のため除去することが多いと思います。説明変数の中に 複数のダミー変数が含まれている場合,相関係数をみて除去すべきか判断したほうがよいのでしょうか?教科書などでは,量的データ間はピアソン相関係数,量 的データと質的データでは相関比,質的データ間ではφ係数などがあげられていますが。重回帰分析の中には量的データとダミー変数(もともとは性別のような 名義尺度,満足度のような順序尺度のデータ)が混在しています。

     [このページのトップへ]


5415. Re: ダミー変数(二値データ)の相関 青木繁伸  2005/01/04 (火) 13:43
ダミー変数間で計算されるφ係数は,ピアソンの積率相関係数そのものです。
つまり,ダミー変数は数学的には連続変数と同じなのです。よって,ダミー変数と連続変数間のピアソンの積率相関をとってもなんの問題もないです。
だって,そうでないと,重回帰分析自体できないでしょう。

多重共線性の判断は,説明変数間の相関係数の大小で判断するのではなく,トレランスを求めたり,ステップワイズ変数選択をするなりして決めましょう。

     [このページのトップへ]


5419. Re^2: ダミー変数(二値データ)の相関 MH  2005/01/04 (火) 15:57
ありがとうございます。勉強になりました。
トレランスとはどういうものですか?
不勉強ですみません。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 032 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る