No.11804 順序変数と連続変数独立変数とする重回帰分析  【MoMo】 2010/01/24(Sun) 10:32

順序変数と連続変数のいずれもを独立変数とする重回帰分析をおこなっています。
具体的には出血時間(連続変数)を 従属変数とし,順序変数(二値変数)3個と連続変数9個を独立変数として重回帰分析を行い,出血時間にもっとも寄与する因子を特定しようとしています。こ ういったケースでは,二値変数の方が有意となりやすい傾向があると聞きました。ということは連続変数も中央値あたりで二つに割って二値変数としてすべて同 じ種類の独立変数としてから解析するのが正しいやりかたなのでしょうか?

それから,組み込んだNは100なのですが,独立変数が12というのは多すぎですか?この条件でR二乗は0.65ですから,そこまでおかしなことではない印象を持っています。

よろしくご教授ください。

No.11806 Re: 順序変数と連続変数独立変数とする重回帰分析  【青木繁伸】 2010/01/24(Sun) 11:46

> 二値変数の方が有意となりやすい傾向があると聞きました。

そんなことはないでしょう。
もしそんなことがあるなら,有意な結果を出したい人はみな,連続変数を二値変数に直して分析に用いるでしょう。

> ということは連続変数も中央値あたりで二つに割って二値変数としてすべて同じ種類の独立変数としてから解析するのが正しいやりかたなのでしょうか?

それが正しくないことは明らかでしょう?
理 由はいろいろ挙げることができますが,y=ax+b というような単純な回帰式を考えればよいですね。x が連続変数なら予測値も連続変数になりますが,もし x を二値変数に変換したら,予測値も二値変数になります。二種類の値のいずれかしか取らないそのような予測値は役に立たないですね。連続変数をカテゴリー化 する段階で,情報が失われるのです。

> 組み込んだNは100なのですが,独立変数が12というのは多すぎですか?

重 回帰分析の場合「サンプルサイズは独立変数の10倍」などという基準もあるようですが,まずは,用いた12個の独立変数全部が意味のある独立変数かどうか などを検討するのが先でしょう。ステップワイズ変数選択などをすれば,12個全部が選ばれるということはないのではないかと思います。

> この条件でR二乗は0.65ですから,そこまでおかしなことではない印象を持っています。

12個も変数を使って決定係数が 0.65 というのは,ちょっと poor な感じを受けます。N=100 なので,自由度調整済み重相関係数の二乗は 0.6 ぐらいですね。

No.11807 Re: 順序変数と連続変数独立変数とする重回帰分析  【MoMo】 2010/01/24(Sun) 12:35

青木先生,迅速なご回答恐れ入ります。

大変勉強になりました。
おっしゃるとおり,連続変数を二値変数にするのは控えます。
また,独立変数の質と量についてもう少し検討してみたいと思います。

どうもありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る