No.01279 回帰分析によるダミー変数の使い分け  【yu】 2006/10/10(Tue) 19:39

回帰分析の本を読んでいて,ふとした疑問なのですが,
例として,身長から体重を予測する回帰式を求める際に性別をダミー変数として投入した解析が紹介されていました.
そうすると男女を区別せずに単回帰分析を行った場合よりもR2が高くなっていました.
そこで疑問なのですが,もし調査段階から性別による違いが予測される場合,
性別をわざわざダミー変数として投入しなくても,はなっからデータを男女に分けてそれぞれ単回帰式を求めればよいように思いました.
この使い分けはどのようにすべきなのでしょうか?

No.01280 Re: 回帰分析によるダミー変数の使い分け  【yu】 2006/10/10(Tue) 19:50

(体重)=b+a(身長)+d(性別)
とすると,

●性別のダミー変数を投入する場合...
 身長と体重の傾きは変わらないが,切片が変わる.すなわち,回帰直線が平行になっていることを仮定している場合に用いる
●性別で分けて,それぞれ単回帰分析する場合...
 身長と体重の関係(傾き)が男女で異なる.すなわち,回帰直線が平行ではないと仮定あるいは可能性がある場合に用いる

ということなのでしょうか?自己レスでした.

No.01281 Re: 回帰分析によるダミー変数の使い分け  【青木繁伸】 2006/10/10(Tue) 21:03

性別と身長の影響を同時に考える必要があると考えるかどうかに関わるわけでしょう。
それが多変量解析というものなんでしょう。

No.01283 Re: 回帰分析によるダミー変数の使い分け  【yu】 2006/10/10(Tue) 22:04

コメントありがとうございます.
(1)性別のダミー変数を投入する場合
(2)性別で分けて,それぞれ単回帰分析する場合

「性別と身長の影響を同時に考える必要がある」ときは(1)というのはわかりました.
しかし(2)でも,性別の影響を考えているからこそデータを分けて解析しているし,その結果得られた回帰式について男女間の比較をすると思います.
これも「同時に」考えているような気がします.
「同時に」についてもう少し詳しく教えてください.

No.01285 Re: 回帰分析によるダミー変数の使い分け  【青木繁伸】 2006/10/10(Tue) 22:15

性別と身長の標準化偏回帰係数を比較するときはどうすればよいと思いますか?

No.01286 Re: 回帰分析によるダミー変数の使い分け  【青木繁伸】 2006/10/10(Tue) 22:18

二値変数(に限らないのだけど)がたくさんあって,それらの組み合わせによりデータを分割し,それぞれのデータ セットで身長と体重の関連を単回帰分析することを考えると,とっても大変なことになるだろうし,結果の解釈をどうやったらよいか途方に暮れそうに思います よね。行き着くところは,それら全ての要因も重回帰モデルに取り込むことになるのでは?
それが同時に考えるということでしょう。

No.01300 Re: 回帰分析によるダミー変数の使い分け  【yu】 2006/10/11(Wed) 19:07

>性別と身長の標準化偏回帰係数を比較するときはどうすればよいと思いますか?
なるほど.確かにその場合,(1)の方法で重回帰モデルを作るしかないです.
(2)では,標準化偏回帰係数の比較はできません.確かに.

青木先生のコメントから,私なりに考えたダミー変数の使い分けは
「性別の情報を解析の中でどのように位置づけるのか」を考えるべきだと思いました.
性別は単なる分割のための変数で,男女別の回帰式に意味を見出す場合は(2)でも可,
性別の情報を回帰モデルに取り込んでその影響を同時に検討したい場合は(1).
つまるところ,「同時に考えるか否か」を自分の研究目的に応じて使い分けよ,ということだと思いました.
ご助言ありがとうございました.

● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る