No.02145 重回帰分析のダミー変数について  【まさ】 2007/01/05(Fri) 10:27

アンケート調査のフェイス項目で質問した年齢,経験年数,会社規模,性別,婚姻状況,職務上の地位などを説明変数として重 回帰分析をしてみたいと考えています。この際,数値化できない項目はダミー変数を用いるようですが,欧米では数量化理論I類と同様にダミー変数を使わずに 解析していると聞いたことがあります。(1)実際,このように解析することに問題はございませんか,(2)論文でこのような解析スタイルは見たことがない のですが,論文の審査は問題ございませんか。(3)もし,この点に関して記載があるような参考書,文献がございましたら教えていただけませんか。

No.02147 Re: 重回帰分析のダミー変数について  【青木繁伸】 2007/01/05(Fri) 12:44

ちょっとわかりにくいのですが,

>欧米では数量化理論I類と同様にダミー変数を使わずに解析していると聞いたことがあります。

ダミー変数を使わずに,どのように分析しているのでしょうか?

>(1)実際,このように解析することに問題はございませんか

「このように」というのは,貴方のやろうとしている「ダミー変数を用いる重回帰分析」のことでしょうね

> 論文でこのような解析スタイルは見たことがない

「このような解析スタイルは見たことがない」とありますが,私は,ダミー変数を用いる重回帰分析しか見たことがないんです

===============

「欧米では,数量化I類ではなく,ダミー変数を用いた重回帰分析が用いられる」というのを聞き間違えた可能性はないのでしょうか?

No.02149 Re: 重回帰分析のダミー変数について  【まさ】 2007/01/05(Fri) 13:26

No.2145について。
書き込み内容がわかりにくく,すいませんでした。

ダミー変数を使わずに,どのように分析しているのでしょうか?

→例えば,雇用形態について,「1.管理者,2.一般正社員,3.非常勤」というふうに,この1〜3の数値を数値データとして重回帰分析に用いるということです。

No.02150 Re: 重回帰分析のダミー変数について  【青木繁伸】 2007/01/05(Fri) 14:26

> 例えば,雇用形態について,「1.管理者,2.一般正社員,3.非常勤」というふうに,この1〜3の数値を数値データとして重回帰分析に用いる

そういうやり方は,ダメでしょう。
重回帰分析のモデルは y ~ a*x1 + b*x2 + … ですよね
x1 が雇用形態として,a=2 と仮定すれば,雇用形態がyに寄与する量は,管理者が2,一般正社員が4,非常勤が6となりますが,管理者は非常勤の1/3ですか?そんなことはないでしょう(あるかもしれませんが)。
要するに各カテゴリーに与えられた「数値」は重回帰モデルが想定する数値ではないのです。

ちなみに,2:よく,1:ときどき,0:いいえ のような場合には,この「数値」を近似値として使うことはあります。

貴方が話を聞き違えた可能性というか,重回帰分析の場合にも,統計プログラムによっては*見*か*け*上*,「この1〜3の数値を数値データとして重回帰分析に用いる」ということをやっているものもあります。
つまり,データとしては,1,2,3のような数値を読みこむが,この数値はカテゴリー変数のものであるという情報を持っており,内部的には1,2,3をダミー変数に置き換えて分析するというものです。
R でも同じようなことをしますよ。
> y <-  c(1,3,1,3,2,3,1,1,3,2)
> x1 <- c(1,2,1,2,1,2,3,1,3,3)
> lm(y~x1)

Call:
lm(formula = y ~ x1)  誤った分析法

Coefficients:
(Intercept) x1  1個のデータとして使われている
1.1739 0.4348

> x2 <- factor(x1)  x1 はカテゴリーデータだから特別に扱えよ!と命令している
> lm(y~x2)      作られた x2 を使って分析する

Call:
lm(formula = y ~ x2)  正しい分析法

Coefficients:
(Intercept) x22 x23 2つのダミー変数に展開されている
1.25 1.75 0.75

● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る