No.02147 Re: 重回帰分析のダミー変数について 【青木繁伸】 2007/01/05(Fri) 12:44
ちょっとわかりにくいのですが,
>欧米では数量化理論I類と同様にダミー変数を使わずに解析していると聞いたことがあります。
ダミー変数を使わずに,どのように分析しているのでしょうか?
>(1)実際,このように解析することに問題はございませんか
「このように」というのは,貴方のやろうとしている「ダミー変数を用いる重回帰分析」のことでしょうね
> 論文でこのような解析スタイルは見たことがない
「このような解析スタイルは見たことがない」とありますが,私は,ダミー変数を用いる重回帰分析しか見たことがないんです
===============
「欧米では,数量化I類ではなく,ダミー変数を用いた重回帰分析が用いられる」というのを聞き間違えた可能性はないのでしょうか?
No.02149 Re: 重回帰分析のダミー変数について 【まさ】 2007/01/05(Fri) 13:26
No.2145について。
書き込み内容がわかりにくく,すいませんでした。
ダミー変数を使わずに,どのように分析しているのでしょうか?
→例えば,雇用形態について,「1.管理者,2.一般正社員,3.非常勤」というふうに,この1〜3の数値を数値データとして重回帰分析に用いるということです。
No.02150 Re: 重回帰分析のダミー変数について 【青木繁伸】 2007/01/05(Fri) 14:26
> 例えば,雇用形態について,「1.管理者,2.一般正社員,3.非常勤」というふうに,この1〜3の数値を数値データとして重回帰分析に用いる
そういうやり方は,ダメでしょう。
重回帰分析のモデルは y ~ a*x1 + b*x2 + … ですよね
x1 が雇用形態として,a=2 と仮定すれば,雇用形態がyに寄与する量は,管理者が2,一般正社員が4,非常勤が6となりますが,管理者は非常勤の1/3ですか?そんなことはないでしょう(あるかもしれませんが)。
要するに各カテゴリーに与えられた「数値」は重回帰モデルが想定する数値ではないのです。
ちなみに,2:よく,1:ときどき,0:いいえ のような場合には,この「数値」を近似値として使うことはあります。
貴方が話を聞き違えた可能性というか,重回帰分析の場合にも,統計プログラムによっては*見*か*け*上*,「この1〜3の数値を数値データとして重回帰分析に用いる」ということをやっているものもあります。
つまり,データとしては,1,2,3のような数値を読みこむが,この数値はカテゴリー変数のものであるという情報を持っており,内部的には1,2,3をダミー変数に置き換えて分析するというものです。
R でも同じようなことをしますよ。> y <- c(1,3,1,3,2,3,1,1,3,2)
> x1 <- c(1,2,1,2,1,2,3,1,3,3)
> lm(y~x1)
Call:
lm(formula = y ~ x1) 誤った分析法
Coefficients:
(Intercept) x1 1個のデータとして使われている
1.1739 0.4348
> x2 <- factor(x1) x1 はカテゴリーデータだから特別に扱えよ!と命令している
> lm(y~x2) 作られた x2 を使って分析する
Call:
lm(formula = y ~ x2) 正しい分析法
Coefficients:
(Intercept) x22 x23 2つのダミー変数に展開されている
1.25 1.75 0.75
● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る