★ 回帰分析のダミー変数について ★

5376. 回帰分析のダミー変数について zwei 2004/12/30 (木) 00:20
├5379. Re: 回帰分析のダミー変数について 青木繁伸 2004/12/30 (木) 10:07
└5377. Re: 回帰分析のダミー変数について 若輩者 2004/12/30 (木) 09:23
 └5386. Re^2: 回帰分析のダミー変数について zwei 2004/12/31 (金) 04:51
  └5387. Re^3: 回帰分析のダミー変数について 若輩者 2004/12/31 (金) 10:02
   └5388. Re^4: 回帰分析のダミー変数について zwei 2004/12/31 (金) 12:37
    └5391. Re^5: 回帰分析のダミー変数について 若輩者 2004/12/31 (金) 14:08
     └5482. Re^6: 回帰分析のダミー変数について zwei 2005/01/11 (火) 18:07


5376. 回帰分析のダミー変数について zwei  2004/12/30 (木) 00:20
タイトルのとおり,回帰分析のダミー変数についてお聞きしたいのですが,ダミー変数を用いる意味って,「質的変数を回帰分析にかける」こと以外に何か目的ってありますか?
現 在,とある財の消費額を従属変数,年齢・年度・世代を独立変数にして回帰分析を行っています。ここで年度や年齢は間隔尺度だからダミー変数を使わなくても 分析できるはず,とある先生には言われ,別の先生には年度や年齢は質的変数だからダミーをかませないと分析できるはずが無い,といわれました。
結果的にはダミー変数を使えば分析はできたのですが,それがなぜなのかはわかりませんでした。ちなみにダミー変数をかませないでやると時代・年度・世代間には一時従属(多重共線性)の関係があるためパラメータは推定されませんでした。
まだ統計学や数学については正直精通していないので,簡単な説明でもかまわないのでアドバイスいただけたらと思っています。
それでは,よろしくお願いします。

     [このページのトップへ]


5379. Re: 回帰分析のダミー変数について 青木繁伸  2004/12/30 (木) 10:07
> 別の先生には年度や年齢は質的変数だからダミーをかませないと分析できるはずが無い,といわれました。

年度や年齢は質的変数ではありません。
ダミー変数に変換する必要はありません。
一次従属性(多重共線性)については 5377 での指摘の通り。時代・年度・世代をともに入れることは意味がないですね。

     [このページのトップへ]


5377. Re: 回帰分析のダミー変数について 若輩者  2004/12/30 (木) 09:23
> ちなみにダミー変数をかませないでやると時代・年度・世代間には一時従属(多重共線性)の関係があるためパラメータは推定されませんでした。

これは,回帰分析のダミー変数という話ではなくて,コホート分析における「識別問題」の話じゃないでしょうか.識別問題は,たとえば下記の「第III部-第3章コウホート分析の方法」のうちpp.244~247あたりに記載あります.

林・鈴木(1997).社会調査と数量化(増補版).岩波書店

ダ ミー変数を使ったときは,たとえば,時代・年代・世代のどれかひとつではカテゴリを2つ落とすとか,そういった何らかの制約条件を加えて(同じ要因でカテ ゴリを2つ落とせば,その2つのカテゴリの効果が等しいという制約を置いたことに相当)この問題をとりあえず計算可能なように回避したのでは?

     [このページのトップへ]


5386. Re^2: 回帰分析のダミー変数について zwei  2004/12/31 (金) 04:51
> ダミー変数を使ったときは,たとえば,時代・年代・世代のどれかひとつではカテゴリを2つ落とすとか,そういった何らかの制約条件を加えて(同じ要因でカ テゴリを2つ落とせば,その2つのカテゴリの効果が等しいという制約を置いたことに相当)この問題をとりあえず計算可能なように回避したのでは?

ご返信ありがとうございます。
実 際に僕がやってみたのは,何の制約もつけずにただダミー変数に変換して分析しただけでパラメータが推定されました。そこで疑問だったのは,こんなに簡単に 推定できるのなら,「識別問題」の何が問題なのか,もしくはなんでこんなに簡単に推定できたのかがよくわからないということです。
コウホート分析についての書籍は何冊か読んだのですが,詳細についてはあまり触れられておらず,かといって中村(1982)のようなものを見るとちょっと難解でわかりづらいものでしたので,質問させていただきました。

     [このページのトップへ]


5387. Re^3: 回帰分析のダミー変数について 若輩者  2004/12/31 (金) 10:02
> 実際に僕がやってみたのは,何の制約もつけずにただダミー変数に変換して分析しただけでパラメータが推定されました。

だとしたら,データの加工ミス,あるいは勘違いです.

> そこで疑問だったのは,こんなに簡単に推定できるのなら,「識別問題」の何が問題なのか,もしくはなんでこんなに簡単に推定できたのかがよくわからないということです。

係数が求まるだけで良いなら,ベイズ型コホートなど不要でしょう.本来識別できないものを,"いかに良く"推定するかが問題です.

> コウホート分析についての書籍は何冊か読んだのですが,詳細についてはあまり触れられておらず,

識別問題については,先に挙げた本だけで十分かと思います.
#そんな何冊もコウホート扱った書籍ってあります...?

     [このページのトップへ]


5388. Re^4: 回帰分析のダミー変数について zwei  2004/12/31 (金) 12:37
ご返信ありがとうございます。

>だとしたら,データの加工ミス,あるいは勘違いです.
データの加工ミス・・・というのはなさそうなので,勘違いが考えられると思いますが,どういった勘違いが考えられますかね?
質問ばかりですいませんm(_ _)m

> 係数が求まるだけで良いなら,ベイズ型コホートなど不要でしょう.本来識別できないものを,"いかに良く"推定するかが問題です.
ということは,このケースの回帰係数≠各効果のパラメータではないということでしょうか?だとするとここで出てきた係数はどのように解釈すればよいのですか?

> 識別問題については,先に挙げた本だけで十分かと思います.
> #そんな何冊もコウホート扱った書籍ってあります...?
すいません,僕が読んだのは論文でした。書籍は藤田(1984)「コウホート分析」と森ら(2001)「食糧消費のコウホート分析」ですかね。その他は海外の文献や日本では中村(1982・1985)などを読みました。

     [このページのトップへ]


5391. Re^5: 回帰分析のダミー変数について 若輩者  2004/12/31 (金) 14:08
> >だとしたら,データの加工ミス,あるいは勘違いです.
> データの加工ミス・・・というのはなさそうなので,勘違いが考えられると思いますが,どういった勘違いが考えられますかね?

コホート表からデータをどう作るかが理解できてないのかもしれませんね.

> > 係数が求まるだけで良いなら,ベイズ型コホートなど不要でしょう.本来識別できないものを,"いかに良く"推定するかが問題です.
> ということは,このケースの回帰係数≠各効果のパラメータではないということでしょうか?だとするとここで出てきた係数はどのように解釈すればよいのですか?

「回 帰係数=各効果のパラメータ」です(平均をゼロに持ってきたりの調整はありますが).識別問題ゆえ,なんらかの制約ナシには解は定まらないので,何か制約 を入れる.それをどう入れるのが良いのか,ということです(制約を変えればいくらでも異なった解が出てくる).それに対して各要因ごと隣り合う水準の変化 が急激にならないような制約を入れるなどするのがベイズ型ほコホート.

先に挙げた文献をご覧になって,このあたりのことが分からない場合は,コホート表か回帰分析の少なくともいずれか一方について,そもそもの理解が不足ということでしょう.

#たぶんこれ↓だけ読めば書いてあると思いますが.だとすると回帰分析の理解が不足でしょうか?

> すいません,僕が読んだのは論文でした。書籍は藤田(1984)「コウホート分析」と森ら(2001)「食糧消費のコウホート分析」ですかね。その他は海外の文献や日本では中村(1982・1985)などを読みました。

#ところで先の文献,「第III部」ではなく「第IV部」でした.ページ数は合ってます.

     [このページのトップへ]


5482. Re^6: 回帰分析のダミー変数について zwei  2005/01/11 (火) 18:07
前回のレスからいろいろな文献を調べ,勉強したのですが,やはり疑問点がいくつか残りました。
まず第一点は,どうしてダミー変数を用いた事でパラメータが推定できたのか?用いたデータは年齢(5歳毎「〜24歳」から「65歳以上」まで10区分,時代は1984年〜1999年まで(5年毎)4区分,4×10のマトリックスから世代は13区分得られました。
そして,それぞれにダミー変数を割り当て(「〜24歳」「1984年」「第13世代」は基準のため0とする。),回帰分析をかけた結果,年齢区分の1つが除外,年齢効果の1つと世代効果が非有意となったほかは普通に推定できました。
しかも,その推定結果はおおよそこちらの仮説を検証するものだったのです。となると,なぜダミー変数を用いると解が得られるのか?だとすると識別問題はなぜ生じるのか?といったような基本的な疑問に直面するのです。
ご指摘のとおり,私の理解の足りないところがあるとは思いますが,私の指導教授もこれには首を傾げています。
もしよろしければもう少しご指導いただければと思っています。よろしくお願いします。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 032 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る