★ 要因分析・ロジスティック回帰におけるダミー変数の扱いについて ★

 442 要因分析・ロジスティック回帰におけるダミー変数の扱いについて  谷川  2003/05/22 (木) 23:05
  444 Re: 要因分析・ロジスティック回帰におけるダミー変数の扱いについて  青木繁伸  2003/05/22 (木) 23:16
  443 Re: 要因分析・ロジスティック回帰におけるダミー変数の扱いについて  青木繁伸  2003/05/22 (木) 23:11
   447 Re^2: 要因分析・ロジスティック回帰におけるダミー変数の扱いについて  谷川  2003/05/23 (金) 00:05
    448 Re^3: 要因分析・ロジスティック回帰におけるダミー変数の扱いについて  青木繁伸  2003/05/23 (金) 00:22
     449 Re^4: 要因分析・ロジスティック回帰におけるダミー変数の扱いについて  谷川  2003/05/23 (金) 00:45
      451 Re^5: 要因分析・ロジスティック回帰におけるダミー変数の扱いについて  青木繁伸  2003/05/23 (金) 01:19


442. 要因分析・ロジスティック回帰におけるダミー変数の扱いについて  谷川  2003/05/22 (木) 23:05
以前この掲示板でお世話になりました。
またまた,質問させていただきたいのですが,,

たとえば,携帯電話の解約,機種変,継続それぞれの状態の顧客の情報,機種名・利用期間・利用料金があるとします。
解約なら解約の要因(不満度),機種変なら機種変した人の要因(不満度),継続であれば継続している要因(満足度)を計りたい場合,それぞれのカテゴリー変数をダミー変数に置き換えて,数量化I類(回帰分析)で行うのは,筋はあっていますでしょうか?

また,ロジスティック回帰を用いて解約率を計りたい場合に,独立変数の定性変数をダミー変数化して,ステップワイズを行った場合,ダミー変数の偏回帰係数の意味はどうとらえればよいのか,どなたかご教授いただければ幸いです。

     [このページのトップへ]


444. Re: 要因分析・ロジスティック回帰におけるダミー変数の扱いについて  青木繁伸  2003/05/22 (木) 23:16
> また,ロジスティック回帰を用いて解約率を計りたい場合に,独立変数の定性変数をダミー変数化して,ステップワイズを行った場合,ダミー変数の偏回帰係数の意味はどうとらえればよいのか,

どうとらえればよいのかとは,どういう答えを期待しているのでしょう。
ここ30発言以内にあると思いますが,ダミー変数を作る際に,どのカテゴリーを基準にしても同じ答えが出るのかという質疑・応答があります。
答えも書いてありますが,簡単に繰り返すと,
基準にしたカテゴリーの重みを0として,他のカテゴリーの重みはそれとの相対関係で決まります。A,B,C という3カテゴリーで,A を基準としたとき,B=3, C=5 とかいう結果になったら,A のときは従属変数には寄与がないが,B の場合には3,Cの場合は5の増加がありますということです。
数量化I類のときの解釈と同じでしょう。

     [このページのトップへ]


443. Re: 要因分析・ロジスティック回帰におけるダミー変数の扱いについて  青木繁伸  2003/05/22 (木) 23:11
> 以前この掲示板でお世話になりました。
> またまた,質問させていただきたいのですが,,
>
> たとえば,携帯電話の解約,機種変,継続それぞれの状態の顧客の情報,機種名・利用期間・利用料金があるとします。
> 解約なら解約の要因(不満度),機種変なら機種変した人の要因(不満度),継続であれば継続している要因(満足度)を計りたい場合,それぞれのカテゴリー変数をダミー変数に置き換えて,数量化理論I類(回帰分析)で行うのは,筋はあっていますでしょうか?

この後に,自分で,ロジスティック回帰のことを書いているので,特に数量化I類を取り上げているのも理由があるのでしょうね。
上に書いているところでは,従属変数がなんなのかがはっきりしないので,何ともいえません。外的基準が二値変数ならロジスティック回帰,それ以外の連続変数なら数量化I類でいいでしょう。

     [このページのトップへ]


447. Re^2: 要因分析・ロジスティック回帰におけるダミー変数の扱いについて  谷川  2003/05/23 (金) 00:05
夜遅くに早速ご回答いただきありがとうございます。
説明が下手ですみません。

ロジスティック回帰で解約率を算出したいとおもっています。
(解約する人が1,継続は0)
で,定性変数は次のようにダミー変数化しています。
例えば,利用期間という変数には1年未満・1年〜2年・2年以上という
3つの項目があり,それぞれをダミー変数を用いて
X1 X2
 0   0
 1   0
 0   1
とふっています。
また,別の定性変数の,企業という変数にはA社・B社・C社・D社という4つの項目があり,それぞれをダミー変数を用いて
Y1  Y2  Y3
 0   0   0
 1   0   0
 0   1   0
 0   0   1
としています。
聞きたいのは,このすべてのダミー変数を対象に変数選択した結果,仮にX1とY1が選ばれたとします。このときのそれぞれのオッズ比の意味や,利用期間・企業といった定性変数の解約率に対する影響度というものをどのように解釈してよいのか想像できないんです。

     [このページのトップへ]


448. Re^3: 要因分析・ロジスティック回帰におけるダミー変数の扱いについて  青木繁伸  2003/05/23 (金) 00:22
> 聞きたいのは,このすべてのダミー変数を対象に変数選択した結果,仮にX1とY1が選ばれたとします。このときのそれぞれのオッズ比の意味や,利用期間・企業といった定性変数の解約率に対する影響度というものをどのように解釈してよいのか想像できないんです。

基本的には,変数選択によりあるカテゴリーが選択・棄却された場合,そのカテゴリーが含まれる変数が含むカテゴリーも一緒に選択・棄却すべきです。
ですから,x1 だけが選ばれると言うことはあり得ないのです。

     [このページのトップへ]


449. Re^4: 要因分析・ロジスティック回帰におけるダミー変数の扱いについて  谷川  2003/05/23 (金) 00:45
> 基本的には,変数選択によりあるカテゴリーが選択・棄却された場合,そのカテゴリーが含まれる変数が含むカテゴリーも一緒に選択・棄却すべきです。

ごめんなさい,この文の意味がわからないのですが,あるカテゴリーというのはこの場合でいう(先ほどの例)何を示すのでしょうか?
あるカテゴリーが選択・棄却された場合,そのカテゴリーが含まれる変数が含むカテゴリーも一緒に選択・棄却すべき,という説明では,結局変数選択してる意味がないように思うのですが,,,

     [このページのトップへ]


451. Re^5: 要因分析・ロジスティック回帰におけるダミー変数の扱いについて  青木繁伸  2003/05/23 (金) 01:19
> > 基本的には,変数選択によりあるカテゴリーが選択・棄却された場合,そのカテゴリーが含まれる変数が含むカテゴリーも一緒に選択・棄却すべきです。
>
> ごめんなさい,この文の意味がわからないのですが,あるカテゴリーというのはこの場合でいう(先ほどの例)何を示すのでしょうか?

x1,x2 はセットで,y1,y2,y3 もセットで選択されたり除外されたりするべきであるということです。
重回帰分析プログラムを使ってダミー変数の選択・除外をすると,カテゴリーのセット単位での選択・除外ができません。変数の選択・除外アルゴリズムから言うとちょっと変なことが生じるのです。

> 結局変数選択してる意味がないように思うのですが,,,

アイテム変数とカテゴリー変数と言う用語の使い方で言うと,選択の対象とすべきはアイテム変数であって,その構成要素であるカテゴリー変数ではないと言うことです。
x1 が選ばれたとすると,それを含むアイテム変数が選択され,そのアイテム変数が含むカテゴリー変数は一括して(x1 は当然として x2も!)選択され,y2 が不要となれば,同じアイテム変数に含まれる y1 も y3 も共に捨てるということです。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 024 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る