★ 回帰分析のダミー変数 ★

 100 回帰分析のダミー変数  さわこ  2000/06/16 (金) 17:07
  103 Re: 回帰分析のダミー変数(その1)  sb812109  2000/06/16 (金) 21:29
   106 Re^2: 回帰分析のダミー変数(その1)質問その2  さわこ  2000/06/17 (土) 09:16
    108 Re^3: 回帰分析のダミー変数(その1)質問その2  sb812109  2000/06/17 (土) 22:05
    107 Re^3: 回帰分析のダミー変数(その1)質問その2  sb812109  2000/06/17 (土) 22:01
   105 Re^2: 回帰分析のダミー変数(その1)  さわこ  2000/06/17 (土) 02:15
    109 Re^3: 回帰分析のダミー変数(その1)  sb812109  2000/06/17 (土) 22:07
  102 Re: 回帰分析のダミー変数(その2)  sb812109  2000/06/16 (金) 21:28
   104 Re^2: 回帰分析のダミー変数(その2)  さわこ  2000/06/17 (土) 02:03
    110 Re^3: 回帰分析のダミー変数(その2)  sb812109  2000/06/17 (土) 22:08
     113 Re^4: 回帰分析のダミー変数(その2)  さわこ  2000/06/18 (日) 16:45
      114 Re^5: ありがとうございました  さわこ  2000/06/18 (日) 19:25


100. 回帰分析のダミー変数  さわこ  2000/06/16 (金) 17:07
回帰分析で,下記のように,説明変数になっている変数を用いてダミー変数化しても良いでしょうか?何かヒントをいただければ幸いです。

Y: 業績(連続量)
帰属意識(連続量)
コンピュータ利用時間(連続量)
D(ダミー変数):
帰属意識の水準A以上の時0
帰属意識の水準A未満の時1

Y=α+β×コンピュータ利用時間+γ×帰属意識+δ×D×コンピュータ利用時間

上記で回帰分析した結果,βは,有意な正の値,δは,有意な負の値でした。
β+δは,負の値でした。
「帰属意識A以上では,Y(業績)とコンピュータ利用時間の関係が正である。一方,帰属意識がA未満では,Y(業績)とコンピュータ利用時間の関係が変化し,負の関係になる。」と言えるでしょうか?

注)水準Aで,Y(業績)とコンピュータ利用時間の関係に質的な変化があることは既にわかっています。

     [このページのトップへ]


103. Re: 回帰分析のダミー変数(その1)  sb812109  2000/06/16 (金) 21:29
(1)交互作用のモデルへの組み込みについて
変数を以下のように定義します。

   Y: 業績(連続量)
comp: コンピュータ利用時間(連続量)
dumm: 帰属意識(dumm==1 高い,dumm==0 低い)

   ここで交互作用を含むモデルを考えます。
   Y = α + β*comp + γ*dumm + δ*dumm*comp

   交互作用を含むモデルの場合,交互作用項を構成する変数dummおよびcompは,必ず単独でもモデルに含まれている必要があります(これを Hierachically Well-Formulatedと云います)。さわこさんのモデルは,HWFモデルになっていない様です。

   HWFを満たしていないモデルは,回帰係数がダミー変数のコーディングに依存してしまいます。帰属意識を0,1ではなく,1,2とコーディングすると回帰係数が違ってきませんか?

     [このページのトップへ]


106. Re^2: 回帰分析のダミー変数(その1)質問その2  さわこ  2000/06/17 (土) 09:16
心理学では,2)のように,交互作用項が2変数共に連続量の論文も見られます。

1)Y = α + β*comp + γ*dumm + δ*dumm*comp
2)Y = α + β*comp + γ*帰属意識(連続量) + δ*帰属意識(連続量)*comp

交互作用項が連続量の場合とダミー変数の場合の違いが,良くわかりません。
直感的には,下記のように思われますが,正しいでしょうか?

1)ダミー変数:
「交互作用がある点から非連続的に起こるモデル」
「どの水準で交互作用が起こっているかはわかっていない場合に使うモデル」
2)両方連続量:
「交互作用が連続的に起こるモデル」
「どの水準で交互作用が起こっているかわかっている場合に使うモデル」

1)より2)の方が「決定係数」も「自由度調整済み決定係数」がやや高かったのです。しかし,非連続的な現象であるという主張に沿った1)を選びたいのですが,やはり,決定係数で決めるべきでしょうか?

注)連続量同士を単純に掛けると,多重共線性が発生。下記に従い,それぞれの平均を引いたもの同士を掛けました
Cronbach(1987) "Statistical Tests for Moderator Variables",Psychological Bulletin, Vol.102,No.3,

     [このページのトップへ]


108. Re^3: 回帰分析のダミー変数(その1)質問その2  sb812109  2000/06/17 (土) 22:05
(1)2つのモデルの比較
   モデル0:Y = α
   モデル1:Y = α + β*x1
モデル2:Y = α + β*x1 + γ*x2 + ,,,

決定係数は,モデル0,1,2の順に1に近づいて行きます。2つのモデルが統計学的に有意な差があるかを検定するには,sequential F-testあるいは,AIC等がありますので,そちらを参考にして下さい。ただ単に,決定係数が大きい,小さいでモデルの選択をすべきでないと思います。
   連続量をカテゴリー量に変換すれば,情報を失いますので,決定係数が小さくなるのは不思議ではありません。

(2)連続量同士の交互作用
   
   Y = α + β*comp + γ*帰属意識 + δ*帰属意識*comp
ただし帰属意識は連続量

   統計学的には問題はありません。ただ回帰係数δの解釈はどうなるのでしょうか。私は統計の研究者ではなく,データ解析の手段として統計を使っていますので,モデルとしての完成度の高さと,解釈の容易さとが衝突する場合,解釈の容易さを優先しています。つまり,言葉に翻訳出来ないモデルは,”私にとっては”良いモデルではありません。

     [このページのトップへ]


107. Re^3: 回帰分析のダミー変数(その1)質問その2  sb812109  2000/06/17 (土) 22:01
(3)なぜ連続量をカテゴリー量(ダミー変数)に変換するのか
   幾つか理由がありますが,その中の1つに連続量より直感的に分かりやすい点が挙げられます。
   もし,サンプルサイズに余裕があるようでしたら,tertile analysis(3分割解析?)を試みて下さい。帰属意識を百分位点(33.3%, 66.6%)によって3つに分けます。それぞれ,帰属意識不良群,普通群,良好群と呼び,ダミー変数で表現します。実績を縦軸に,コンピュータ利用時間を横軸にとり,3本の回帰直線を引きます。それぞれの傾きが不良群<普通群<良好群と次第に大きくなる傾向を見せれば,交互作用があることを強く印象付ける結果となります。

     [このページのトップへ]


105. Re^2: 回帰分析のダミー変数(その1)  さわこ  2000/06/17 (土) 02:15
いつもありがとうございます。よろしくお願いします。

> (1)交互作用のモデルへの組み込みについて
> 変数を以下のように定義します。
>
>    Y: 業績(連続量)
> comp: コンピュータ利用時間(連続量)
> dumm: 帰属意識(dumm==1 高い,dumm==0 低い)
>
>    ここで交互作用を含むモデルを考えます。
>    Y = α + β*comp + γ*dumm + δ*dumm*comp
>
>    HWFを満たしていないモデルは,回帰係数がダミー変数のコーディングに依存してしまいます。帰属意識を0,1ではなく,1,2とコーディングすると回帰係数が違ってきませんか?

ご指摘のとおり,帰属意識を0,1ではなく,1,2とコーディングすると回帰係数が違ってきました。

質問1
最終的には帰属意識の入った回帰式を求めたいと思います。
下記のように,帰属意識(連続量)を説明変数に入れても,良いでしょうか?

 Y = α + β*comp + γ*dumm + δ*dumm*comp +ε*帰属意識

質問2
γはt検定で5%有意でなくても,残しておいた方が良いでしょうか?

以上です

     [このページのトップへ]


109. Re^3: 回帰分析のダミー変数(その1)  sb812109  2000/06/17 (土) 22:07
(質問2)

Y: 目的変数
x1, x2: 説明変数とし,x1とx2の交互作用を含んだモデルを考え
ます。
Y = α + β*x1 + γ*x2 + δ*x1*x2   (HWF: 満たす)
Y = α +       γ*x2 + δ*x1*x2   (HWF: 満していない)
Y = α + β*x1         + δ*x1*x2   (HWF: 満していない)
交互作用の項にx1,x2を含んでいますので,HWFであるためにはx1, x2の項は回帰係数が統計学的有意に関係なくモデルに含まれている必要があります。


(質問1)

Y = α + β*comp + γ*dumm + δ*dumm*comp + ε*帰属意識

HWFになっています。しかし,帰属意識(連続量)と帰属意識(ダミー変数)が同じモデルに入っていますので,回帰係数の解釈は極めて困難だと思います。

     [このページのトップへ]


102. Re: 回帰分析のダミー変数(その2)  sb812109  2000/06/16 (金) 21:28
(2)交互作用を含むモデルの回帰係数の解釈について
   (イ)層別化
      帰属意識の違いによりデータを2つのデータセットに分けて解析。つまり,データを分けることにより,交互作用を含まないモデルとして解析する。直感的に分かりやすいのでよく利用します。
   (ロ)あくまで交互作用を含むモデルに拘る
      以下のモデルにおいて,
      Y = α + β*comp + γ*dumm + δ*dumm*comp
      帰属意識の高い群の実績: Y(dumm=1)
    帰属意識の低い群の実績: Y(dumm=0)を求め,
      縦軸に,Y(dumm=1) - Y(dumm=0)を横軸に,compをとり,グラフを描きます。すると,回帰係数γとδの意味がよく分かると思います。

     [このページのトップへ]


104. Re^2: 回帰分析のダミー変数(その2)  さわこ  2000/06/17 (土) 02:03
いつも誠にありがとうございます。

下記で,できれば,帰属意識も含めた式を(最終的には)導きたいのですが,帰属意識を説明変数に入れても良いでしょうか?

> (2)交互作用を含むモデルの回帰係数の解釈について
>    (イ)層別化
>       帰属意識の違いによりデータを2つのデータセットに分けて解析。つまり,データを分けることにより,交互作用を含まないモデルとして解析する。直感的に分かりやすいのでよく利用します。

     [このページのトップへ]


110. Re^3: 回帰分析のダミー変数(その2)  sb812109  2000/06/17 (土) 22:08
1.帰属意識により層別化されたデータによる解析

(1)帰属意識が高い群
   Y = α' + β'*comp
(2)帰属意識が低い群
Y = α'' + β''*comp において

それぞれ,β'>0,β''==0(あるいはβ''<0)となるのではないでしょうか(β',β''は推定値)。
帰属意識により層別化するわけですから,帰属意識はモデルには入りません。

2.交互作用を含むモデルによる解析

解析から次の回帰式が得られたとします。
Y = α' + β'*comp + γ'*dumm + δ'*dumm*comp
(α',β',γ',δ'は,それぞれ推定値)

帰属意識の高い群の実績をY(dumm=1),低い群の実績をY(dumm=0)とすると,次の2式が得られます。
Y(dumm=1) = α' + β'*comp + γ' + δ'*comp
Y(dumm=0) = α' + β'*comp
ここで,帰属意識の高い群と低い群の実績の差を求めると,次の関係式が得られます。
Y(dumm=1) - Y(dumm=0) = γ' + δ'*comp

     [このページのトップへ]


113. Re^4: 回帰分析のダミー変数(その2)  さわこ  2000/06/18 (日) 16:45
本当に,ありがとうございました。
帰属意識の高い群と低い群の実績の差を求める意味がようやくわかってきました。
「帰属意識による業績の違いは,コンピュータ利用時間が多くなるほど大きくなる」という別の知見を表すことができると思います。
2変数の交互作用には,2とおりの見方ができると理解しました

     [このページのトップへ]


114. Re^5: ありがとうございました  さわこ  2000/06/18 (日) 19:25
まことにありがとうございました。深く御礼申し上げます。
交互作用について,何か参考になる本があれば教えてください。
また,Hierachically Well-Formulatedに該当する日本語はあるでしょうか?

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 008 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る