No.03074 Re: 差分情報による重回帰分析 【青木繁伸】 2007/03/27(Tue) 18:53
A-B という差をとるということですから,A も B も似たような性質を持つ変数で,平均値や分散もほぼ等しいということでしょうか??
あなたを疑うわけではないですが,追試できるデータがあればなんとかコメントも付くかも知れませんね。
全データを呈示してくださいというわけではなく,小規模なデータで同じ現象が発生するデータがあれば一番良いですが。
なかなかそうも行かないと言うことでしたら,ケース数と,A,B,C の平均値と標準偏差(なるべく有効桁数を多く)と,A:B, A:C, B:C 間の相関係数(これも有効桁数を多く)が分かれば,追試データを作ることはできますが。
No.03075 Re: 差分情報による重回帰分析 【HAL】 2007/03/27(Tue) 20:53
早速のご返信ありがとうございます。A,Bは仰るとおり類似の意味合いを持つ変数です。以下にデータの概要を記載致します。
ケース数:114
説明変数A 平均-0.024475,標準偏差0.069671
説明変数B 平均-0.008334,標準偏差0.062076
被説明変数C 平均0.007133,標準偏差0.134402
ピアソン相関係数A:B 0.019286
ピアソン相関係数A:C 0.253822
ピアソン相関係数B:C -0.222206
以上のようなデータでよろしいでしょうか?
よろしくお願い致します。
No.03076 Re: 差分情報による重回帰分析 【青木繁伸】 2007/03/27(Tue) 21:26
たぶん,以下のようになっているのだと思います偏回帰係数 標準誤差 t 値 P 値 標準化偏回帰係数 トレランス
A 0.49809917 0.17218458 2.892821 0.004595983 0.2582035 0.999628
B -0.49188437 0.19325137 -2.545309 0.012290897 -0.2271857 0.999628
定数項 0.01522461 0.01280425 1.189028 0.236965933
偏回帰係数 標準誤差 t 値 P 値 標準化偏回帰係数 トレランス
A 0.00621480 0.25633990 0.02424437 0.98070121 0.003221614 0.4510187
D 0.49188437 0.19325137 2.54530859 0.01229090 0.338222862 0.4510187
定数項 0.01522461 0.01280425 1.18902837 0.23696593
偏回帰係数 標準誤差 t 値 P 値 標準化偏回帰係数 トレランス
B 0.00621480 0.25633990 0.02424437 0.980701215 0.002870418 0.5681345
D 0.49809917 0.17218458 2.89282098 0.004595983 0.342496198 0.5681345
定数項 0.01522461 0.01280425 1.18902837 0.236965933
まず,追加の情報を見て思ったことは,「A,Bは仰るとおり類似の意味合いを持つ変数です」といいながら,
> ピアソン相関係数A:B 0.019286
> ピアソン相関係数A:C 0.253822
> ピアソン相関係数B:C -0.222206
に なっているところです。類似の意味合いを持つかも知れませんが,AとBの相関はほとんど無いし,AとBは,C に対して逆の意味を持っているし,これでは,最初の質問にあったように,A や B よりも D=A-B が C とより強い関連をもっても仕方ないでしょう。実際,D と C の相関は 0.3406099 ほどで(あなたも,自分のデータで計算してみてください,私の計算結果と少し違うかも知れません),見て分かるように A:C よりも B:C よりも強い相関になっています。
A と B が意味的に類似しているという先入観を捨てて,なぜ相関係数がこんな風になっているのかを究明した方がよいでしょう。
いきなり重回帰分析をしたり,相関係数を求めたりする前に,散布図などを描いてみることをお勧めします。
No.03077 Re: 差分情報による重回帰分析 【HAL】 2007/03/27(Tue) 23:16
ご返信ありがとうございます。
AとBは,対となる個体の,同じ意味合いを持つ変数ですが,被説明変数Cに対しては逆の効果を持つことは分かっています。言葉が足りず申し訳ありません。
こ のような場合,上記のような結果になるということですね。この結果は,統計的な手法として問題がなければ,当初想定していた仮説と整合しています。AやB よりもDがCと強い関連を持っているということになるわけですね。DとCの相関係数については,ご指摘のような結果が得られています。
アドバイス,ありがとうございました。
No.03078 Re: 差分情報による重回帰分析 【青木繁伸】 2007/03/27(Tue) 23:42
もう少し結果をよくご覧になると良いと思います。
A,B そしてその差 D=A-B ですが,C を予測するのに A,B を使うのと, A,D を使うのと,B,D を使うのであっても,C を予測するのに使われる情報は,全く同じなんですよ。新しい情報はない。A,B で C を予測
C=0.49809917*A-0.49188437*B+0.01522461
A,D で C を予測
C=0.00621480*A+0.49188437*D+0.01522461
=0.00621480*A+0.49188437*(A-B)+0.01522461
=0.4980992*A-0.49188437*B+0.01522461
B,D で C を予測
C=0.00621480*B+0.49809917*D+0.01522461
=0.00621480*B+0.49809917*(A-B)+0.01522461
=0.49809917*A-0.4918844*B+0.01522461
全部同じことを言っているだけ。
A, B は C に対して同じくらいの影響力を持っている,ただ,関係は逆になっているので回帰係数の符号も逆になっている。
A,B が逆方向に働くので,A-B という変数を作ってやると同じ方向に働くほぼ2倍の影響力を持つ変数ができる。
それと同時に使われる変数は,引き算の結果,小さな回帰係数しか持てない。
D が A,B より大きな説明力を持っているように見えるのは,A:C, B:C の相関関係が逆であるためにすぎない。当たり前といえば当たり前のことなんですね。
No.03079 Re: 差分情報による重回帰分析 【HAL】 2007/03/28(Wed) 00:09
上記の数式は私も計算し,確認しております。AとB,AとD,BとDを用いたいずれの推計も基本的に同じであり,新たな情報内容を含まないことも了解しております。
問 題なのは,AがCに対する,またはBがCに対するよりも,DがCに対して強い関係性を持っていると言って良いのかどうかです。上記のご指摘ですと,D=A -Bという関係であり,AとBはCに対して逆の効果を持つことから,Cとの関連性はAよりDの方が大きい,あるいはBよりDの方が大きいとは言えないとい うことですね?
できの悪い生徒で申し訳ありません。
No.03080 Re: 差分情報による重回帰分析 【青木繁伸】 2007/03/28(Wed) 08:05
答えは出ていると思いますので
蛇足です。E=A+B を作って,A と E で C を予測する重回帰式は,偏回帰係数 標準誤差 t 値 P 値 標準化偏回帰係数 トレランス
A 0.98998354 0.26129887 3.788702 0.0002464392 0.5131854 0.4340621
E -0.49188437 0.19325137 -2.545309 0.0122908973 -0.3447659 0.4340621
定数項 0.01522461 0.01280425 1.189028 0.2369659325
● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る