No.03881 基本的な質問で恐縮ですが  【しきしま】 2007/07/12(Thu) 00:14

現在経済学学部で統計を利用した卒業論文を作成しているものです。
ちなみに文系コース出身で高校数学も危うい状態なので,大変基本的な質問かと思いますがどうぞご容赦ください。
論文で外国人労働者と日本人の所得格差について重回帰分析をすることになりました。
所得を被説明変数に設定する場合は,所得変数をそのまま変数として使わず,自然対数に直さなければならないのでしょうか。
自然対数の基本的な概念については学んだのですが,この概念と,今直面しているこの所得変数の変換がどのようにつながっているのか,ということについてどうしても理解ができません。
大変お手数かけますが,ご教授いただけると幸いです。

No.03882 Re: 基本的な質問で恐縮ですが  【青木繁伸】 2007/07/12(Thu) 00:41

y=ax^b というモデルと y = ab^x というモデルの違いを考えましょう
両辺の対数を取ると,log(y) = log(a)+b*log(x) というのと,log(y) = log(a)+log(b)*x となりますね。非説明変数は共に対数を取ることになりますが,説明変数は前者は対数を取るが,後者はそのまま。
経 済学では前者の複雑バージョンとして v = κ * x^α * y^β * z^γ なんてモデルがあって,これを両辺対数を取って,log(v) = α*log(x) + β*log(y) + γ*log(z)+κ みたいにして,重回帰分析するというのが常套手段のようだ。
後者の複雑バージョンは故障時間分析で出てくる y = κ * α^x * β^y * γ^z = exp(ax+by+cx+d) みたいなのがある。

結局,非説明変数,説明変数に限らず,対数を取る取らないは単に「とろうかな?どうしようかな?」ということではなく,元々のモデルから必然的に対数を取る必要があるかどうかということなんですね。(非線形最小二乗法なら対数なんか取らなくて良い)

単に線形モデルで良いなら,y=a+bx でいいわけだ。また,たぶん y = a+b*log(x) というのは,理論モデルとしては不自然(無いとは言わないが)なだけ。

No.03883 Re: 基本的な質問で恐縮ですが  【しきしま】 2007/07/12(Thu) 01:18

青木先生,お忙しい中ご回答いただきどうもありがとうございました。
今ほぼ独学で統計をやっている状況なので,この掲示板にはいつも助けられています。
これからもまたお邪魔させていただきます。

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る