★ 回帰分析における独立変数と従属変数 ★
1499. 回帰分析における独立変数と従属変数 真坂一彦 2003/12/24 (水) 11:24
└1543. Re: 回帰分析における独立変数と従属変数 冨田雅一 2003/12/29 (月) 12:46
└1615. Re^2: 回帰分析における独立変数と従属変数 真坂一彦 2004/01/06 (火) 15:05
└1680. Re^3: 回帰分析における独立変数と従属変数 冨田雅一 2004/01/09 (金) 00:11
1499. 回帰分析における独立変数と従属変数 真坂一彦 2003/12/24 (水) 11:24
林学や林業の分野では,形状比という言葉がよく使われます。形状比とは,木の高さである樹高を幹の直径で割った値で,木の細りの程度を表す指標です。同じ樹齢の木々で構成される人工林などでは,一般的な傾向として,被圧されて樹高が低い,または直径が小さい個体の形状比は高い傾向にあります。適切に管理されずに放置された林でも,平均形状比は高い傾向にあります。このような傾向を,横軸に直径か樹高,縦軸に形状比,または,横軸に林齢(人工林が植栽されてからの年数),縦軸にその林の平均形状比というように散布図を作って表現します。しかし,従属変数であるはずの形状比には,独立変数であるはずの直径や樹高という変数が含まれています(林齢は樹高や直径と相関がある)。教えていただきたいのは,上述のような散布図の作成や回帰分析は,やはり間違っているのでしょうか?もし,間違っているならば,他に表現のしようがあるのでしょうか,ということです。よろしくお願いします。
|
[このページのトップへ]
1543. Re: 回帰分析における独立変数と従属変数 冨田雅一 2003/12/29 (月) 12:46
> このような傾向を,横軸に直径か樹高,縦軸に形状比,または,横軸に林齢(人工林が植栽されてからの年数),縦軸にその林の平均形状比というように散布図を作って表現します。
回帰分析は,従属変数と独立変数の関係を直線的に説明したり,その直線的な関係の強さを数値で表したりする分析です。回帰係数の計算に先立ち散布図を描いて変数間の関係を視覚的に把握しておくことは大切だと思います。散布図で一定の傾向が認められれば,回帰分析をして構わないと思います。ただし,単純に2変数間の関係なら相関係数を調べればよいでしょう。というのは,回帰分析は独立変数と従属変数の間に因果関係があるという理論(仮説)の実証的裏付けのためのものです。
> しかし,従属変数であるはずの形状比には,独立変数であるはずの直径や樹高という変数が含まれています(林齢は樹高や直径と相関がある)。
形状比(=樹高/直径)を直径で説明するモデルは,つまり,樹高を直径の二乗で説明するものであり,幹が太い(断面積が大きい)ほど背丈も高いということではないでしょうか。次に,形状比(=樹高/直径)を樹高で説明するモデルは,つまり,形状比は直径に反比例するということに帰着するのではないでしょうか。もし樹高の高い樹木ほど形状比が大きいないし小さいということをいいたければ,両変数の対数をとって形状比の樹高弾力性を測定すればいかがでしょう。最後に,林齢は樹高や直径と相関があるということですが,林齢を説明する変数としての樹高と直径の間に高い相関がある場合,これらを使って林齢を推定しようとすると多重共線性を来たすことがあります。
|
[このページのトップへ]
1615. Re^2: 回帰分析における独立変数と従属変数 真坂一彦 2004/01/06 (火) 15:05
富田様 ご返答ありがとうございます。
今回の質問と同様な指摘はしばしば受けており,かといって指摘した人からは,理論的な裏付けがある説明はまったくされないという状況で,しばしば困っています。説明を求めても,たいていは,「そういう話を聞いたことがあるから」というものです。他にも,同様な問題を抱えているものとして,「密度依存的な死亡率」や「性比配分戦略」があげられます。一般に植物では,密度が高まれば死亡率が高まります。死亡率の計算の際の分母は密度です。また親の手持ちの資源を雌の子・雄の子に振り分ける性比配分戦略も,一般には横軸に資源量,縦軸には子の性比をとりますが,性比を計算する際の分母は資源量です。冨田様の説明のように,形状比ならば「樹高を直径の二乗で説明するものであり,幹が太い(断面積が大きい)ほど背丈も高い」といえば何となく「そうか,なるほど」と思えますが,同様な説明を上の2例に対して行うことはできそうにありません。これについては他の例として,野ネズミの生息密度(=捕獲数/生息地の森林面積)と生息地の森林面積の関係,という研究論文で,ネズミの捕獲数と森林面積の二乗との相関分析をした,というのはみたことがありますが,結局,なぜ森林面積の二乗なんですか?という質問が出た際,答えられないのが現状です。いずれにせよ理論式(初期モデル)は等式ゆえ,「変数」がなんであるかに拘らなければ確かに「元の従属変数の分子」=a*「独立変数」^2+b*「独立変数」というモデルは作られるのでしょうが,その方法が良いのか悪いのか,理論的な背景が分からず判断しようがありません。個人的には,クレームがついた際には「これは慣例。視覚的・直感的に理解しやすいからいいじゃないか。ダメな理由を説明できないなら黙っててくれ」と言いたいのですが・・・。とりあえず,しばらくはまだ悩まなければならない状態が続きそうです。
|
[このページのトップへ]
1680. Re^3: 回帰分析における独立変数と従属変数 冨田雅一 2004/01/09 (金) 00:11
> 理論式(初期モデル)は等式ゆえ,「変数」がなんであるかに拘らなければ確かに「元の従属変数の分子」=a*「独立変数」^2+b*「独立変数」というモデルは作られるのでしょうが,その方法が良いのか悪いのか,理論的な背景が分からず判断しようがありません。
理論的に意味のある(「視覚的・直感的に理解しやすい」)変数で回帰分析するのが最善でしょう。それをあえて等式変形するのは,残差に不均一分散が認められるから,不均一分散を取り除くためではないのでしょうか。
|
[このページのトップへ]
● 「統計学関連なんでもあり」の過去ログ--- 027 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る