No.07872 以下の場合も重回帰分析は使えますか?  【魚】 2008/10/08(Wed) 17:59

 先日,魚の調査をしている友人から「魚の生息数を予測する方法」について相談を受けました。調査地は,一本の河川から枝 分かれした複数の支流で,支流ごとにどれくらい魚が生息しているかを予測したいそうです。サンプリング地点は各支流に1地点づつ合計60地点あったので, 基本的には,捕れた魚の数を従属変数とする重回帰分析が適用できると思います。
 しかし,サンプリング方法が一般的なコドラート調査(例えば5m×5mの方形区)ではなく,5m×川幅(最小0.5m〜最大10m)で行われたため,サンプリング面積が一定ではなく,最大で20倍も異なる点に問題を感じております。
 ここで質問なのですが,上述のようにサンプリング面積が大きく異なる場合でも,統計学的な解析手法を用いることができるのでしょうか?また,重回帰分析を用いるためには,サンプリング面積の違いをどのように克服したらよいでしょうか?
  このような問題が生じてしまったのは,魚の調査ならではの苦悩があります。魚の場合は,コドラートを設置している間に魚が逃げてしまうため,川幅に合わせ て網を設置する以外に良いサンプリング方法はありません。苦労して調査をしている友人のためにも,皆様良きアドバイスをお願い致します。

No.07874 Re: 以下の場合も重回帰分析は使えますか?  【kai】 2008/10/08(Wed) 18:27

サンプリング面積が異なることを考慮する一つの方法として,面積あたりの生息数に計算しなおすという方法はありなのではないでしょうか?

No.07875 Re: 以下の場合も重回帰分析は使えますか?  【ひの】 2008/10/08(Wed) 18:47

 個体数推定の方法なら生態学の教科書にいろいろ載っていると思いますけれど,「予測」ですか?予測というのは将 来のある時点での事象を推定する作業になりますから時間に伴う変化についての何らかのデータが必要だと思います。しかし,お話の中にはそれらしいデータは ありませんね。

No.07876 Re: 以下の場合も重回帰分析は使えますか?  【青木繁伸】 2008/10/08(Wed) 18:55

> No. 7875

推定ということでしょうけどね

No.07879 Re: 以下の場合も重回帰分析は使えますか?  【魚】 2008/10/08(Wed) 22:19

皆様,早速の返信ありがとうございます!!
>No. 7874 面積あたりの生息数(=密度)に直す方法も一つの手段と考えました。ただ,本当に密度に直すだけで良いのかどうかの判断ができなくて困っており ます。主要な理由は2つあります。1つ目は,仮に密度に直して重回帰分析を行うことがOKであるのなら,同様の方法を用いた報告があると思うのですが,実 際には目にしたことがないことです。(もし,論文などの情報をご存じでしたら教えて頂けると助かります。) 2つ目は,魚の生息数(従属変数)は密度に直 すことで「サンプリング面積の違いを考慮する」ことはできるのですが,同様の考慮は,実は「独立変数」にも必要なのではないかということです。今回測定し ている独立変数は水深や流速などですが,例えば,サンプリング面積が5m×川幅(0.5m)の地点で水深が1mの場合と,5m×川幅(3m)の地点で水深 1mの場合,水深は同じ1mでも,魚は前者よりも後者の環境が良いと判断すると思うのです。つまり,水深などの独立変数もサンプリング面積が異なること で,その効果が大きく歪んでしまっている可能性が高いです。
 以上のように,問題は沢山ありますが,同様の問題に直面し解決策を見いだしている方は必ずいると思います。私も引き続き解決策を模索していきますので,何か情報がありましたら引き続きご教授頂けると幸いです。

>No. 7875 今回は,まず,調査地内において魚の生息数推定モデルを構築し,そのモデルを広範囲に展開するという計画のようです。調査地内で作成するモデルは,従属変数を魚の個体数,独立変数を環境変数(流速など)とするようです。

>No. 7876 推定ということです。

No.07883 Re: 以下の場合も重回帰分析は使えますか?  【知ったかぶり】 2008/10/09(Thu) 09:40

魚の捕獲数は離散値ですから,正規分布を仮定する重回帰分析よりも一般化線形モデル(ポアソン分布を仮定)を適用 するべきだと思います.サンプリング条件の違いについては,サンプリング面積を独立変数としてモデルに組み込むことで対処できるのでは.注意するべき点 は,従属変数は「捕獲数」であって「生息数」ではないこと.捕獲効率が水深,流速,面積などによって異なると予想される場合は,捕獲数は生息数を反映して いるとは言えず,解析結果は意味を持ちません.

No.07891 Re: 以下の場合も重回帰分析は使えますか?  【魚】 2008/10/09(Thu) 16:32

>No. 7883 捕獲数は「連続値」ではなく「離散値」なので,一般化線形モデルを適用すべきなのですね。ご教授ありがとうございます。 「サンプリング面積を 独立変数としてモデルに組み込む」とは,サンプリング面積の違いを「従属変数で考慮する(捕獲数を密度に直すことを指します)」のではなく,「独立変数で 考慮する(サンプリング面積を変数として位置づけることを指します)」ということですよね?私も同じことを考えておりましたが,この場合,従属変数(捕獲 数)と独立変数(サンプリング面積)に「暗黙の関連性」(サンプリング面積が増えると捕獲数は増える)が生まれてしまい,モデル解析では問題となるとの指 摘を受けました。独立変数間が互いに「独立」でなければならないことは当然ですが,「従属変数」と「独立変数」においても互いに「独立」でなければならな いのでしょうか?良きアドバイスがありましたら宜しくお願い致します。
 今回の調査は,追い込みによる「全捕獲」なので,捕獲数が「生息数」を反映しております。また,全捕獲なので,水深・流速などによる捕獲効率の違いを考慮する必要はありません。

No.07903 Re: 以下の場合も重回帰分析は使えますか?  【知ったかぶり】 2008/10/10(Fri) 13:01

サンプリング面積の違いをどう扱うかについては,北大の久保先生の講義ノート
http://hosho.ees.hokudai.ac.jp/~kubo/ce/EesLecture2007.html#toc5
2007年第4回が参考になるかと思います.対象となっているのは植物ですが,調査区画の面積が異なる条件で個体密度を扱っている点は同じです.

http://homepage.mac.com/daichis/osjstat/osj.html
の「線形モデルにおけるDOs & DON'Ts」にはもう少し詳しく解説されています.

これらを読めばわかると思いますが,「サンプリング面積を独立変数としてモデルに組み込む」という表現は正しくありませんね.失礼しました.

No.07938 Re: 以下の場合も重回帰分析は使えますか?  【reini】 2008/10/13(Mon) 20:40

同様の研究をしているので,コメントさせてもらいます。
統計が詳しいわけではないので,あまり自信はありませんが…

総 捕獲数(あるいは除去法による推定個体数)を水表面積で割ることによって推定密度(またはその指標)とする方法は,河川生態学では常套手段だと思います。 むしろ,それ以外の方法ってあんまりない気がしますが…。河川性魚類と物理化学的環境の関係(特に区間スケール)を調べた論文を探してみてください。

私はとりあえず,正規分布していない変数を解析の前に対数変換・逆正弦変換しています。これもよく論文中で,「変数の正規性と分散の均一性という仮定に,より整合させるために…」というくだりで書かれていると思います。

そ れからNo.7879で例として出されていた環境条件の懸念がある場合,「(平均)水面幅」や「(平均)河道幅」などを独立変数に含めてはどうでしょう か。要するに魚が利用できる空間や河川そのもののサイズを評価する変数を加えるということです。ただ,上流域は河川内だけでなく,陸域(河畔林や流域)の 影響を多分に受けているので,研究を進める際にはそれらの考慮も必要だと思われます。たとえば,水面幅の増加は利用できる空間の増加を表すかもしれません が,河道幅の増加は,河川上空の樹冠被度を減少させ,河川内への日射量を増大させることによって,河川内の藻類による一次生産量を増加させているかもしれ ません。これらについては,場違いなのであまり述べませんが,サケ科魚類(日本ではサクラマスやオショロコマなど)の研究などを参考にしてください。

最 後に言葉の問題ですが,「全捕獲」は河川の魚類の研究では不可能だと思います。おそらく魚さんの表現の仕方だと,十分生息量を反映していると思いますが, 特に底生魚などを群集に含む場合,必ず取りこぼしてます。ですから,河川生態一般では「除去法による推定個体群密度」か「総捕獲数を水表面積で割ることで 算出される生息密度の指標としての変数」が使われていると思います。

No.07947 Re: 以下の場合も重回帰分析は使えますか?  【魚】 2008/10/14(Tue) 20:04

>No. 7903 とてもとても参考になる情報をありがとうございます。本当に助かりました!!
 初見のため全体を理解できた訳ではありませんが,今回の補正方法では「オフセット」という手法を用いているところがとても工夫されているようにように感じました。
参 考資料中(「線型モデルにおけるDos & Don’ts」)の式は,ln()の括弧内が「飛来個体数/ 田の面積」なので,元々の発想は「密度に直してサンプリング面積の相違を補正する」という従来の発想と同じですが,式の展開やオフセットを用いるところが とてもすばらしいですね。さらに熟読して理解を深めたいと思います。
 >「サンプリング面積を独立変数としてモデルに組み込む」という表現は正しくあり >ませんね。
 表現としては正しくはないですが,オフセットを用いた補正式を拝見したので,伝えたかったことはよく分かりました。

 ところで,サンプリング面積が異なる場合,その影響は,従属変数だけでなく独立変数にも影響しますよね?例えば,独立変数として「隠れ場所となる川底の石数」を測定した場合,同様に補正が必要と考えております。この場合の補正は,どのようにしたら良いでしょうか。
  補正方法としては,単に「密度」直す方法や,「交互作用項(石数とサンプリング面積の積)」として独立変数に組み込むなどが考えられます。個人的には,前 者は単に面積のちがいを補正しただけで,「面積の違いが他の測定変数(石数)にもたらす影響を考慮していない」のであまり適切ではないと考えております。 一方,後者は「サンプリング面積の違いが他の測定変数(石数)にもたらす影響を考慮している」ので,後者の方が適切ではないかと考えております。
 皆様はいかがお考えでしょうか。ご意見をお聞かせ下さい。

No.07948 Re: 以下の場合も重回帰分析は使えますか?  【魚】 2008/10/14(Tue) 20:37

>No. 7938 コメントありがとうございます。
 >総捕獲数(あるいは除去法による推定個体数)を水表面積で割ることによって推定 >密度(またはその指標)とする方法は,河川生態学では常套手段だと思います。
  「サンプリング面積が異なる」ということは,単なる面積の違いに止まらず,いろいろな問題を発生させてしまいます。個人的には,これらの問題を生じさせな いためにも,サンプリング面積は一定にすることが調査計画の大前提だと考えております。ただ,この前提を適用できない魚の調査に関しては,それなりの補正 が必要になると考えております。
 私も,サンプリング面積の違いを「密度」に直して補正することは「常套手段」と思っておりますが,それは,時と 場合によって使い分けなければならないと認識しております。今回は用いる解析は回帰分析であったので,より適切な方法が望ましいと判断し,今回のような質 問をさせて頂きました。

 >環境条件の懸念がある場合,「(平均)水面幅」や「(平均)河道幅」などを独立 >変数に含めてはどうでしょうか。要するに魚が利用できる空間や河川そのもののサ >イズを評価する変数を加えるということです。
 今回の場合「サンプリング面積が異なるため」,水面幅などを独立変数として組み込んだ場合,従属変数(捕獲数)と独立変数(水面幅)に「暗黙の関連性」(水面幅が増えると捕獲数は増える)が生まれてしまい,これは回帰分析では問題となるとの指摘を受けました。
 一方,「サンプリング面積が一定(例えば,1m×1m)」であれば,水面幅を「魚が利用できる空間や河川そのもののサイズを評価する変数」として,問題なく分析に取り入れることが可能です。
 このように,「サンプリング面積が異なるため」,いろいろと工夫が必要になってきております。引き続きアドバイスを宜しくお願い致します。

>最後に言葉の問題ですが,「全捕獲」は河川の魚類の研究では不可能だと思います。
「全捕獲」は適切な表現ではありません。Reiniさんの表現が適切だと思います。

No.07957 Re: 以下の場合も重回帰分析は使えますか?  【知ったかぶり】 2008/10/15(Wed) 16:20

>「サンプリング面積が異なるため」,水面幅などを独立変数として組み込んだ場合,従属変数(捕獲数)と独立変数(水面幅)に「暗黙の関連性」(水面幅が増えると捕獲数は増える)が生まれてしまい,これは回帰分析では問題となる

推 定密度を用いた重回帰分析にしろ,offset項を用いた一般化線形モデルにしろ,従属変数は単位面積当たりの生息数(の指標)ということになりますか ら,「暗黙の関連性」があるなら「水面幅が増えると生息密度が高くなる」ということになりますが.もしかしたらそういう現象もあるかもしれませんが,それ は「暗黙の」ものとは言えないでしょう.

>ところで,サンプリング面積が異なる場合,その影響は,従属変数だけでなく独立変数にも影響しますよね?

サンプリング面積ではなく,独立変数の調査方法が地点によって異なっていた場合でしょう.

>「交互作用項(石数とサンプリング面積の積)」として独立変数に組み込む

こ れは明らかにおかしい.仮りに石1個に魚1匹が生息可能で,生息数が石の存在に100%支配されているとして,地点Aは10平米の区画に石が10個(した がって魚は10匹),地点Bは20平米の区画に石が5個(魚は5匹)だとします.石数とサンプリング面積の積は,A,Bともに100ですが,生息密度は平 米あたり1頭と0.25頭.「密度」を使うのが普通でしょう.

No.07959 Re: 以下の場合も重回帰分析は使えますか?  【魚】 2008/10/15(Wed) 18:42

いつもご返答頂きありがとうございます。

>推定密度を用いた重回帰分析にしろ,offset項を 用いた一般化線形モデルにしろ,従属変数は単位面積当たりの生息数(の指標)ということになりますから,「暗黙の関連性」があるなら「水面幅が増えると生 息密度が高くなる」ということになりますが.もしかしたらそういう現象もあるかもしれませんが,それは「暗黙の」ものとは言えないでしょう.

 説明不足ですいません。上述(No. 7948)の事例では,従属変数を「生息数」として話を進めております。それは,今回の目的が「魚の生息数」を推定するモデルを構築するところに目的があるからです。
 従属変数を「単位面積当たりの生息数」とした場合は,異論ありません。「暗黙の」ものとは言えないと思います。
  一点ほど確認ですが,ご紹介頂いた「線形モデルにおけるDOs & DON'Ts」の事例では,式を展開した後の左辺が「ln(個体数)」」になっているので,offset項を用いた一般化線形モデルの従属変数は「単なる 個体数」が用いられ,「単位面積当たりの生息数(の指標)」に変換する必要がないように思うのですがいかがでしょうか。

>サンプリング面積ではなく,独立変数の調査方法が地点によって異なっていた場合でしょう.

 No. 7948での事例がよくなかったので,改めて「サンプリング面積が異なる場合,その影響は,従属変数だけでなく独立変数にも影響する」事例を記述致します。以下No. 7879からの抜粋です。
  「サンプリング面積が5m×川幅(0.5m)の地点で水深が1mの場合と,5m×川幅(3m)の地点で水深1mの場合,水深は同じ1mでも,魚は前者より も後者の環境が良いと判断すると思うのです。つまり,水深などの独立変数もサンプリング面積が異なることで,その効果が大きく歪んでしまっている可能性が 高いです。」
 尚,水深の測定はサンプリング地点の中心で行ったので,「独立変数の調査方法が地点によって異なった」ということはありません。
 この場合の補正方法として,「交互作用項(水深と川幅)」を独立変数に組み込むことを考えておりましたが,いかがでしょうか。改めてご意見をお聞かせ下さい。

>「交互作用項(石数とサンプリング面積の積)」として独立変数に組み込む

 No. 7948での事例がよくなかったです。この事例は忘れてください。
 因みに,この事例の場合は「交互作用項」として取り扱うことは間違っております。 本当にすいません。

No.07965 Re: 以下の場合も重回帰分析は使えますか?  【知ったかぶり】 2008/10/16(Thu) 09:42

>offset項を用いた一般化線形モデルの従属変数は「単なる個体数」が用いられ,「単位面積当たりの生息数(の指標)」に変換する必要がないように思うのですがいかがでしょうか。

ま た不適当な書き方をしてしまいましたが,従属変数は捕獲個体数そのものです.offset項を用いた場合は,いわば調査区画の面積を揃えてパラメータの推 定を行うことになりますので,その点では単位面積当たりの個体数に揃えてパラメータを推定する「推定密度を用いた重回帰分析」と同じ,ということです(こ の表現もなんだか適切ではない気がしますが).なお,一般化線形モデルをお薦めしましたが,研究の目的によっては重回帰分析の方が適している場合もあるか と思います.

>「サンプリング面積が5m×川幅(0.5m)の地点で水深が1mの場合と,5m×川幅(3m)の地点で水深1mの場合,水 深は同じ1mでも,魚は前者よりも後者の環境が良いと判断すると思うのです。つまり,水深などの独立変数もサンプリング面積が異なることで,その効果が大 きく歪んでしまっている可能性が高いです。」

どうもよくわからないのですが,「同じ水深であれば川幅が広い方が生息密度が高い」のであれ ば,「生息密度は水深だけでは決まらない」ということであって「効果が大きく歪んで」いるわけではないでしょう.reiniさん御指摘のように川幅などを モデルに投入すれば良いと思います(というか普通は関係のありそうな因子についてモデル選択を行うのでは.まあ,研究の目的にもよりますが).

No.07973 Re: 以下の場合も重回帰分析は使えますか?  【reini】 2008/10/16(Thu) 16:07

なんとなく研究の中身がわかってきたので確認をかねて。

魚さんはよく「サンプリング面積の違いが…」というお話をされますが,今までの流れを見る限り,各地点の調査区間(サンプリング面積)は,
「任意の区間長×川幅」という設定でしょうか?

それならば,サンプリング面積が違っても,推定生息密度を従属変数に,各環境要因を独立変数にすればおそらくさほど問題なく重回帰できると思います。(区間内に瀬,淵の河床単位を少なくとも1つずつ含む,といった必要性はありますが)

私 も知ったかぶりさん同様にどうもよくわからない点は,水深が同じで川幅が広いほうが環境が良い(この根拠もよくわからないのですが)のなら,それは水深の 影響があまりないということではないですか?意識していらっしゃらないかもしれませんが,魚さん自身が,水深ではなく河川内の体積が魚には重要で,河川内 の体積が狭いより広いほうがよいと言ってる気がします。この場合,水面幅は河川内の体積の代替変数という解釈もできると思います。重回帰の場合,「川幅が 広い」というだけで従属変数を説明できないのなら,2番目の変数として「水深(が深い)」を検出すると思いますが。

ただ,そこで問題となるのは,各環境要因のサンプリング手法がその「調査地(区間)」を代表する値となるように設定されているかということだと思います。
魚 さんがNo.7959で「水深はサンプリング地点の中心で行った」と述べていますが,これがもし,調査区間の中心,1点でのみ計測を行い,それを調査地点 の水深の値としたのならば,サンプリング面積の違いではなく,サンプリング手法に問題があります。もちろん,論文にはピンからキリまで手法の精度に違いが ありますが,最低限のレベルはあると思います。魚さんの(ご友人の)研究の場合,水深や流速を調査区間からシステマティックにサンプリングし,その「平均 水深(流速)」や「水深(流速)の不均一性(ばらつき)」を変数にすればよいと思われますが…そこらへんも詳しく教えてもらえるとアドバイスできるかもし れません。

No.07976 Re: 以下の場合も重回帰分析は使えますか?  【魚】 2008/10/17(Fri) 11:40

>No. 7965
>なお,一般化線形モデルをお薦めしましたが,研究の目的によっては重回帰分析の方が適している場合もあるかと思います.

  今回の研究計画は,魚の生息数推定モデルを構築し,それを広域に展開するといった流れです。広域に展開する際の1グリッドの単位は,魚の生息推定モデルと 同じ(5m×川幅)なので,最終的な単位は「河川の長さ5mあたりの魚の生息数」となります。研究計画上では常に「離散値」を用いるので,今回は,ご教授 頂いた「一般化線形モデル(ポアソン分布を仮定)」が適していると思います。

>どうもよくわからないのですが,「同じ水深であれば川幅が 広い方が生息密度が高い」のであれば,「生息密度は水深だけでは決まらない」ということであって「効果が大きく歪んで」いるわけではないでしょ う.reiniさん御指摘のように川幅などをモデルに投入すれば良いと思います

 説明不足でした。今回の解析では,従属変数を「魚の生息数」とし,独立変数としては「水深」,「川幅」などを取り入れます。問題は,交互作用項として「水深×川幅」を取り入れる必要があるかということです。
  今回の調査は,「独立変数を測定する範囲が川幅とともに変化する」ので,「垂直方向の変数(この場合は水深です)」が従属変数にもたらす効果は,「常に平 面方向(この場合は川幅です)の変化の影響を受けている」と考えられます。従って,独立変数として「川幅」,「水深」,「川幅と水深の交互作用項」の3つ が必要になるのではないかと考えております。いかがでしょうか。
 なお,「水深が川幅の変化の影響を受けている」とは,No. 7879の7〜10行目の事例を指します。

No.07978 Re: 以下の場合も重回帰分析は使えますか?  【魚】 2008/10/17(Fri) 13:16

>No. 7973
>各地点の調査区間(サンプリング面積)は,「任意の区間長×川幅」という設定でしょうか?

 その通りです。調査方法の説明は初回の投稿時におおまかにさせて頂きました。

>それならば,サンプリング面積が違っても,推定生息密度を従属変数に,各環境要因を独立変数にすればおそらくさほど問題なく重回帰できると思います。

  たぶん,おそらくさほど問題なく重回帰できるのかもしれません。ただ,「サンプリング面積を一定にする」という調査を行う上での大前提が崩れているので, 問題はとても大きいと感じ質問させて頂きました。また,魚の調査を行う上で「サンプリング面積を一定にする」ことは非常に困難であるため,今後のために も,この問題をできるだけ解決したかったのです。お付き合い頂き本当にありがとうございます。

>魚さん自身が,水深ではなく河川内の体積 が魚には重要で,河川内の体積が狭いより広いほうがよいと言ってる気がします。この場合,水面幅は河川内の体積の代替変数という解釈もできると思います。 重回帰の場合,「川幅が広い」というだけで従属変数を説明できないのなら,2番目の変数として「水深(が深い)」を検出すると思いますが。

  reiniさんが指摘さている「体積」という考え方は,私が感じている問題の根幹にとても近いです。ただ,魚の生息場所として「体積」を重要視しているの ではなく(もちろん重要と思っていますが),むしろサンプリング面積が異なることで体積的な考慮の必要性があるのではないかと思っているのです。体積とは xyz軸の関係によって表されるので,当然xyz軸は互いに関連しあっています。従って,「x軸(縦)」,「y軸(横)」,「z軸(高さ)」を独立変数と して扱うことに加え,「xyz軸の交互作用項」を加えることがより適切ではないかと考えているわけです。
 reiniさん,知ったかぶりさん,そして私も,「川幅(この場合xy軸に相当)」と「水深(z軸)」を独立変数として組み込む点で一致しております。あとは,「水深と川幅の交互作用項(xyz軸)」をどうするかだと思います。ご意見宜しくお願い致します。

No.07979 Re: 以下の場合も重回帰分析は使えますか?  【知ったかぶり】 2008/10/17(Fri) 13:30

>今回の研究計画は,魚の生息数推定モデルを構築し,それを広域に展開するといった流れです。広域に展開する際の1グリッドの単位は,魚の生息推定モデルと同じ(5m×川幅)なので,最終的な単位は「河川の長さ5mあたりの魚の生息数」となります。

魚 さんが書かれている「いろいろと難しい問題」の根っ子は,ここにあるようです.重回帰分析にしても一般化線形モデルにしても,パラメータの推定は「個体の 密度」に対して行われます.これは,サンプリング面積が揃っていようと異なっていようと違いはありません(個体数をサンプリング面積で補正した場合は,単 位面積当たりの個体数となりますし,サンプリング面積が全て同じで捕獲個体数をそのまま用いた場合は,サンプリング区画内の個体数となります).「河川の 長さ5mあたりの魚の生息数」は川幅が一定ではない以上,「密度」として扱うことができないものですから,これを直接推定しようとすると,いろいろとおか しな事になります.「暗黙の関連性」とか「水深,川幅」などの問題は,全てここに起因していると思われます.

構築されたモデルに基づいて,ある水域の総個体数を推定するということのようですが,その妥当性については,魚が御専門のreiniさんのコメントを待ちたいと思います(正直なところムチャだと思いますが).

No.07980 Re: 以下の場合も重回帰分析は使えますか?  【魚】 2008/10/17(Fri) 16:27

>「河川の長さ5mあたりの魚の生息数」は川幅が一定ではない以上,「密度」として扱うことができないものですから,これを直接推定しようとすると,いろいろとおかしな事になります.

 確認ですが,ご教授頂いた資料は(線形モデルにおけるDOs & DON'Ts),「サンプリング面積の相違を考慮」する方法としてoffsetを用いておりましたが,この方法を用いても今回の魚の生息数に関しては補正できないということでしょうか。
 サギの事例(線形モデルにおけるDOs & DON'Ts)と今回の魚の事例は,「サンプリング面積が一定でない」点で共通していると思うのですが,いかがでしょうか。

  また,「暗黙の関連性」や「水深,川幅」などの問題は,今回の魚の事例に限らず「サンプリング面積が異なれば,常につきまとう問題」と思います。個人的に は,offsetを用いてサンプリング面積の相違を考慮すれば「暗黙の関連性」については補正できると思いました。一方,「水深,川幅」については,別の 方法が必要と感じております。

>構築されたモデルに基づいて,ある水域の総個体数を推定するということのようですが,その妥当性については,魚が御専門のreiniさんのコメントを待ちたいと思います(正直なところムチャだと思いますが).

  説明不足でした。「ある水域の総個体数を推定する」のではなく,「ある地域にある複数の河川について魚の生息数を推定し,相対的にどの河川が多いのかを比 較したい」というのが広域展開の目的となります。いずれにせよ,広域展開については議論すべき点が沢山ある思いますが,今は,モデル構築の問題から1個ず つ解決しているところです。

No.07981 Re: 以下の場合も重回帰分析は使えますか?  【知ったかぶり】 2008/10/17(Fri) 18:45

一般化線形モデルは,左辺に従属変数(の期待値)を置いた線形方程式として表されますが,この左辺に「河川の長さ 5mあたりの魚の生息数」を置くことはできない,ということです.左辺が「一定サイズの空間(面積といってもいいですが)内に存在する個体数」(すなわち 生息密度)であれば,何の問題もありません.魚さんのこれまでの記述を見ると,「従属変数が生息数だから云々」という記述が目立ち,違和感を覚えていたた め指摘させてもらいました.以下,従属変数を「各地点の捕獲数」としてoffset項を用いた一般化線形モデルを適用するものとして話を進めますが,

>「水深,川幅」については,別の方法が必要

こ れが理解できません.環境要因が生息密度にあたえる影響は,サンプリング面積に左右されるものではないでしょう.水深や川幅が要因として重要であると考え られるのであれば,「素直に」モデルに投入するだけだと思います.なお,交互作用が想定されるのであれば,とりあえずモデルに含めてどうなるか見てみると いうのも一つの方法かと.他の独立変数を含め,変数選択を行う必要はあるでしょうから,有意な交互作用がなければそこでふるい落とされるでしょう.ただ, 独立変数にしても交互作用にしても無原則にどんどん投入すると,結果の解釈に苦しむ事態に陥ることも.

No.07982 Re: 以下の場合も重回帰分析は使えますか?  【知ったかぶり】 2008/10/18(Sat) 12:16

 私の書き方が拙いせいか,なかなか話が進展しないので,ここで整理させてください.一般化線形モデルを用いるものとします.従属変数は,「捕獲個体数」.

サンプリング面積が同じ場合
  そのまま一般化線形モデルを適用する.ここで推定されるパラメータは,サンプリング面積当たりの個体数に対するもの(つまり,構築されたモデルにより,サ ンプリング面積当たりの個体数を推定できる).必要なら下記のoffset項を用いても問題ないが,その場合,推定の対象となる個体数の「単位」は異な る.
サンプリング面積が異なる場合
 面積の影響を考慮しなければならないが,サンプリング面積を独立変数として扱ってはイケナイ.それを やると面積に対するパラメータを求めることになり,他の独立変数のパラメータ推定も影響を受けてしまう.生息密度が等しければ個体数は面積に比例するの で,本来,面積のパラメータは推定する必要がない.そこで,面積をoffset項(パラメータを1に固定した項)として扱う.offset項を用いたモデ ルでは,単位面積当たりの個体数に対するパラメータが推定される.

 魚さんは,offset項を用いたモデルでは従属変数が「捕獲個体 数」なので,調査地点ごとの個体数が推定されると考えておられるようですが,そうではありません.「線形モデルにおけるDOs & DON'Ts」にある変形前のモデル式の左辺を見てください.ln(個体数/面積)となっていますよね.offset項を用いた一般化線形モデルにおいて も重回帰分析の場合と同様,推定の対象は「密度」であるということです.

No.08010 Re: 以下の場合も重回帰分析は使えますか?  【魚】 2008/10/21(Tue) 16:19

 返信が遅くなり申し訳ありません。また,問題点をきれいに整理して頂きありがとうございます。

>「線形モデルにおけるDOs & DON'Ts」にある変形前のモデル式の左辺を見てください.ln(個体数/面積)となっていますよね.offset項を用いた一般化線形モデルにおいても重回帰分析の場合と同様,推定の対象は「密度」であるということです.

  式がln(個体数/面積)で出発しているので,当初の推定の対象は「密度」であるということは理解しております。しかし,その後の式の展開により, ln(個体数)=aln(面積)+bx+・・・(offset項なのでa=1)となっているので,正確に表現すると,式展開後の推定対象は「自然対数に変 換された捕獲個体数」であり,それを「自然対数に変換された面積とその他の独立変数」によって推定するといった解釈になると思います。
「線形モデ ルにおけるDOs & DON'Ts」にも記述されてありますが,式の出発点であるln(個体数/面積)の状態ではポアソン分布に従うと仮定できないので,それをポアソン分布に 従わせるためにln(個体数)まで式を展開しています。つまり,当初の推定対象は「密度」ですが,それではポアソン回帰できないため,推定対象を「自然対 数に変換された捕獲個体数」に変換してポアソン回帰が可能な状態にしているのだと思います。この状況を踏まえると,構築されたモデルで推定できるのは,や はり「密度」ではなく「自然対数に変換された捕獲個体数」と思えるのですがいかがでしょうか。
 そして,最終的にある地点の魚の生息数を推定する には,まず,構築されたモデルに,その地点の面積とモデルで選ばれた独立変数の測定値を代入して「自然対数に変換された魚の生息数」を推定した後,その値 を対数変換(exp(自然対数に変換された魚の生息数))して「ある地点の魚の生息数」とします。最終的に算出される値はやはり「魚の生息数」となりま す。

 推定の対象を「密度」とするのであれば,左辺はln(個体数/面積)であり,式を展開して面積を右辺に持っていく必要はありませ ん。しかし,この形ではポアソン回帰できないので,必然的にln(個体数)=aln(面積)+bx+・・・(offset項なのでa=1)となり,面積は 右辺へと移項されます。この時点で,推定対象(左辺)は「密度」から「個体数」に切り替わるのだと思います。この解釈は誤りでしょうか。ご意見をお願い致 します。

>サンプリング面積が同じ場合
 そのまま一般化線形モデルを適用する.ここで推定されるパラメータは,サンプリング面積当たりの個体数に対するもの.必要なら下記のoffset項を用いても問題ないが,その場合,推定の対象となる個体数の「単位」は異なる.

 テキスト「線形モデルにおけるDOs & DON'Ts」より
 ln(y)=ln(z)+bx+c+e
 y:個体数,z:面積,b・c:変数,e:誤差
 zは全て同じ値なので,定数項となる(cに吸収されると考えて無視)。bの推定には影響しない。
 
  「ln(z)は定数cに吸収され,さらに,bの推定には影響しない」ので,offset項を用いた場合と用いない場合の違いは,定数cにのみ現れます。つ まり,定数c以外のy,b,c,eはoffset項を用いても用いないくても同じ値になると思います。ln(y)は,正確に表現すると,「自然対数に変換 した個体数」なので,offset項を用いも用いないくても単位は「自然対数に変換した個体数」で変わりません。「offset項を用いても問題ないが, その場合,推定の対象となる個体数の「単位」は異なる」訳ではないと思いますがいかがでしょうか。
 尚,この事例では,推定されたln(y)を対数変換して「単なる個体数」に直した場合,サンプリング面積が分かっているので,「サンプリング面積あたりの個体数(密度)」となります。

  サンプリング面積が同じであっても違っていても,構築されるモデルの従属変数は「自然対数に変換した個体数」であり,それを対数変換して「個体数」にしな ければ,「密度」への変換もできなと思います。従って,「ここで推定されるパラメータは,サンプリング面積当たりの個体数に対するもの」ではないと思いま すがいかがでしょうか。

No.08013 Re: 以下の場合も重回帰分析は使えますか?  【知ったかぶり】 2008/10/21(Tue) 18:54

この式 ln(y)=ln(z)+bx+c の両辺の指数を取ると y=exp(ln(z)+bx+c)
これは y=z*exp(bx+c) と同じ.つまり,推定されたパラメータから算出されるのは単位面積当たりの個体数であり,それに面積をかければ,そこに生息する個体数になるということです.
サンプリング面積が同じ場合,offset項を用いても独立変数のパラメータは変わりませんが(当然ですが),切片が変わります.推定された切片を用いて算出されるのは,やはり単位面積当たりの個体数です.

No.08061 Re: 以下の場合も重回帰分析は使えますか?  【魚】 2008/10/24(Fri) 09:33

>この式 ln(y)=ln(z)+bx+c の両辺の指数を取ると y=exp(ln(z)+bx+c)
これは y=z*exp(bx+c) と同じ.つまり,推定されたパラメータから算出されるのは単位面積当たりの個体数であり,それに面積をかければ,そこに生息する個体数になるということです.

 そういうことなのですね。非常にわかりやすい式の展開ありがとうございました。

  質問ですが,離散値のデータをoffset項を用いてポアソン回帰した場合はy/z= exp(bx+c)となりますが,これは,離散値のデータを密度になおして重回帰した場合のy/z= bx+cと比較して,exp()がついている分だけ密度を正解に推定できているということなのでしょうか。それとも,単にポアソン回帰と重回帰では仮定し ている分布が違うので,その違いを反映しているだけで,両方の式から算出される密度は全く一緒になってしまうのでしょうか。ご意見宜しくお願い致します。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る