No.13218 Re: 調査期間の異なるデータの比較 【青木繁伸】 2010/08/05(Thu) 22:04
> 調査期間が1回目は170日間,2回目は360日間と大きく違うのです
比較できないですね。補正もできないでしょう。(調べていないデータに基づいた調整はできない)
No.13219 Re: 調査期間の異なるデータの比較 【通りすがり】 2010/08/05(Thu) 23:39
死亡パターンを,何らかの事前情報によって仮定・モデル化できるのであれば,そのパラメータ推定と比較はできるのではないかと思います.それがむちゃなら,やはり上のお答えの通りでしょう.
No.13231 Re: 調査期間の異なるデータの比較 【ここ】 2010/08/06(Fri) 22:26
青木様,通りすがり様,お返事ありがとうございます。
やはり比較はできないですか。せっかくのデータを無駄にしたくないという一心で,事前情報と言えるか分かりませんが,以下のように考えてみました。
1日あたりの死亡率u(x)を考える。
時刻t,サイズxの個体数n(x,t)の時間変化は,成長を無視すると
dn(x,t)/dt = -u(x)*n(x,t) より n(x,t)=N(x,0)+Exp(-u(x)*t)
いま170日あたりの生存率を,s(x)=1/(1+Exp(a+bx))としてロジスティック回帰によってパラメータ推定する
このとき,t=170の生存個体数n(x,170)は
N(x,0)*Exp(-u(x)*170) = N(x, 0)*s(x)
なので
u(x) = -1/170*Log(s(x))
よってt=360の生存率は
Exp(-u(x)*365) = Exp(365/192)*Log(s(x))
1日あたりの死亡率に変換することで,たとえば季節変動や,突発的な出来事などは起こらないという仮定をしています。単なるこじつけでしょうか?間違いのご指摘,ご助言をいただければありがたいです。
よろしくお願いします。
No.13232 Re: 調査期間の異なるデータの比較 【青木繁伸】 2010/08/07(Sat) 08:12
> たとえば季節変動や,突発的な出来事などは起こらないという仮定をしています
色々仮定をすれば,それぞれに対応した結果は得られます。
問題は,それらの仮定が妥当かどうか(みんなが認めてくれるかどうか)ということにつきます。
No.13234 Re: 調査期間の異なるデータの比較 【知ったかぶり】 2010/08/08(Sun) 11:47
>それぞれのデータから推定した生存率を比較する方法はあるでしょうか?
直接の比較という わけではありませんが,調査期間を説明変数として,ロジスティック回帰に含めてみてはどうでしょうか(2回の調査結果をこみにしてロジスティック回帰を行 う,ということです).体サイズと調査期間に交互作用がなければ,調査期間の長短に関わらず,体サイズが生存率に与える影響は一定であると考えて問題ない ように思います.交互作用が認められた場合は…どうするのかな?
No.13237 Re: 調査期間の異なるデータの比較 【ここ】 2010/08/08(Sun) 23:43
お返事ありがとうございます。
青木様
>色々仮定をすれば,それぞれに対応した結果は得られます。
>問題は,それらの仮定が妥当かどうか(みんなが認めてくれるかどうか)ということにつきます。
おっしゃる通りです。このやり方で計算したところ「生存率が調査期間によって異なる」という結果がでるのですが,果たしてそれが真実なのか分からない訳ですよね・・…。
知ったかぶり様
一度やってみます。統計解析は始めたばかりなので確認させていただきたいのですが,調査期間は長短のカテゴリー変数として扱うのですよね?どのような結果になるか想像もつきませんが,トライしてみます。
No.13239 Re: 調査期間の異なるデータの比較 【知ったかぶり】 2010/08/09(Mon) 08:24
>調査期間は長短のカテゴリー変数として扱うのですよね?
170と360の2つしか数値がないわけですが,そのまま数値データとして扱うべきでしょう.
No.13261 Re: 調査期間の異なるデータの比較 【ここ】 2010/08/11(Wed) 11:54
知ったかぶり様,お返事ありがとうございます。
調査期間を数値データとして説明変数に加え,交互作用も指定し,ロジスティック回帰をしました。
結果は(空白の設定がうまくいかなかったのでP値だけ載せています)
Coefficients:
Pr(>|z|)
(Intercept) 0.729014
size 0.348718
period 2.78e-05 ***
size:period 0.000324 ***
と なりました。sizeの効果は交互作用に含まれたようです。調査期間が約2倍ですから,観察された死亡率が異なるのは当然ですよね。「もし同じ期間調査を していたら・・・?』という問いには,やはり答えられないのででしょう。一方のデータだけで,解析を進めるようと思います。ご助言ありがとうございまし た。
最後に,size依存性の結果について,どのように理解したら良いか分からなくなったので,どなたかご助言をいただければありがたいです。
同じデータで,sizeだけでロジスティック回帰をした場合の結果
Coefficients:
Pr(>|z|)
(Intercept) <2e-16 ***
size <2e-16 ***
sizeとperiodだけで,交互作用を指定せずロジスティック回帰をした場合の結果
Coefficients:
Pr(>|z|)
(Intercept) 0.02555 *
period 0.00752 **
size < 2e-16 ***
ともにsize依存性が検出されました。しかし,periodとsizeの交互作用を入れるとサイズ依存性が検出されません。これは,変数間にどのような傾向があるからなのでしょうか?ご教授いただければありがたいです。
No.13264 Re: 調査期間の異なるデータの比較 【知ったかぶり】 2010/08/11(Wed) 16:44
>これは,変数間にどのような傾向があるからなのでしょうか?
それぞれのモデルによる回帰曲線をプロットして,比較してみましょう.y軸は生存率,x軸はsizeあるいはperiodです.
係数の有意性を重視しているようですが,AICによるモデル選択も検討してはいかがでしょうか.
No.13288 Re: 調査期間の異なるデータの比較 【ここ】 2010/08/19(Thu) 15:45
知ったかぶりさま
ご助言ありがとうございました。お礼を申し上げるのが遅くなってすみません。
回帰曲線のプロットでは,サイズ依存的死亡はきれいに見えますが,期間の依存性はよく分かりませんでした。
でも,期間の違いも検出されているので,影響は有るのでしょう。
AICによるモデル選択では,交互作用があるモデルが選ばれました。しかし交互作用の解釈が難しいですね・・・。
● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る