No.13214 調査期間の異なるデータの比較  【ここ】 2010/08/05(Thu) 10:47

ある生物の体サイズと一定期間後に生存/死亡したという二値データから,体サイズを独立変数としたロジスティック回帰分析によって生存率の推定を行いました。
2回調査を行ったので,調査毎に生存率に違いがあるかを比較したいと考えています。しかし,調査期間が1回目は170日間,2回目は360日間と大きく違うのです(経時観察ではなく,1度サンプリングするだけなので期間中のデータはありません)。
このような場合,それぞれのデータから推定した生存率を比較する方法はあるでしょうか?例えば1日あたりの生存率に変換するなど,調査期間の補正の方法などがありましたら教えていただけないでしょうか?宜しくお願いします。

No.13218 Re: 調査期間の異なるデータの比較  【青木繁伸】 2010/08/05(Thu) 22:04

> 調査期間が1回目は170日間,2回目は360日間と大きく違うのです

比較できないですね。補正もできないでしょう。(調べていないデータに基づいた調整はできない)

No.13219 Re: 調査期間の異なるデータの比較  【通りすがり】 2010/08/05(Thu) 23:39

死亡パターンを,何らかの事前情報によって仮定・モデル化できるのであれば,そのパラメータ推定と比較はできるのではないかと思います.それがむちゃなら,やはり上のお答えの通りでしょう.

No.13231 Re: 調査期間の異なるデータの比較  【ここ】 2010/08/06(Fri) 22:26

青木様,通りすがり様,お返事ありがとうございます。

やはり比較はできないですか。せっかくのデータを無駄にしたくないという一心で,事前情報と言えるか分かりませんが,以下のように考えてみました。

1日あたりの死亡率u(x)を考える。
時刻t,サイズxの個体数n(x,t)の時間変化は,成長を無視すると
dn(x,t)/dt = -u(x)*n(x,t) より n(x,t)=N(x,0)+Exp(-u(x)*t)

いま170日あたりの生存率を,s(x)=1/(1+Exp(a+bx))としてロジスティック回帰によってパラメータ推定する
このとき,t=170の生存個体数n(x,170)は
N(x,0)*Exp(-u(x)*170) = N(x, 0)*s(x)
なので
u(x) = -1/170*Log(s(x))

よってt=360の生存率は
Exp(-u(x)*365) = Exp(365/192)*Log(s(x))

1日あたりの死亡率に変換することで,たとえば季節変動や,突発的な出来事などは起こらないという仮定をしています。単なるこじつけでしょうか?間違いのご指摘,ご助言をいただければありがたいです。
よろしくお願いします。

No.13232 Re: 調査期間の異なるデータの比較  【青木繁伸】 2010/08/07(Sat) 08:12

> たとえば季節変動や,突発的な出来事などは起こらないという仮定をしています

色々仮定をすれば,それぞれに対応した結果は得られます。
問題は,それらの仮定が妥当かどうか(みんなが認めてくれるかどうか)ということにつきます。

No.13234 Re: 調査期間の異なるデータの比較  【知ったかぶり】 2010/08/08(Sun) 11:47

>それぞれのデータから推定した生存率を比較する方法はあるでしょうか?

直接の比較という わけではありませんが,調査期間を説明変数として,ロジスティック回帰に含めてみてはどうでしょうか(2回の調査結果をこみにしてロジスティック回帰を行 う,ということです).体サイズと調査期間に交互作用がなければ,調査期間の長短に関わらず,体サイズが生存率に与える影響は一定であると考えて問題ない ように思います.交互作用が認められた場合は…どうするのかな?

No.13237 Re: 調査期間の異なるデータの比較  【ここ】 2010/08/08(Sun) 23:43

お返事ありがとうございます。

青木様
>色々仮定をすれば,それぞれに対応した結果は得られます。
>問題は,それらの仮定が妥当かどうか(みんなが認めてくれるかどうか)ということにつきます。

おっしゃる通りです。このやり方で計算したところ「生存率が調査期間によって異なる」という結果がでるのですが,果たしてそれが真実なのか分からない訳ですよね・・…。

知ったかぶり様
一度やってみます。統計解析は始めたばかりなので確認させていただきたいのですが,調査期間は長短のカテゴリー変数として扱うのですよね?どのような結果になるか想像もつきませんが,トライしてみます。

No.13239 Re: 調査期間の異なるデータの比較  【知ったかぶり】 2010/08/09(Mon) 08:24

>調査期間は長短のカテゴリー変数として扱うのですよね?

170と360の2つしか数値がないわけですが,そのまま数値データとして扱うべきでしょう.

No.13261 Re: 調査期間の異なるデータの比較  【ここ】 2010/08/11(Wed) 11:54

知ったかぶり様,お返事ありがとうございます。

調査期間を数値データとして説明変数に加え,交互作用も指定し,ロジスティック回帰をしました。

結果は(空白の設定がうまくいかなかったのでP値だけ載せています)
Coefficients:
Pr(>|z|)
(Intercept) 0.729014
size 0.348718
period 2.78e-05 ***
size:period 0.000324 ***

と なりました。sizeの効果は交互作用に含まれたようです。調査期間が約2倍ですから,観察された死亡率が異なるのは当然ですよね。「もし同じ期間調査を していたら・・・?』という問いには,やはり答えられないのででしょう。一方のデータだけで,解析を進めるようと思います。ご助言ありがとうございまし た。

最後に,size依存性の結果について,どのように理解したら良いか分からなくなったので,どなたかご助言をいただければありがたいです。

同じデータで,sizeだけでロジスティック回帰をした場合の結果
Coefficients:
  Pr(>|z|)
(Intercept) <2e-16 ***
size   <2e-16 ***

sizeとperiodだけで,交互作用を指定せずロジスティック回帰をした場合の結果
Coefficients:
    Pr(>|z|)
(Intercept) 0.02555 *
period  0.00752 **
size < 2e-16 ***

ともにsize依存性が検出されました。しかし,periodとsizeの交互作用を入れるとサイズ依存性が検出されません。これは,変数間にどのような傾向があるからなのでしょうか?ご教授いただければありがたいです。

No.13264 Re: 調査期間の異なるデータの比較  【知ったかぶり】 2010/08/11(Wed) 16:44

>これは,変数間にどのような傾向があるからなのでしょうか?

それぞれのモデルによる回帰曲線をプロットして,比較してみましょう.y軸は生存率,x軸はsizeあるいはperiodです.
係数の有意性を重視しているようですが,AICによるモデル選択も検討してはいかがでしょうか.

No.13288 Re: 調査期間の異なるデータの比較  【ここ】 2010/08/19(Thu) 15:45

知ったかぶりさま

ご助言ありがとうございました。お礼を申し上げるのが遅くなってすみません。
回帰曲線のプロットでは,サイズ依存的死亡はきれいに見えますが,期間の依存性はよく分かりませんでした。
でも,期間の違いも検出されているので,影響は有るのでしょう。

AICによるモデル選択では,交互作用があるモデルが選ばれました。しかし交互作用の解釈が難しいですね・・・。

● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る