No.21011 発生率が低く比例ハザードモデルが不適当な場合  【DOA】 2014/04/16(Wed) 23:51

ある疾患の発生をcox比例ハザードモデルにて解析したのですが,疾患の発生率が1.5%ほどであったので,過去ログにもありましたが,比例ハザードモデルを用いるのは適切ではないと知りました。

と ある本に,発生率が低くて比例ハザードモデルを用いるのが不適当である場合は,ポアソン回帰分析を使用すべきと書いてあったのですが,ポアソン回帰分析を 使用する場合,「観察期間」のデータはどのように反映させるのでしょうか?観察期間の反映は不可能で,観察期間を固定にすべきでしょうか?

過去ログを探しますと,http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc045/15627.html こちらの質問に状況が似ているのですが,このスレッドはcoxの拡張を適用する方向に向かっており,低発生率の問題は解決できません。

い ろいろ調べ,観察期間をオフセット項(?)にすれば良いのではないかと考えたのですが,log(疾患発生数)=βi*(説明変数i)+ log(観察期 間) この理解は正しいのでしょうか?もちろん,イベントで打ち切りにならないようにデータを作り変える必要がありますが。

No.21012 Re: 発生率が低く比例ハザードモデルが不適当な場合  【青木繁伸】 2014/04/17(Thu) 07:21

> とある本に

誰の書いた,どういう本?

「疾患の発生率が1.5%ほど」というのは,「cox比例ハザードモデル」で解析するのに不適切と言うだけでなく,ほかの分析でも不適切と思います。(使えたとしても,その方法がそう言う状況に無頓着というだけでしょう)

No.21014 Re: 発生率が低く比例ハザードモデルが不適当な場合  【DOA】 2014/04/17(Thu) 15:22

>誰の書いた,どういう本?
「医学的研究のための多変量解析」という本です。

一応付記しますとp33です。
Multivariable Analysis A Practical Guide for Clinicians (2nd ed.)という書籍の
訳本です。

>「疾患の発生率が1.5%ほど」というのは,「cox比例ハザードモデル」で解析するのに不適切と言うだけでなく,ほかの分析でも不適切と思います。

稀な疾患に向いた方法で再検討します。

No.21015 Re: 発生率が低く比例ハザードモデルが不適当な場合  【DOA】 2014/04/17(Thu) 23:37

すみません,ひとつ質問を追加させて下さい。

発生率の低いイベントはどのようなモデルを使って も,コホート研究には不向き,ということだと思うのですが,これは,例えば計算経過で誤差が大きくなるために不向き,といった,数学的なことが理由なので しょうか。それとも,母集団が明らかな状態で,発生率の低いイベントを,解析に足りる症例数集めることが困難であるという理由なのでしょうか?

No.21016 Re: 発生率が低く比例ハザードモデルが不適当な場合  【青木繁伸】 2014/04/18(Fri) 12:16

「発生率の低いイベントを,解析に足りる症例数集めることが困難である」ため,「(不十分な例数では,)計算経過で誤差が大きくなる(推定精度が低くなる)」ということでしょう。

No.21017 Re: 発生率が低く比例ハザードモデルが不適当な場合  【DOA】 2014/04/18(Fri) 13:08

ありがとうございます。

>「発生率の低いイベントを,解析に足りる症例数集めることが困難である」ため,「(不十分な例数では,)計算経過で誤差が大きくなる(推定精度が低くなる)」ということでしょう。

ということなのですが,

例えば上記の発生率1.5%のイベントなのですが,エントリー約5000に対しイベント75件のデータになっています。ほとんどは観察打ち切りです。

このデータに対して,先にcoxで試行した際には5-6個の変数を選択できそうでした。

発生率は確かに不適切と言われるほどに低いのですが,それでもイベントの数を揃えていれば,推定精度は担保されたと考えて良いでしょうか。

No.21018 Re: 発生率が低く比例ハザードモデルが不適当な場合  【青木繁伸】 2014/04/18(Fri) 14:11

「上記の発生率1.5%のイベントなのですが,エントリー約5000に対しイベント75件のデータ」

このような情報は,最初の質問時に提示すべきです。「疾患の発生率が1.5%ほどであった」としか書いてなかったですもんね。

そして,「ほとんどは観察打ち切りです。」とありますが,どれくらいの観察期間だったのですか?観察期間をもっと長くできるのかできないのか,長くできれば発生数は増えるのかそうでもないのか。

そのあたりの情報もないと,正しい判断はできないでしょう。

No.21019 Re: 発生率が低く比例ハザードモデルが不適当な場合  【DOA】 2014/04/18(Fri) 20:02

イベントの発生率自体が問題で,イベントと非イベントの比率が極端に違うデータの解析をすると誤差が大きいのかな?と思っていたのですが,
イベント数の問題なのですね。

打ち切りの多くは「退院」で,観察期間を伸ばすことはできません。

No.21020 Re: 発生率が低く比例ハザードモデルが不適当な場合  【青木繁伸】 2014/04/18(Fri) 20:29

> イベント数の問題なのですね。

同じ 1.5% でも,1000 例中の 1.5% と 1000000 例中の 1.5% では,意味が違うでしょう。

● 「統計学関連なんでもあり」の過去ログ--- 046 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る