No.08538 長期生存群と短期生存群に分けることの是非  【AC】 2008/12/06(Sat) 07:19

 いつもお世話になります。生存分析に関することなのですが,同じ治療法を施した24匹のマウス集団があって,300日の 観察期間があったとします。私のボスは,これらのマウスを,長期生存群と短期生存群との2群に分けて(例えば80日をcut-offとする),血液中の白 血球の数が,この2群で有意な差があるか見たがっています(実際に有意差が出る)。しかしながら,ボスのアドバイザーである統計学者が,こういうやり方 (long-term survivor vs. short-term survivor)は,生存分析における「古典的な過ち」で,医学統計の良書にも書かれていることだと言って,決してこの手法による解析を認めてくれませ ん。生存日で2群に分けて,それぞれの群における様々な要因を比べるという論文はいくらでも出てくるのですが,統計学者の仰るように,これは間違った手法 なのでしょうか?
 個人的には,
「同じ処置を施したのに生存率に差がある。ならば,それに影響しているような要因(個体差)があるかも知れない。それを見出すために,長期生存群と短期生存群とに分けて,何か違いがあるか見てみよう。」というのは,理に適ったアプローチに思えるのですが。

No.08545 Re: 長期生存群と短期生存群に分けることの是非  【kai】 2008/12/08(Mon) 08:43

質問の答えになっていませんが...
私がこのようなデータを解析するならまず,白血球の数と生存日数で散布図を描いてみます.このデータを2群に分ける時点でまず情報が大きく欠落(損失)してしまいます.

No.08552 Re: 長期生存群と短期生存群に分けることの是非  【sb】 2008/12/08(Mon) 15:53

(1)まず,研究の目的は何でしょうか?
”ある治療法のマウスに対する延命効果は,治療開始時の白血球数により差異を認める”でしょうか?もしそうであるなら,非治療群を設定し,実験を行うべきと思います。
(2)なぜ,90日で2群に分けるのでしょうか?マウスにとって90日が生物・生理学的に何らかの意味があるのであれば,問題はありませんが,実験結果を見ながら,差異がありそうだから90日で2群に分けるというのであれば,当然,問題にされると思います。

No.08578 Re: 長期生存群と短期生存群に分けることの是非  【AC】 2008/12/10(Wed) 00:54

kaiさん,sbさんご返答ありがとうございます。

>白血球の数と生存日数で散布図を描いてみます
こ れはやってみました。全体でみると,明らかな相関関係はありませんが,低い白血球数と高すぎる白血球数が,予後不良因子のようです。ボスとしては,単純に 「白血球数と生存率が比例する」というのを言いたいようなのですが,そう単純な話ではないようです。なので,別のアプローチとして,長期生存群と短期生存 群とに分けたらどうかというのが出てきました。

>1)まず,研究の目的は何でしょうか?
 ボスが当初示したかったのは,「治療開始後20日前後の白血球数と生存率が比例する」です。プラセボ群も設定しています。

>2)なぜ,90日で2群に分けるのでしょうか?
 これまでの実験データから,プラセボ群が80日前後でほぼ死亡するので,この80日というcut-offを設けています。なので恣意的なcut-offではないと考えています。

  プラセボ群と治療群とで生存率に明らかな差があるのは示せているのですが,同じ治療群の中でも,生存率に差があるので(遺伝的には均一なマウス集団),そ の要因を知りたいというのがテーマとしてあり,その要因のひとつとして白血球数というのがあるわけです。上述したように,単純に白血球数と生存率が比例し ているわけではなさそうなので,「治療開始後20日前後の白血球数と生存率が比例する」というアプローチは諦めて,長期生存群と短期生存群とに分けるとい う戦略をとったのですが,これが「やってはいけない手法」といわれた訳です。

No.08589 Re: 長期生存群と短期生存群に分けることの是非  【kai】 2008/12/10(Wed) 18:16

白血球の数と生存日数の相関係数のp値(あるいは何らかの回帰モデルのp値)と長期生存群と短期生存群との2群に分けて差の検定をしたときのp値とどちらが小さいか比較してみてください.

ふつうに考えると長期生存群と短期生存群との2群に分けてしまった方が,情報が落ちてしまう(1日で死んでも30日で死んでも50日で死んでも同じ扱い)ので,精度が落ちている(有意さがでにくくなっている→p値が大きくなる)と思うのですが...

No.08593 Re: 長期生存群と短期生存群に分けることの是非  【sb】 2008/12/10(Wed) 18:59

治療効果の有無により2群に分け,その要因を追究する方法論は,仮説生成としての意義は認めますが,仮説検証とし ては,まずいと思います。なぜ,20日前後の白血球数なのでしょうか?様々の要因と水準がある中で,20日前後の白血球数が,統計学的に”有意な”水準に 達したのではないでしょうか?この場合のβ過誤は,5%よりずっと大きいものになります。従って,統計学者さんが指摘されるように,「古典的な過ち」とな ります。

もっとも,繰り返しになりますが,仮説生成としての意義を否定するものではありませんので,もし,医学・生物学的に新知見として発表する価値があると信じるなら,仮説として設定し,新たな実験を行い検証されては如何でしょうか。

No.08596 Re: 長期生存群と短期生存群に分けることの是非  【AC】 2008/12/10(Wed) 21:50

kaiさん,ご返答ありがとうございます。すみません,ちょっと最初の説明がまずかったです。ボスがやりたがって いるのは,長期生存群と短期生存群との2群に分けて,それぞれで相関係数を見てみるというものです。ボスの考えでは,短期生存群では,白血球数と生存率に は有意な相関がみられない(低い白血球数と高すぎる白血球数が予後不良因子なので),長期生存群では,相関があるだろうというものです。個人的には, n=24と少ないので,微妙な気もするのですが,理論としては悪くないと思います。個人的に,このマウスモデルを使って20種類ほどの遺伝子の発現をみて いて,長期生存群と短期生存群との2群に分けて比較したデータが手元にあるので,これも駄目な手法なのかなというのがありました(このような論文は沢山あ りますが)。統計学者が,生存日で2群に分けるのは絶対にしていけないと主張されるので。

sbさん,ご返答ありがとうございます。なぜ 20日前後の白血球数なのかですが,これまでの実験データから,この治療をすると,白血球数が徐々に上がっていき20日前後でピークに達し,その後ゆっく りとに正常域まで下がっていくというのがあるからです。こういう背景から,採血は,治療開始時と20日前後,40日前後,60日前後,90日前後にしてま す。ボスとしては,「20日前後の白血球数が予後の良い指標になる」というストーリーに持っていきたいと。

実際のデータは以下のような感じです。
Survival <- c(54, 57, 68, 68, 78, 79, 79, 80, 80, 93, 101, 103, 110, 124, 146, 148, 173, 180, 186, 193, 215, 235, 298, 300)
WBC.D19 <- c(5583, 2704, 1851, 3086, 6459, 6771, 5423, 2011, 4311, 2873, 2163, 2911, 2535, 2130, 2876, 4155, 4190, 3294, 3554, 3361, 3753, 3689, 4737, 5580)

生存日で分けるのは駄目ということで,白血球数を単純に1st quartile以下,3rd quartile,残りの中間に3分割してKaplan-Meier分析をしてみたのですが,これはnが少ないから駄目と言われました(ボスは気に入ったのですが)。

No.08597 Re: 長期生存群と短期生存群に分けることの是非  【青木繁伸】 2008/12/10(Wed) 21:58

あれまあ。
本当のデータではないのかも知れないけど,ここまで明らかにして良いのだろうか・・・

No.08598 Re: 長期生存群と短期生存群に分けることの是非  【AC】 2008/12/10(Wed) 23:22

あ,勿論データは変えていて,傾向だけは同じという感じにしています。

No.08599 Re: 長期生存群と短期生存群に分けることの是非  【kai】 2008/12/11(Thu) 08:15

散布図はこんな感じであっていますか?
80日以下(赤丸:短期生存群)と81日以上(黒丸:長期生存群)で層別して傾向を見てみました.
赤丸は相関が無く,黒丸は相関があるということですね.

なるほど.

> 長期生存群と短期生存群との2群に分けて,それぞれで相関係数を見てみるというものです。ボスの考えでは,短期生存群では,白血球数と生存率には有意な相 関がみられない(低い白血球数と高すぎる白血球数が予後不良因子なので),長期生存群では,相関があるだろうというものです。

の主張通りの結果になってますね.


No.08606 Re: 長期生存群と短期生存群に分けることの是非  【TY】 2008/12/11(Thu) 15:00

これは,短期生存群は予後が短く,長期生存群は予後が長いという結果ではないでしょうか。
そうだとしたら,あまり意味のある結果とは思えないのですが。
白血球数で層別して生存時間を比較するなら分かるのですが,目的変数で層別するのはまずいように思われます。

No.08608 Re: 長期生存群と短期生存群に分けることの是非  【AC】 2008/12/11(Thu) 20:37

kaiさん,フォローありがとうございます。散布図は,そういう感じです。なので,予後不良群は,白血球数が高す ぎるか低いかで,予後良好群は,程よい白血球数を持っていて,その中で見ると,白血球数と予後とに相関がありそうだ,という印象があります。なので,白血 球数で層別して,Kaplan-Meierでと思ったのですが,これがnが少ないから偶然かもしれないと言われお手上げ状態というわけです(生物学的には 理に適った結果なんですが)。

TYさん,ご返答ありがとうございます。
>短期生存群は予後が短く,長期生存群は予後が長い

こ ういうふうに取られる可能性もあると認識しています。最初,ボスは,80日をcut-offとして,短期生存群と長期生存群との2群でKaplan- Meier曲線を描いてみたら,と言われたのですが,いや,これは正に目的変数で層別している訳で,それは違いますと指摘して納得されました。
白 血球数や,複数の遺伝子の発現情報など様々なdataがあります。これに生存日数という情報があるわけですが,妥当なアプローチとして,Cox- hazardモデルを適応するのがあると思いますが,これは解析済みです。私が危惧しているのは,長期生存群と短期生存群に分けて,それぞれの群での様々 な要因の傾向を見てみるという行為を否定すると,それで得られるかもしれない,何か生物学的事実を見落としてしまうのではないかということです。どうして これが間違った手法なのか,論理的に納得できません。

No.08609 Re: 長期生存群と短期生存群に分けることの是非  【sb】 2008/12/12(Fri) 08:06

> これは,短期生存群は予後が短く,長期生存群は予後が長いという結果ではないでしょうか。

TYさんの一言で結論が出たようですね。お見事です。

No.08611 Re: 長期生存群と短期生存群に分けることの是非  【TY】 2008/12/12(Fri) 10:27

「長期生存群と短期生存群に分けて,それぞれの群での様々な要因の傾向を見」るために,様々な背景因子の記述統計 を見るのは悪くないと思いますが,上のグラフでは,短期生存群の生存時間のレンジが狭いので,白血球数との相関が無くなっているようにも思われます。予後 に対して白血球数よりも強い別の因子があるのではないでしょうか。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る