★ 連続値の離散化を! ★

 195 連続値の離散化を!  GOW  2000/10/11 (水) 15:03
  196 Re: 連続値の離散化を!  sb812109  2000/10/12 (木) 00:26
   206 Re^2: 連続値の離散化を!  GOW  2000/10/12 (木) 17:29
    214 Re^3: 連続値の離散化を!  sb812109  2000/10/12 (木) 19:05
     249 Re^4: 連続値の離散化を!  GOW  2000/10/16 (月) 15:57
      252 Re^5: 連続値の離散化を!  sb812109  2000/10/16 (月) 22:32
     218 Re^4: 連続値の離散化を!  青木繁伸  2000/10/12 (木) 19:55
      221 Re^5: 連続値の離散化を!  sb812109  2000/10/12 (木) 21:04


195. 連続値の離散化を!  GOW  2000/10/11 (水) 15:03
連続値の離散化をしたいのですが・・・。
疾患に対する患者の治療データが有ります。治療法の中に,投薬量などの連続値が有る場合,その投薬量を統計的に見て一番有意な差が生じるところでいくつかの群に分けたいと思います。主に生存率に有意な差が生じるところで区切りたいと思っているのですが,どうにも困っています。
 ある投薬量地点で仮に区切り,隣接2群を比較検定し,有意差が生じる点で分割するのも一つの方法ですが,2群に分けるのでは実際には複数の群が含まれる可能性があるもの同士の比較検討になってしまうのではないかと困っています。
どなたか知恵を貸して下さい。

     [このページのトップへ]


196. Re: 連続値の離散化を!  sb812109  2000/10/12 (木) 00:26
>> ,,その投薬量を統計的に見て一番有意な差が生じるところでいくつかの群に分けたいと思います。主に生存率に有意な差が生じるところで区切りたいと思っている,,,

   統計学的に可能として,その結果をどの様に使用する予定でしょうか?

     [このページのトップへ]


206. Re^2: 連続値の離散化を!  GOW  2000/10/12 (木) 17:29
>    統計学的に可能として,その結果をどの様に使用する予定でしょうか?

私は放射線治療のデータベースを対象に最適治療の提示をしたいと思っています。
しかし,例えばその中である癌腫が女性に発生した場合に,どの治療法が有効か提示したいと思うとします,用いる放射線の種類による違いなどは比較しやすいのですが,ではその放射線をとれだけ照射するのが一番効果的かとなると,効果の高い範囲をきりだすことになります。その範囲を切り出して,提示することを目指しています。

     [このページのトップへ]


214. Re^3: 連続値の離散化を!  sb812109  2000/10/12 (木) 19:05
著者名:坂元慶行
タイトル:「??カテゴリーデータの解析??」,手元にありませんので,タイトルは不明です。
内容:AIC(赤池の情報量基準)を用いて連続量をカテゴリーに分類する方法がほぼ1冊全部を使って紹介されています。例として,脳血管障害と心筋梗塞を切り分ける統計学的に合理的な総コレステロール値のCut off値を求めていたと記憶しています。
   Fortranによるプログラムが付録に付いていたと思います。
参考までに。

     [このページのトップへ]


249. Re^4: 連続値の離散化を!  GOW  2000/10/16 (月) 15:57
> 内容:AIC(赤池の情報量基準)を用いて連続量をカテゴリーに分類する方法がほぼ1冊全部を使って紹介されています。例として,脳血管障害と心筋梗塞を切り分ける統計学的に合理的な総コレステロール値のCut off値を求めていたと記憶しています。

ありがとうございます。これを手がかりに勉強できそうです。もう一つ,気になるのが,この方法は,脳血管障害と心筋梗塞の様な2群を切り分けるのに用いられるそうですが,もし心筋梗塞データの中から明らかに違いを生じるデータ群を切り出したいと言う場合でも応用が可能でしょうか。
これは連続量の離散化において,クラス分類の情報がないケースと言うことになるのでしょうか。・・・悩んでいます。

また青木さん,sb812109,本当にありがとうございます(^o^)/

     [このページのトップへ]


252. Re^5: 連続値の離散化を!  sb812109  2000/10/16 (月) 22:32
総コレステロールを栄養状態の代理値と考えます。
栄養不良 ---> 出血性疾患が増加
栄養過多 ---> 梗塞性疾患が増加
と考えることが医学的に合理的であれば,望ましい総コレステロール値が存在することになります。

同様に,照射する放射線量が,
少ない場合 ---> 癌が直らず死亡率が増加
多すぎる場合 ---> 放射線障害の為死亡率が増加
すると考えると,この場合も望ましい線量が少なくとも概念的には存在することになります。


しかし,

>>心筋梗塞データの中から明らかに違いを生じるデータ群を切り出したい,,,

場合は,差があると云う事実を使って,差があることを“証明”することになってしまうのではないでしょうか。最初質問したのは,この”証明法”を危惧したためです。

     [このページのトップへ]


218. Re^4: 連続値の離散化を!  青木繁伸  2000/10/12 (木) 19:55
坂元慶行
「カテゴリカルデータのモデル分析」
共立出版株式会社
1985年11月
ISBN 4-320-01376-X
4,320円
ですか?

     [このページのトップへ]


221. Re^5: 連続値の離散化を!  sb812109  2000/10/12 (木) 21:04
> 坂元慶行
> 「カテゴリカルデータのモデル分析」
> 共立出版株式会社
> 1985年11月
> ISBN 4-320-01376-X
> 4,320円
> ですか?

そうです。有難う御座いました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 010 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る