★ ROC分析の境界について ★

2767. ROC分析の境界について Ryuchan 2004/03/17 (水) 09:02
└2769. Re: ROC分析の境界について 青木繁伸 2004/03/17 (水) 09:15
 └2773. Re^2: ROC分析の境界について Ryuchan 2004/03/17 (水) 10:32
  └2775. Re^3: ROC分析の境界について 青木繁伸 2004/03/17 (水) 12:12


2767. ROC分析の境界について Ryuchan  2004/03/17 (水) 09:02
ROC分析を行う際のカットオフ値の境界値について,質問します。
たとえば,望大特性として仮に次のようなデータが与えられていたとします。
   1 3 7 9 11 13 ・・・
疾患 − + − − + + ・・・
このとき,カットオフを7としたときの,感度と特異度を計算する際に,予測として1と3が−,7以上が+とすればよいのでしょうか。それとも1,3,7が−,9以上が+とすればよいのでしょうか。

     [このページのトップへ]


2769. Re: ROC分析の境界について 青木繁伸  2004/03/17 (水) 09:15
> このとき,カットオフを7としたときの,感度と特異度を計算する際に,予測として1と3が−,7以上が+とすればよいのでしょうか。それとも1,3,7が−,9以上が+とすればよいのでしょうか。

そのようなことを決める必要があるのでしょうか?
私がかつて参照したページ
http://www.jaclap.org/seminar_qm1.html
に記述されている説明では,あなたが悩んでいることは必要のないことだと理解しましたが。

http://aoki2.si.gunma-u.ac.jp/R/ROC.html
に,R で書いたプログラムもありますので,参考になれば。

     [このページのトップへ]


2773. Re^2: ROC分析の境界について Ryuchan  2004/03/17 (水) 10:32
回答ありがとうございました。残念ながら,私はRというソフトを使ったことが無いので,プログラムコードを読みきれませんでした。観測値が整数の場合には,カットオフ値の境界の取り扱い方(上記の例では7以下を予測−とするのか,予測+とするのか)で,分割表のセルの値が変わってきます。これは感度と特異度の値も変化することになると思うのです。青木先生のプログラムでは,境界の値はどちらに含められたのでしょうか。

     [このページのトップへ]


2775. Re^3: ROC分析の境界について 青木繁伸  2004/03/17 (水) 12:12
> 観測値が整数の場合には,カットオフ値の境界の取り扱い方(上記の例では7以下を予測−とするのか,予測+とするのか)で,分割表のセルの値が変わってきます。

観測値が整数かどうかということは,最初に示された質問とは無関係だと思います。というか,曖昧だと思います。
先に示したページ
http://www.jaclap.org/seminar_qm1.html
の,上の方にある図のように,疾患群と健康群で度数分布(図)を作るのが先でしょう。当然というか,疾患群と健康群で完全に観測値が二峰性になるわけではなくて,分割点をいろいろ変えて,分割点後との感度と特異度を計算してそれによって ROC 曲線を求めるのでしょう?

質問に関係するとすれば,「整数値のとき,度数分布表での区切り位置をどこにするか」ということになるのでしょうが,それは定義次第ということでしょう。整数値しか取らないなら,区切り位置を xx.5 というような中間点(別に中間でなくてもいい)にすればいいだけではないですか。
実際問題として,観測値が連続変数であっても,先に示したページのように,区間に区切って度数分布を求めるわけですから,例えば上の図にあるように HbA1c の最初の区間は 4.0 以上 5.2 未満なので次の区間の 5.2 以上 5.6 未満となっているわけですが,この度数分布を作成する元の観測値が,1,2,3,...というような整数値を取る測定器で測定されたものである場合にはどうなるだろうかということを考えれば,両者になんら根本的な違いはないのだと言うことになるのではないかと思いますが,間違ってますでしょうか。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 028 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る