No.15497 ROC曲線  【かな】 2011/10/15(Sat) 09:13

統計は全くの素人です。
 ROC曲線を出し,カットオフ値を求めようとしました。計算された曲線の座標を見ていると,カットオフ値が整数ではなく,少数点以下の数字となっていました。カットオフ値を整数で出す方法はないでしょうか? 
  また,小数点以下の数値をカットオフ値をと定める場合,勝手に切り上げてもいいのか,また切り捨ててもいいのでしょうか? 例えば,感度と特異度を見てい て適当な曲線の座標が19.5であった場合,求めたい数値は整数なので19をカットオフ値としていいのか20をカットオフ値としていいのか,ということで す。
 ちなみにSPSS ver19を使用しました。本も見てみましたが,ROC曲線の出し方について書かれた記載がなく困っています。分かりにくい文章で申し訳ありませんが,よろしくお願い致します。

No.15498 Re: ROC曲線  【青木繁伸】 2011/10/15(Sat) 10:12

なぜ整数値のカットオフ値が必要なんでしょうか?
カットオフ値は文字通り,その値を境にして切り分けるも のです。対象としている変数が整数しか取らないからという理由なら,むしろカットオフ値が整数であると不都合でしょう。出力されたカットオフ値が 19.5 で,それを19なり20なりのカットオフ値に読み替えても,では,19あるいは20はどちらに判定されるのでしょうか?19.5なら明確ですよね。さら に,19.5なら迷うかも知れませんが,正確に19.5となる確率は0に近いので19.49999999999999 なのか19.5000000000001なのかが分からなければ,四捨五入もできませんね。

No.15499 Re: ROC曲線  【かな】 2011/10/15(Sat) 14:27

御回答ありがとうございます。
今検定にかけている数値はテストの点数であったこと,先行研究の文献に記載されていたカットオフ値も整数であったことから,カットオフ値は整数じゃなければいけないのかと思っていました。少数点以下の数値の方が分かりやすいですね。

も う一つ,初歩的な質問をさせていただいてよろしいでしょうか? カットオフ値を求める際,テスト結果の数値全てを統計にかけていいのでしょうか? 一番悪 い点数と良い点数を省いて統計にかけるんだよとアドバイスをくれた人もいるのですが,どのようにするのがいいのでしょうか? ご助言をお願い致します。

No.15500 Re: ROC曲線  【青木繁伸】 2011/10/15(Sat) 19:58

> 一番悪い点数と良い点数を省いて統計にかけるんだよとアドバイスをくれた人もいるのですが

データの分布状況によるでしょう。外れ値があれば除く方が望ましいでしょうけど,どれくらい除くのか(1つだけで良いとも思えないでしょう?)。自分のデータをよ〜〜〜く見て考えましょう。

データをそのまま使う方法,上下一つずつ除く,上下数%除く,などいろいろやってみて,どのくらい違った結果になるのか,違うとすればどれが最も好ましいのかなど,考えながらデータを弄ってみるのが一番。

No.15502 Re: ROC曲線  【かな】 2011/10/15(Sat) 22:47

御回答ありがとうございます。
統計を学生の頃授業で習ったことがないもので,結果を統計にかけると有意な差等が出てくることがを面白いと感じましたが,統計は本を読んでも書いてある例すら難しくて中々理解できません。
青木先生の御回答はとても分かりやすくて理解できました。また困ったことがあったらよろしくお願い致します。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る