No.15498 Re: ROC曲線 【青木繁伸】 2011/10/15(Sat) 10:12
なぜ整数値のカットオフ値が必要なんでしょうか?
カットオフ値は文字通り,その値を境にして切り分けるも のです。対象としている変数が整数しか取らないからという理由なら,むしろカットオフ値が整数であると不都合でしょう。出力されたカットオフ値が 19.5 で,それを19なり20なりのカットオフ値に読み替えても,では,19あるいは20はどちらに判定されるのでしょうか?19.5なら明確ですよね。さら に,19.5なら迷うかも知れませんが,正確に19.5となる確率は0に近いので19.49999999999999 なのか19.5000000000001なのかが分からなければ,四捨五入もできませんね。
No.15499 Re: ROC曲線 【かな】 2011/10/15(Sat) 14:27
御回答ありがとうございます。
今検定にかけている数値はテストの点数であったこと,先行研究の文献に記載されていたカットオフ値も整数であったことから,カットオフ値は整数じゃなければいけないのかと思っていました。少数点以下の数値の方が分かりやすいですね。
も う一つ,初歩的な質問をさせていただいてよろしいでしょうか? カットオフ値を求める際,テスト結果の数値全てを統計にかけていいのでしょうか? 一番悪 い点数と良い点数を省いて統計にかけるんだよとアドバイスをくれた人もいるのですが,どのようにするのがいいのでしょうか? ご助言をお願い致します。
No.15500 Re: ROC曲線 【青木繁伸】 2011/10/15(Sat) 19:58
> 一番悪い点数と良い点数を省いて統計にかけるんだよとアドバイスをくれた人もいるのですが
データの分布状況によるでしょう。外れ値があれば除く方が望ましいでしょうけど,どれくらい除くのか(1つだけで良いとも思えないでしょう?)。自分のデータをよ〜〜〜く見て考えましょう。
データをそのまま使う方法,上下一つずつ除く,上下数%除く,などいろいろやってみて,どのくらい違った結果になるのか,違うとすればどれが最も好ましいのかなど,考えながらデータを弄ってみるのが一番。
No.15502 Re: ROC曲線 【かな】 2011/10/15(Sat) 22:47
御回答ありがとうございます。
統計を学生の頃授業で習ったことがないもので,結果を統計にかけると有意な差等が出てくることがを面白いと感じましたが,統計は本を読んでも書いてある例すら難しくて中々理解できません。
青木先生の御回答はとても分かりやすくて理解できました。また困ったことがあったらよろしくお願い致します。
● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る