★ 数量化II類の相関比,カテゴリースコアについて ★

5943. 数量化II類の相関比,カテゴリースコアについて 宮崎 2005/02/11 (金) 18:28
└5945. Re: 数量化II類の相関比,カテゴリースコアについて 青木繁伸 2005/02/11 (金) 18:36
 └5947. Re^2: 数量化II類の相関比,カテゴリースコアについて 宮崎 2005/02/11 (金) 20:04
  ├5964. Re^3: 数量化II類の相関比,カテゴリースコアについて にゃんちゅう 2005/02/12 (土) 16:07
  └5949. Re^3: 数量化II類の相関比,カテゴリースコアについて 青木繁伸 2005/02/11 (金) 20:40
   └5965. Re^4: 数量化II類の相関比,カテゴリースコアについて 宮崎 2005/02/12 (土) 19:58


5943. 数量化II類の相関比,カテゴリースコアについて 宮崎  2005/02/11 (金) 18:28
数量化II類の相関比とカテゴリースコアについてお聞きしたいと思います。有効ケースが29657で数量化II類の相関比が 0.00289となり,的中率が78.57%と出たのですがこのデータは正しく判別されてると考えていいのでしょうか?相関比が1に近くなるほど,うまく 判別されると解釈してるのですが,どうなのでしょうか? 

     [このページのトップへ]


5945. Re: 数量化II類の相関比,カテゴリースコアについて 青木繁伸  2005/02/11 (金) 18:36
ローマ数字を使わないで,と,書いて,あるのにな。
この記事およびタイトルにローマ数字のIIのような文字があるのは,I を二つ書いてあるからなんです。

> 相関比が1に近くなるほど,うまく判別されると解釈してるのですが,どうなのでしょうか? 

その通り。貴方の解釈は正しい。と,思う。

> 数量化II類の相関比とカテゴリースコアについてお聞きしたいと思います。有効ケースが29657で数量化IIの相関比が0.00289となり,的中率が78.57%と出たのですがこのデータは正しく判別されてると考えていいのでしょうか?

データの個数が半端じゃないですね。データマイニングでしょうか。
何群の判別か分からないのですが,群ごとの例数が,非常にアンバランスなんじゃないですか。たとえば二群判別でA群の割合が95%なら,予測として全部A群だと予測すれば,95%の正判別率になりますよね。

     [このページのトップへ]


5947. Re^2: 数量化II類の相関比,カテゴリースコアについて 宮崎  2005/02/11 (金) 20:04
注意書きをよく読んでなっかので申し訳ありません。
判別群は2つです。
ある地域の斜面崩壊危険度を予測するため に,斜面崩壊に影響が高いといわれているアイテムを説明変数に4つ選び,崩壊の有無を目的変数として数量化二類をおこなった結果でそうなりました。確かに 非崩壊地のメッシュ数に対して崩壊地のメッシュ数はものすごく小さなものなのですが,そもそもそういった両者に大きな違いがあるものに対して数量化二類を 用いるのは間違ったことなのでしょうか?

     [このページのトップへ]


5964. Re^3: 数量化II類の相関比,カテゴリースコアについて にゃんちゅう  2005/02/12 (土) 16:07
>そもそもそういった両者に大きな違いがあるものに対して数量化二類を用いるのは間違ったことなのでしょうか?

その可能性は大ですが,
(1)判別分析の予測のときに等確率に生起するものとする場合と,事前分布に基づくものとするものとあり,あななのは事前分布にもとづいて処理すべきでしょう。

(2)数量化においてそのようなオプションがないなら判別分析を用いればいいです。そのとき,コーディングをするか,数量化得点を利用すればいいです。

(3)データが多いようですから,データを分割してcross-validation するのもいいでしょう。

(4)いざとなれば,多い方のデータを少ない方のデータ数に合わせてサンプリングしなおしてもいいのでは。

ま,あくまで可能性ですので何もしないより前進があるかもしれません。

 

     [このページのトップへ]


5949. Re^3: 数量化II類の相関比,カテゴリースコアについて 青木繁伸  2005/02/11 (金) 20:40
> そもそもそういった両者に大きな違いがあるものに対して数量化二類を用いるのは間違ったことなのでしょうか?

ま,そう言うことでしょう。
予測率と言うことなら,先に行ったような予測法をとればものすごく正確(そう)な予測が可能なわけですから。

でも,その予測の正確性というのは,「とにかく多い方!」という予測をすることではないわけですから。    常識的な判断が望まれますね。

     [このページのトップへ]


5965. Re^4: 数量化II類の相関比,カテゴリースコアについて 宮崎  2005/02/12 (土) 19:58
いろいろとご指摘していただきありがとうございます。ある市内全域で通用するようなハザードマップを作ろうとしていたので,膨大な量になってしまいました。解析対象地の選定からもう少し考えていきたいと思います。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 032 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る