★ クラスター分析のクラスター数の決定について ★

 97 クラスター分析のクラスター数の決定について  CCC  2001/08/21 (火) 21:22
  99 Re: クラスター分析のクラスター数の決定について  tokotoko  2001/08/23 (木) 11:19
   100 Re^2: クラスター分析のクラスター数の決定について  tokotoko  2001/08/23 (木) 12:11


97. クラスター分析のクラスター数の決定について  CCC  2001/08/21 (火) 21:22
始めまして,実は最近クラスター分析を学んでいるのですが,以下の点がどうしても分かりません。どなたかご存知でしたらご教授お願いします。

クラスター分析後のクラスタ数の決定は通常難しいのですが,一種の指標としてCCC(立方クラスター基準),擬似F統計量,擬似t2統計量などがあると聞きます。

1.CCCとはどういう内容なのか?はっきりとわかっていません。
2.3つの方法でどれが一番良いのか?その根拠が分かっていません。

以上の点よろしくお願いします。

     [このページのトップへ]


99. Re: クラスター分析のクラスター数の決定について  tokotoko  2001/08/23 (木) 11:19
> 1.CCCとはどういう内容なのか?はっきりとわかっていません。

WEBでマニュアルが読めますから,まずそれを読むといいでしょう.

http://www.sas.com/service/doc/pubcat/techreports/5903.pdf

> 2.3つの方法でどれが一番良いのか?その根拠が分かっていません。

2次元で散布図を視察して,球状に「自然な」クラスターが存在する場合もあれば,鎖状に「自然な」クラスターが存在することもあるでしょ.また質問紙による調査データ(特に意識調査)のような場合に,主成分などでクラスター分析しようと,散布図をみると,一様に分布し「自然な」クラスターは存在しないこともあるでしょ.
球状の集落を作る場合と,鎖状の集落を作る場合では,分離基準以前に,アルゴリズムそのものから検討しなければいけない.
CCCは,集落が球状になっていれば,よい指標であることがシミュレーションで確認されているようです.

うまく「自然な」集落があれば,どの基準も一致して,同じクラスター数を薦めると思いますよ.

     [このページのトップへ]


100. Re^2: クラスター分析のクラスター数の決定について  tokotoko  2001/08/23 (木) 12:11
500字超えたので,削ったら,読み返すと,意味不明確になってしまいましたね.クラスターの形状によって選択基準どころか,アルゴリズムも選択しなければいけない,という趣旨でした.

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 015 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る