★ クラスター分析のクラスター数の決定について ★
97 クラスター分析のクラスター数の決定について CCC 2001/08/21 (火) 21:22
99 Re: クラスター分析のクラスター数の決定について tokotoko 2001/08/23 (木) 11:19
100 Re^2: クラスター分析のクラスター数の決定について tokotoko 2001/08/23 (木) 12:11
| 97. クラスター分析のクラスター数の決定について CCC 2001/08/21 (火) 21:22 |
始めまして,実は最近クラスター分析を学んでいるのですが,以下の点がどうしても分かりません。どなたかご存知でしたらご教授お願いします。
クラスター分析後のクラスタ数の決定は通常難しいのですが,一種の指標としてCCC(立方クラスター基準),擬似F統計量,擬似t2統計量などがあると聞きます。
1.CCCとはどういう内容なのか?はっきりとわかっていません。
2.3つの方法でどれが一番良いのか?その根拠が分かっていません。
以上の点よろしくお願いします。 |
[このページのトップへ]
| 99. Re: クラスター分析のクラスター数の決定について tokotoko 2001/08/23 (木) 11:19 |
> 1.CCCとはどういう内容なのか?はっきりとわかっていません。
WEBでマニュアルが読めますから,まずそれを読むといいでしょう.
http://www.sas.com/service/doc/pubcat/techreports/5903.pdf
> 2.3つの方法でどれが一番良いのか?その根拠が分かっていません。
2次元で散布図を視察して,球状に「自然な」クラスターが存在する場合もあれば,鎖状に「自然な」クラスターが存在することもあるでしょ.また質問紙による調査データ(特に意識調査)のような場合に,主成分などでクラスター分析しようと,散布図をみると,一様に分布し「自然な」クラスターは存在しないこともあるでしょ.
球状の集落を作る場合と,鎖状の集落を作る場合では,分離基準以前に,アルゴリズムそのものから検討しなければいけない.
CCCは,集落が球状になっていれば,よい指標であることがシミュレーションで確認されているようです.
うまく「自然な」集落があれば,どの基準も一致して,同じクラスター数を薦めると思いますよ.
|
[このページのトップへ]
| 100. Re^2: クラスター分析のクラスター数の決定について tokotoko 2001/08/23 (木) 12:11 |
500字超えたので,削ったら,読み返すと,意味不明確になってしまいましたね.クラスターの形状によって選択基準どころか,アルゴリズムも選択しなければいけない,という趣旨でした. |
[このページのトップへ]
● 「統計学関連なんでもあり」の過去ログ--- 015 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る