★ クラスタリング結果の可視化 ★

8168. クラスタリング結果の可視化 mori 2005/11/02 (水) 11:07
└8169. Re: クラスタリング結果の可視化 青木繁伸 2005/11/02 (水) 11:10
 └8170. Re^2: クラスタリング結果の可視化 mori 2005/11/02 (水) 11:35
  └8171. Re^3: クラスタリング結果の可視化 青木繁伸 2005/11/02 (水) 11:41
   └8172. Re^4: クラスタリング結果の可視化 mori 2005/11/02 (水) 11:54


8168. クラスタリング結果の可視化 mori  2005/11/02 (水) 11:07
12次元の連続値データ50個に対してクラスタリングを適用しようとしてます。

Rのk-meansを使ってクラスタリングをしてみたのですが,この結果を可視化する(どのデータとどのデータが近いかを視覚的に把握する)よい方法はないでしょうか?

よく平面にサンプルの点がばらまいてあってクラスターごとに丸で囲っているような絵を見るのですが,これはデータが2次元の場合のみしかできないという理解であってますでしょうか?

アドバイスお願いします

     [このページのトップへ]


8169. Re: クラスタリング結果の可視化 青木繁伸  2005/11/02 (水) 11:10
> よく平面にサンプルの点がばらまいてあってクラスターごとに丸で囲っているような絵を見るのですが,これはデータが2次元の場合のみしかできないという理解であってますでしょうか?

あっております。

もし,3次元以上の場合には,二次元平面へ写像すればよいわけで,そのためには主座標分析,主成分分析などを用いればよいでしょう。2次元で十分な近似ができればよいのですが。

     [このページのトップへ]


8170. Re^2: クラスタリング結果の可視化 mori  2005/11/02 (水) 11:35
アドバイスありがとうございます。

> もし,3次元以上の場合には,二次元平面へ写像すればよいわけで,そのためには主座標分析,主成分分析などを用いればよいでしょう。2次元で十分な近似ができればよいのですが。

多次元尺度法というのを使ってみようと考えていました。15次元を2次元にマッピングしたとき距離が保たれるかというのは調べてみたいと思います。あと主成分分析についても調べてみます。

あと階層的クラスタリングは高次元でも近いもの同士がまとまるような樹形図で表されているように見えます。階層的クラスタリングは高次元データの可視化に適しているのでしょうか?

そもそもk-meansと階層的クラスタリングをどう使い分けるかがあいまいです。何かご存知でしたらアドバイスお願いできますでしょうか。

     [このページのトップへ]


8171. Re^3: クラスタリング結果の可視化 青木繁伸  2005/11/02 (水) 11:41
> あと階層的クラスタリングは高次元でも近いもの同士がまとまるような樹形図で表されているように見えます。階層的クラスタリングは高次元データの可視化に適しているのでしょうか?

そういうことだと思いますよ。

> そもそもk-meansと階層的クラスタリングをどう使い分けるかがあいまいです。何かご存知でしたらアドバイスお願いできますでしょうか。

対象数が多いとき,また,事前にいくつのクラスターがあるか仮定できる(仮定する)ときには k-means がよいと思います。

可視化には階層的クラスター分析がよいでしょう。

     [このページのトップへ]


8172. Re^4: クラスタリング結果の可視化 mori  2005/11/02 (水) 11:54
ありがとうございます。大変勉強になりました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 035 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る