No.00028 Rによるクラスター分析について 【たじま】 2006/05/12(Fri) 12:02
クラスター分析である変数を分類しているのですが,今までは変数の数が20個程度だったのでデンドログラムを見ながら視覚的にどの変数がどのクラスタに分類されるかを行ってきました.使っていた関数は hclust です.
今回,変数が 1,000 以上あるデータをクラスタリングしたいのですが,デンドログラムでは視覚的に分類するのが不可能になってしまいます.そこで, R を使って
1.距離はユークリッド距離,手法はウォード法
2.クラスターの数を例えば10に固定する
3.「X_1 〜 X_1000 という変数がクラスタ1からクラスタ10までのどのクラスタに入っているか」のデータを取り出したい
ということです. 結果イメージは以下のような感じです.
変数 | クラスタ番号
------------------------
X_1 | 7
X_2 | 2
X_3 | 2
・・・・・・
X_1000| 3
これを hclust の機能を使ってそれを取り出すことは可能でしょうか? または他の関数が存在するのでしょうか?
初歩的な質問で恐縮ですが,よろしくお願いします.
No.00030 Re: Rによるクラスター分析について 【青木繁伸】 06/05/12(Fri) 12:56
hclust のオンラインヘルプをご覧になったでしょうか?
その中に Examples があります。2番目の例があなたの問題を解決できるのではないかと思います。
## cut the tree into ten clusters and reconstruct the upper part of the
## tree from the cluster centers.
hclust の members 引数について調べてみられたらいかがでしょうか。
No.00033 Re: Rによるクラスター分析について 【たじま】 06/05/12(Fri) 14:39
青木先生,ありがとうございました。
早速調べてみます。
● 「統計学関連なんでもあり」の過去ログ--- 038 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る