No.09082 DCAとクラスター分析のギャップ  【Thaila】 2009/02/01(Sun) 20:46

種と場所に関するデータ(種は在,不在データ,種数は13,場所は128)をDCAで解析して種をグラフ上にプロットした のち同じデータを用いてクラスター解析(ユークリディアン,ウォード法)によって各種を分類したところ,DCAグラフ上でかなり離れた所に位置する2種が いちばん近いクラスター形成してしまいました.

同じデータを用いてDCA,クラスター分析を行ったのに,なぜこのようになってしまったのか理由を知りたいのと,DCA,クラスター解析のどちらを信用するべきなのかをご教授いただきたいと思います.

どうぞ,よろしくお願いたします.

No.09095 Re: DCAとクラスター分析のギャップ  【Thaila】 2009/02/03(Tue) 11:57

青木先生

ご返信が遅くなってしまい大変申し訳ありません.また先日は説明が不十分で,ご迷惑をお かけいたしましたことも重ねてお詫び申し上げます.私が行ったDCAとはDetrended Correspondence Analysis( 除歪対応分析 )です.種と場所のマトリックスデータからDCAによって軸を抽出し,そのうち説明できる割合が高い2軸からDCAの座標平面を得ました.この座標上に種 のデータをプロットしました.またこれとは別に同じデータを用いてクラスター解析により,種をクラスターに分けたところ,DCAの座標平面では距離が離れ ている2種が,クラスター解析ではいちばん近いクラスターを形成しまったため,先日の質問をさせていただいた次第です.ご教授,どうぞよろしくお願い申し 上げます.

No.09096 Re: DCAとクラスター分析のギャップ  【青木繁伸】 2009/02/03(Tue) 12:41

> 説明できる割合が高い2軸

クラスター分析では,そのような制限をつけないので結果が異なることはあるでしょう。
また,変数を正規化して分析に用いるかどうかでも結果が変わってきます。

No.09097 Re: DCAとクラスター分析のギャップ  【青木繁伸】 2009/02/03(Tue) 13:07

DCA は,R だと vegan ライブラリの decorana 関数でできるようですね。
その example にも取り上げられている,varespec データフレームを hclust でも分析して,比較しました。たとえば,DCA(右)では,16と14は近くにあるようですが,クラスター分析(左)では別のクラスターに属していると考 える方が良さそうです。また,元データを変数ごとに正規化(scale)して,クラスター分析すると(中),まるで異なったクラスター構造になっています (クラスター手法を変えても,違ったデンドログラムが得られます)。
違った結果のどれが正しいかというのではなく,それぞれの解はそれぞれの特徴を持つ解なので,その辺を考慮して解釈するというのが正解なのではないでしょうか。
図をクリックすると,原寸表示されます。


No.09098 Re: DCAとクラスター分析のギャップ  【Thaila】 2009/02/03(Tue) 13:48

青木先生

丁寧にご回答いただき,ありがとうございます."説明ができる2軸"というのがDCAと クラスター解析との大きな違いであることに気がつきませんでした.またデータを正規化してクラスター分析を行う,というようなことも考えておりませんでし た.添付していただいた図のように,同じクラスター解析でもデータの扱い方によって変わってしまうことが理解できました.自分のデータの質や,研究の中に おけるデータの扱い方とその結果の意味などを考えながら,先生のサイトも参考にさせていただきつつ解析を進めていきたいと思います.

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る