No.15503 主成分得点でクラスター分析するとき。  【なち】 2011/10/16(Sun) 17:59

はじめまして。理系大学生です。

主成分得点でクラスター分析する時なのですが,採用するのは,主成分の固有値が1を超えているものすべて,と考えています。(情報が元より多いので)
私のデータの場合,第5まで採用する事になるのですが,このやりかたが合ってるのか不安です。

ご意見よろしくお願いします。

No.15504 Re: 主成分得点でクラスター分析するとき。  【青木繁伸】 2011/10/16(Sun) 18:18

クラスター分析するのが目的なら,何も何十%かの情報しか持たない主成分を用いるより,前部の変数を使う(情報を100%利用する)方が良いと思いますけど,それがなにか不都合でもあるのでしょうか?

> 私のデータの場合,第5まで採用する事になるのですが

第5主成分までで寄与率はどれくらいになるのでしょうか。そちらの方が分からないと。

また,必ずしも,「主成分の固有値が1を超えているものすべて」というのが適切であるとも限りません。

No.15505 Re: 主成分得点でクラスター分析するとき。  【なち】 2011/10/16(Sun) 18:57

お早い返信ありがとうございます。

>全部の変数を使う(情報を100%利用する)

私は,新しい情報量(主成分得点)が,元の情報量より少ないのだから使わなくても良いのかなと考えていました。ちょっと,理解が足りていなかったかもしれません。全部の変数を使ってクラスターするのが普通なのでしょうか?

第5主成分までの累積寄与率は0.96%となっています。

No.15508 Re: 主成分得点でクラスター分析するとき。  【青木繁伸】 2011/10/16(Sun) 21:49

> 第5主成分までの累積寄与率は0.96%となっています。

「累積寄与率は0.96%」ではなく,96% なのでしょう。

だったら,全部の変数を使ってクラスター分析してもほとんど同じ結果になるでしょう。
たとえ,96% というように 100% に近くなくても,全変数を使ってクラスター分析をすることを否定する根拠にはならないでしょう。必ず,「なぜ全部の変数を使って分析しなかったのですか?」という質問が出るでしょう。それに対して,どのように答えますか?
なお,変数の測定単位(平均値・分散)が違うときには,当然ながら(!)変数を正規化してからクラスター分析する必要もあるでしょう。

No.15509 Re: 主成分得点でクラスター分析するとき。  【なち】 2011/10/16(Sun) 22:24

>「累積寄与率は0.96%」ではなく,96% なのでしょう。
すみません間違えました,96% です。

ありがとうございます,もう少し掘り下げて勉強します。
正規化については大丈夫です。(おそらく!)

ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る