★ 主成分分析と数量化III類について ★

6391. 主成分分析と数量化III類について 学徒 2005/04/06 (水) 18:31
└6392. Re: 主成分分析と数量化III類について 青木繁伸 2005/04/06 (水) 18:38
 └6394. Re^2: 主成分分析と数量化III類について 学徒 2005/04/06 (水) 18:54
  └6396. Re^3: 主成分分析と数量化III類について 青木繁伸 2005/04/06 (水) 19:05
   └6399. Re^4: 主成分分析と数量化III類について 学徒 2005/04/06 (水) 20:50
    └6406. Re^5: 主成分分析と数量化III類について にゃんちゅう 2005/04/07 (木) 19:28
     └6422. Re^6: 主成分分析と数量化III類について 学徒 2005/04/09 (土) 00:38


6391. 主成分分析と数量化III類について 学徒  2005/04/06 (水) 18:31
こんにちは。実験計測データを多変量解析でアプローチしています。列数3000(サンプル数),行数100(各サンプルのデー タ,定量数)の行列を用意し,分散,共分散行列(100*100)に変換し,これを用いて主成分分析を行いました。結果は,最大の固有値と次に大きい固有 値の寄与率の合計が70%で,妥当な平面分布を得られました。次にダミー変数を用い,ある基準の数値を上回る行列の要素=1,下回る要素=0と行列を変換 し,"主成分分析"を行うと,高い寄与率を持つ固有値が消えてしまいました(最大の固有値でも寄与率が10%)。また,この1と0のみからなる行列を"数 量化III類"を用いて解析しようと考えているのですが,やはり寄与率の高い固有値が現れません。ここで質問なのですが,"主成分分析"の各固有値の寄与 率と,"数量化III類"の各固有値の寄与率は同じ意味を持っているのでしょうか?。また,同じ1,0のみからなる行列を用いるとき,主成分分析と数量化 III類では同じ結果になると解釈して良いのでしょうか? 僕は初心者であまり数式には詳しくないのでひたすら文字の羅列になってしまいましたが,どうぞ よろしくお願いします。

     [このページのトップへ]


6392. Re: 主成分分析と数量化III類について 青木繁伸  2005/04/06 (水) 18:38
> ある基準の数値を上回る行列の要素=1,下回る要素=0と行列を変換し,"主成分分析"を行うと,高い寄与率を持つ固有値が消えてしまいました(最大の固有値でも寄与率が10%)。

変数(列)ごとに異なる基準を使用すると解釈したのですがよろしいでしょうか。
連続量を二値データに変換する訳ですから相当な情報量の損失が起きますね。そのあたりは大丈夫なんでしょうか。

> "主成分分析"の各固有値の寄与率と,"数量化III類"の各固有値の寄与率は同じ意味を持っているのでしょうか?。

同じといえば同じでしょうが

> また,同じ1,0のみからなる行列を用いるとき,主成分分析と数量化III類では同じ結果になると解釈して良いのでしょうか?

同じ結果にはなりませんね。

簡単な例を分析してみると良いでしょう。

     [このページのトップへ]


6394. Re^2: 主成分分析と数量化III類について 学徒  2005/04/06 (水) 18:54
>> 変数(列)ごとに異なる基準を使用すると解釈したのですがよろしいでしょうか。

早速のお返事ありがとうございます。
どの列も単位は距離なので,基準は全て同じにしました。
現在知りたいのは,各サンプルの各変数に対する反応(yes or no)なので二値データに変換しました。
主成分分析では,2つ(大きい順に)の寄与率の合計が50%を超えるればその2つの軸から構成される平面の分布は妥当だと教わりました。数量化III類でもそうなのでしょうか?

     [このページのトップへ]


6396. Re^3: 主成分分析と数量化III類について 青木繁伸  2005/04/06 (水) 19:05
> 主成分分析では,2つ(大きい順に)の寄与率の合計が50%を超えるればその2つの軸から構成される平面の分布は妥当だと教わりました。

50%という数値は,普遍的なものではないでしょう。
高ければ高いほどよいものではあるが,分野,対象,目的により違うのが当然なので,共通的な基準というものはないでしょう。

> 数量化III類でもそうなのでしょうか?

同じ基準で評価はできないと思います。
(同じ50%という数値を使ったとしても。というのは,同じデータを使っても,主成分分析と数量化III類の結果が同じにならないのですから,その違う結果を同じ数値で評価できないでしょう。)

     [このページのトップへ]


6399. Re^4: 主成分分析と数量化III類について 学徒  2005/04/06 (水) 20:50
明らかに僕の勉強不足だったみたいですね。もう一度主成分分析と数量化III類の数式を見直して理解を深めてみたいと思います。 もう一つだけ質問をさせてください。今回のような,ある基準を設け,各サンプルの持つ様々な特性を基準以上か基準以下かのみ(二値のみ)で,各サンプルの 分布を得たい場合,他にどのような解析方法があるのでしょうか?数量化IV類も考えたのですが,この次に扱うデータはサンプル数30000,変数500とい う大変大きなデータなので,類似行列を確保するだけのメモリーがありません。よろしく御教授ください。

     [このページのトップへ]


6406. Re^5: 主成分分析と数量化III類について にゃんちゅう  2005/04/07 (木) 19:28
> 明らかに僕の勉強不足だったみたいですね。もう一度主成分分析と数量化III類の数式を見直して理解を深めてみたいと思います

数量化III類と主成分分析とは当然関係があります。そのとき問いかけは同じことの別の表現かとすべきでしょう。

注意すべきは,2値型の場合の数量化III類には2つのタイプがあり,回転をしない主成分分析にも固有ベクトル型と負荷量型の2つがあることです。主成分分析の2つのタイプは別表現ですが,数量化III類の2つのタイプは別の分析です。

主成分分析と数量化III類が別の表現であることを示している例は
http://www.ec.kagawa-u.ac.jp/~hori/mva.html#pca
にあります。

     [このページのトップへ]


6422. Re^6: 主成分分析と数量化III類について 学徒  2005/04/09 (土) 00:38
> 主成分分析と数量化III類が別の表現であることを示している例は
> http://www.ec.kagawa-u.ac.jp/~hori/mva.html#pca
> にあります。

なるほど,参考にさせて頂きます。ありがとうございました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 033 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る