★ 数量化IV類と主座標分析 ★

 370 数量化IV類と主座標分析  青木繁伸  2002/07/05 (金) 21:55
  390 Re: 数量化IV類と主座標分析  青木繁伸  2002/07/09 (火) 22:07
   392 Re^2: 数量化IV類と主座標分析  SATOI  2002/07/10 (水) 11:51
    393 Re^3: 数量化IV類と主座標分析  青木繁伸  2002/07/10 (水) 13:50
  378 Re: 数量化IV類と主座標分析  暑い夜  2002/07/06 (土) 23:32
   381 Re^2: 数量化IV類と主座標分析  青木繁伸  2002/07/07 (日) 22:16
   379 Re^2: 数量化IV類と主座標分析  出口慎二  2002/07/07 (日) 01:18
  372 Re: 数量化IV類と主座標分析  出口慎二  2002/07/05 (金) 23:14
   374 Re^2: 数量化IV類と主座標分析_2  出口慎二  2002/07/06 (土) 00:58
   373 Re^2: 数量化IV類と主座標分析_1  出口慎二  2002/07/06 (土) 00:57


370. 数量化IV類と主座標分析  青木繁伸  2002/07/05 (金) 21:55
数量化IV類と主座標分析はともに,類似度行列を元にして対象の配置を二次元平面に近似する,オーディネーション手法ですが,その応用例というのはなかなか見あたりません。
主座標分析については,イングランドの主要都市間の道路距離を類似度行列として分析して,実際の地図上における都市の位置関係がかなり再現されるという例が教科書にありました。

このまえ,CD-ROM版の理科年表を繰っていたら,日本の都道府県庁所在地間の距離というのがありました。これに基づいて数量化IV類と主座標分析を行ったのですが,結果が思わしくない(地図が再現できない)という結果でした。

どこか,間違えたのでしょうか。それとも,分析プログラムがおかしいのか。

     [このページのトップへ]


390. Re: 数量化IV類と主座標分析  青木繁伸  2002/07/09 (火) 22:07
見直してみても,プログラムには,おかしな所は見あたらない(だから,間違いないとは言えないが)

しかし,考えてみると,
47都道府県の経度と緯度の情報(47×2=94個)があれば,位置関係は完全!!に表示できるのに,距離に基づく類似度行列の情報(47*46/2=1081)を使って,位置関係が表示できないと言うのはおかしいと言えばおかしい。
ま,1081個のデータも94個のデータを使って計算されているのではあるけれど。

だったらなおさら,へん!!

     [このページのトップへ]


392. Re^2: 数量化IV類と主座標分析  SATOI  2002/07/10 (水) 11:51
面白いテーマなので私も挑戦。
理科年表がないので,WEB上から各都市の緯度経度,距離算出プログラムをGET。
先生のEXCEL_VBAに適用してみました。

主座標分析はOK,数量化IV類は固有値計算に失敗という結果でした。
主座標分析の2値を散布図とすると,アーチはきつくなるもののほぼ地図上の
位置が反映されます。

もしかして理科年表の距離データに問題があるのでは‥‥。

     [このページのトップへ]


393. Re^3: 数量化IV類と主座標分析  青木繁伸  2002/07/10 (水) 13:50
SATOI さん コメントありがとうございました。

もう一度と思って,やってみました。

ばんざい!主座標分析,うまくいきました。
(今まで,データを用意するところから初めて分析まで,二回繰り返したのです。そのたびにうまく行かなかったのです。データの準備の所で,何か不手際があったのでしょう。)

みなさん,お騒がせしました。

分析結果を以下に貼っておきます。
二乗距離に基づく類似度を使って,主座標分析で分析したものです。
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/princo-japan.png

     [このページのトップへ]


378. Re: 数量化IV類と主座標分析  暑い夜  2002/07/06 (土) 23:32
> 数量化IV類と主座標分析はともに,類似度行列を元にして対象の配置を二次元平面に近似する,オーディネーション手法ですが,その応用例というのはなかなか見あたりません。
> このまえ,CD-ROM版の理科年表を繰っていたら,日本の都道府県庁所在地間の距離というのがありました。これに基づいて数量化IV類と主座標分析を行ったのですが,結果が思わしくない(地図が再現できない)という結果でした。

コメントではないけれど,私も理科年表にある日本の都市間距離データをMDSの数値例に使おうと考えています.クラスカルの本にある米国地図のように,うまく日本地図が再現できるはずだと予想しています.

で,古典的MDS(主座標分析)は,たしか,距離行列を固有値分解するだけでしたから,主成分分析が個体(都市)間のユークリド距離を2次元近似することに相当してるはずです.

で,数量化IV類ですが,MDSがあり,主座標分析があり,という中で,どこに存在価値があるのでしょうか?.一度も応用したことないのですが,どの辺がMDSに対する優位点ですか?.

     [このページのトップへ]


381. Re^2: 数量化IV類と主座標分析  青木繁伸  2002/07/07 (日) 22:16
> 私も理科年表にある日本の都市間距離データをMDSの数値例に使おうと考えています.クラスカルの本にある米国地図のように,うまく日本地図が再現できるはずだと予想しています.

是非是非。
結果のご報告をお待ちしております。

> で,古典的MDS(主座標分析)は,たしか,距離行列を固有値分解するだけでしたから,主成分分析が個体(都市)間のユークリド距離を2次元近似することに相当してるはずです.

やはり,私のプログラムミスでしょうか。
再検証してみます。

> で,数量化IV類ですが,MDSがあり,主座標分析があり,という中で,どこに存在価値があるのでしょうか?.一度も応用したことないのですが,どの辺がMDSに対する優位点ですか?.

適用例が少ないと言うことから見れば,有意性を主張できるまでに至っていない(今後も見込みなし)ということでしょうか。

     [このページのトップへ]


379. Re^2: 数量化IV類と主座標分析  出口慎二  2002/07/07 (日) 01:18
> で,数量化IV類ですが,MDSがあり,主座標分析があり,という中で,どこに存在価値があるのでしょうか?.一度も応用したことないのですが,どの辺がMDSに対する優位点ですか?.

とりあえず,私がIV類使う理由は,簡単だからです.計算が簡単.データの性格もあまり考える必要がない.

#因みに,私は,「MDS」と聞いて,クルスカルの方法を思い浮かべています.

尚,林氏ご自身,数量化とMDSの関係に触れて,親近性(などの)行列のもつ情報を過不足なく使うことの重要性を指摘しています.つまり,他に適切の方法があるときに,わざわざIV類を使う積極的理由があるわけではない,と.

数量化IVは,再現性を指向しているわけではない.もとの,漠然としかしていない,親近性らしい,という程度でしかない,つまり,特段の窮屈な前提条件などクリアし得ないデータに対してでも使える,フレキシブルなところが良さ.「暗闇に曙光を得る」という使い方が望ましい.

林知己夫,1976,多次元尺度解析法

を拾い読みながら書くと,たとえば,こんな感じでしょうか.この辺,そもそも,「数量化」という「哲学的(?)」なところも関わるでしょうけれど.

     [このページのトップへ]


372. Re: 数量化IV類と主座標分析  出口慎二  2002/07/05 (金) 23:14
今,先生のサイトを確認しようとしたら,開けませんでしたので,すみません,質問です.IV類についての疑問です.

元のデータ(近接度行列)が正だと,そのまま計算した時,固有値算出行列の対角は負になりますよね.そうすると,計算して得られる固有値も負になります.

とりあえず,試しに使ってみた結果があります.下記ページの中ほど,「問7に対する数量化IV類の適用結果」の部分です.

http://www.dataexploring.com/info/report/s02002/r02002.html

これはこれで,いいものなのでしょうか.

一応,林先生の書籍では,「 eij < 0 」に(元のデータを負に)して計算すれば良い,と書いてあるのだと思うのですが.

林先生ご自身が,数量化IV類の方向としては,MDA-ORをメインに使われているせいか,私も,あまり適応例を見つけられなくて困っています(さほど真剣に探してもいませんが...).

     [このページのトップへ]


374. Re^2: 数量化IV類と主座標分析_2  出口慎二  2002/07/06 (土) 00:58
BlackBoxのH行列

-40.2000    9.2000    9.2000   10.6000    4.4000    6.8000
  9.2000  -40.2000    7.4000   10.2000    5.6000    7.8000
  9.2000    7.4000  -35.0000    6.6000    5.0000    6.8000
 10.6000   10.2000    6.6000  -41.4000    6.2000    7.8000
  4.4000    5.6000    5.0000    6.2000  -29.4000    8.2000
  6.8000    7.8000    6.8000    7.8000    8.2000  -37.4000

私のプログラムのそれ.半分になってる!...

-20.1      4.6      4.6      5.3      2.2      3.4
  4.6    -20.1      3.7      5.1      2.8      3.9
  4.6      3.7    -17.5      3.3      2.5      3.4
  5.3      5.1      3.3    -20.7      3.1      3.9
  2.2      2.8      2.5      3.1    -14.7      4.1
  3.4      3.9      3.4      3.9      4.1    -18.7
で,この固有値を解きます.が,BlackBoxでは,「解が求まりません。」でした.もっとも,負の固有値なんておかしいわけで,求まらないはずの解が求まったりしないよう,意図的な仕様で「求めない」のかとも思いますが.

やはり,「 eij < 0 」にして,負の固有値など出さないように使うものなのでしょうか....

     [このページのトップへ]


373. Re^2: 数量化IV類と主座標分析_1  出口慎二  2002/07/06 (土) 00:57
> 今,先生のサイトを確認しようとしたら,開けませんでしたので,...

失礼しました.開けました.そこで,先の例のデータで,先生のBlackBox使ってみました.

使用したデータ
0     
4.6 0    
4.6 3.7 0   
5.3 5.1 3.3 0  
2.2 2.8 2.5 3.1 0 
3.4 3.9 3.4 3.9 4.1 0
私のプログラムの方が,下側三角を正方行列に直し忘れている(今気付きました!)ため,全て値が半分になっていますが,他は,固有値算出行列時点では,BlackBoxと同じでした.

(つづく)

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 019 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る