★ クラスター分割における項目結節処理について ★

8392. クラスター分割における項目結節処理について セイジ 2005/11/19 (土) 08:02
├8403. Re: クラスター分割における項目結節処理について 青木繁伸 2005/11/19 (土) 23:11
│└8405. Re^2: クラスター分割における項目結節処理について 青木繁伸 2005/11/19 (土) 23:26
└8394. Re: クラスター分割における項目結節処理について 青木繁伸 2005/11/19 (土) 09:20
 └8395. Re^2: クラスター分割における項目結節処理について 青木繁伸 2005/11/19 (土) 09:44
  └8406. Re^3: クラスター分割における項目結節処理について セイジ 2005/11/20 (日) 04:47
   ├8411. Re^4: クラスター分割における項目結節処理について 青木繁伸 2005/11/20 (日) 09:48
   └8407. Re^4: クラスター分割における項目結節処理について セイジ 2005/11/20 (日) 08:10
    └8408. Re^5: クラスター分割における項目結節処理について セイジ 2005/11/20 (日) 08:11
     └8410. Re^6: クラスター分割における項目結節処理について 青木繁伸 2005/11/20 (日) 09:40
      └8412. Re^7: クラスター分割における項目結節処理について 青木繁伸 2005/11/20 (日) 10:38
       └8413. Re^8: クラスター分割における項目結節処理について セイジ 2005/11/21 (月) 05:13
        ├8426. Re^9: クラスター分割における項目結節処理について 青木繁伸 2005/11/21 (月) 19:12
        ├8420. Re^9: クラスター分割における項目結節処理について 青木繁伸 2005/11/21 (月) 13:38
        └8416. Re^9: クラスター分割における項目結節処理について 青木繁伸 2005/11/21 (月) 10:32
         └8431. Re^10: クラスター分割における項目結節処理について セイジ 2005/11/22 (火) 19:08
          └8432. Re^11: クラスター分割における項目結節処理について 青木繁伸 2005/11/22 (火) 20:34
           ├8518. Rでのクラスター分析(Re^12: クラスター分割における項目結節処理について) セイジ 2005/12/01 (木) 15:47
           │└8523. Re: Rでのクラスター分析(Re^12: クラスター分割における項目結節処理について) 青木繁伸 2005/12/01 (木) 17:37
           │ └8527. Re^2: Rでのクラスター分析(Re^12: クラスター分割における項目結節処理について) セイジ 2005/12/02 (金) 16:46
           └8433. Re^12: クラスター分割における項目結節処理について 青木繁伸 2005/11/22 (火) 21:55
            └8436. Re^13: クラスター分割における項目結節処理について セイジ 2005/11/23 (水) 15:40
             └8438. Re^14: クラスター分割における項目結節処理について 青木繁伸 2005/11/23 (水) 17:59
              └8439. Re^15: クラスター分割における項目結節処理について セイジ 2005/11/23 (水) 21:38
               └8441. Re^16: クラスター分割における項目結節処理について 青木繁伸 2005/11/23 (水) 21:50
                └8450. Re^17: クラスター分割における項目結節処理について りえこ 2005/11/24 (木) 21:22
                 └8451. Re^18: クラスター分割における項目結節処理について 青木繁伸 2005/11/24 (木) 21:30
                  └8454. Re^19: クラスター分割における項目結節処理について りえこ 2005/11/24 (木) 21:41
                   └8457. Re^20: クラスター分割における項目結節処理について セイジ 2005/11/25 (金) 15:16


8392. クラスター分割における項目結節処理について セイジ  2005/11/19 (土) 08:02
ハンガリーで日本語教育に携わっている者です(統計に関しては初心者です)。現在,ハンガリーの日本語教師を対象に Personal Attitude Construct(PAC)分析を行いたいと考えています。PAC分析の専門書では,出てきたデータをHALWINという統計処理ソフトを利用しクラス ター分析を行っています(ウォード法・距離)。私はHALWINを持っておらず,ホームページから試用版をダウンロードしましたが,そこにはPAC分析に 必要なクラスター分析のプログラムが入っていませんでした。そこで,青木先生のホームページのBlack-BoxやVBAを利用し,PAC分析の専門書に 書いてあるデータを使ってクラスター分析をしてみましたが,PAC分析専門書に出てくるデンドログラムとはどうしても違う形になってしまいます。 HALWINを利用したデンドログラムは私の目から見ると,トーナメント表の片側半分,一方,Black-BoxやVBAを利用した場合には,トーナメン ト表全体のように見えます。そしてクラスタ番号の並ぶ順番も違うものになります。PAC分析の専門書の中に「・・・項目の結節を続ける処理(HALWIN などのソフトの場合に当てはまる。SPSSに組み入れられているものは併合された項目群と結節させるので該当しない)・・・」と書いてあり,この違いのこ とかとも思うのですが,Black-BoxやVBAのクラスター分析で,HALWINででるようなデンドログラムを出す方法はありますでしょうか。

     [このページのトップへ]


8403. Re: クラスター分割における項目結節処理について 青木繁伸  2005/11/19 (土) 23:11
> ・・・項目の結節を続ける処理(HALWINなどのソフトの場合に当てはまる。SPSSに組み入れられているものは併合された項目群と結節させるので該当しない)・・・

結果の読みとりを誤っていますね。
HALWINの出力が文字でデンドログラムを描くため,誤解したのでしょう。

> HALWINででるようなデンドログラムを出す方法はありますでしょうか。

今時は少ないでしょうね。
でも,同じデータを同じ方法で分析すれば,結果は同じになりますよ。
デンドログラムの見た目が違うだけです。

     [このページのトップへ]


8405. Re^2: クラスター分割における項目結節処理について 青木繁伸  2005/11/19 (土) 23:26
http://homepage3.nifty.com/yahoyorodu/spirituality_construct2.pdf
の最後にあるデンドログラムを普通に書き直すとこうなるわけです。
見かけはだいぶ違うけど,同じなんです。
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/cluster3.png

     [このページのトップへ]


8394. Re: クラスター分割における項目結節処理について 青木繁伸  2005/11/19 (土) 09:20
トーナメント表の片側というのは
あ−−−−−
     |
     |
い−−−−−−−−−−
          |
          |
う−−−−−−−−−−−−−−
のように表示されていると言うことでしょうか。
HALWIN の時代は終わったのか?(^_^)?HALWIN の作者は,かつての同級生なので,ちょっと辛口批評。。。(^_^)
クラスターの順序を変えて描くことはできますよね。上に描いたのと,下に描くのは同じですよね。
い−−−−−−−−−−
     |    |
あ−−−−−    |
          |
う−−−−−−−−−−−−−−

【PAC分析の専門書の中に「・・・項目の結節を続ける処理(HALWINなどのソフトの場合に当てはまる。SPSSに組み入れられているものは併合された項目群と結節させるので該当しない)・・・」と書いてあり】
というのは,さっぱり意味がわかりません。
最近隣法とWard法のことを言っているのだろうか。もしそうなら,そんなことをそんな風に言うPAC分析の専門書って。。。

ちなみに,HALWIN はどうなったか知らないですが,前身の HALBAU は,作者様にお手紙を出すと,研究者には無料で配布されることもあったようですが(^_^)

     [このページのトップへ]


8395. Re^2: クラスター分割における項目結節処理について 青木繁伸  2005/11/19 (土) 09:44
書き忘れましたが。


もし,「トーナメント表の片側」というのが上のようなことを指すのなら,それは,HALWIN がさぼっているというか,,,その方が描くのが簡単(HALWIN はちゃんとしたデンドログラムを描く気力がなかったのかも)というだけの話です。

     [このページのトップへ]


8406. Re^3: クラスター分割における項目結節処理について セイジ  2005/11/20 (日) 04:47
青木先生ご回答ありがとうございます。

【HALWINの出力が文字でデンドログラムを描くため,誤解したのでしょう。】ですが,PAC分析の専門書のデンドログラムや日本語教育関連の論文で使われているデンドログラムは文字で描かれたものではありません。

「デ ンドログラムの見た目が違うだけで,結果が同じになる」という先生の記述を読み,私自身のデータの取り扱い方が間違っているのではと不安になってきまし た。もしそうであれば大変なご迷惑をかけてしまった可能性があります。とりあえず(使用可能な文字を使って)PAC分析の専門書に出ているデータと描かれ ているデンドログラム(に似たもの)を描いてみます。(多少時間がかかると思いますが,見ていただければ幸甚です。)

     [このページのトップへ]


8411. Re^4: クラスター分割における項目結節処理について 青木繁伸  2005/11/20 (日) 09:48
デンドログラムの表現についてだけこちらへコメント


トーナメントの半分と全部ということについては,先 に示したとおりです。HALWIN の結果を全体のトーナメント表として描いても何の違いもありません。分析に必要なのはクラスター間の距離だけですから。上下に偏った枝を描こうと上下に釣 り合った枝を描こうと(後者の方がきれいな樹になるでしょうが),違いはありません。

     [このページのトップへ]


8407. Re^4: クラスター分割における項目結節処理について セイジ [URL]  2005/11/20 (日) 08:10
PAC分析の専門書で出ているデータとHALWINによって描かれたデンドログラム,そして同じデータをBlackBoxでクラスター分析した際に描かれたデンドログラム(いずれも略画)を描いてみました。

もし私のデータ解釈が間違っているのであれば,お許しください。

     [このページのトップへ]


8408. Re^5: クラスター分割における項目結節処理について セイジ [URL]  2005/11/20 (日) 08:11
上記の略画ですが

http://home.tvnet.hu/~ocsiba/karin/pac.pdf

にアップロードしてあります。

     [このページのトップへ]


8410. Re^6: クラスター分割における項目結節処理について 青木繁伸  2005/11/20 (日) 09:40
HALWIN は,罫線要素を使って描画するようになったみたいですね。
しかし,ASCII アートの手法による描画には違いありません。

も うひとつ,あなたが Black-Box を使って描画したデンドログラムですが,Black-Box に食わせたデータはどのようなものでしたか?示された PDF 文書の先頭にある形式のデータですと,どう逆立ちしてもHALWIN と同じにはなりません。なぜなら,そのデータは非類似度行列というか距離行列というか,対角部分が0であるものですから(私は PAC 分析についても,付け焼き刃で Web 検索した程度の知識がないですが,PAC 分析は,この形式のデータからクラスター分析を始めるようですね)。Black-Box は,距離行列からスタートするオプションは提供していませんから,このデータを食わせても正当な結果は出せません。

R のhclust は dist クラスにしてから分析できます。しかし結果はやはり異なります。一つには,先ほどの距離行列には同値が多いことがあるでしょう。PDF 文書にある,HALWINの分析結果をみても,(1,3), (4,7), (2,8), (6,13), (5,12), (11,14) はおなじ距離として描かれています。罫線要素を使った"セミ"グラフィックのせいではなくて,自非類似度行列を見ても距離1の組は,
(1,3), (1,6), (1,9), (1,16), (2,3), (2,8), (2,11), (3,10), (4,7), (4,12), (5,12), (5,13), (6,8), (6,13), (7,10), (7,12), (8,10), (11,14)
というような 感じです。これらのどれが一番近い項目とされても不思議ではない。階層的クラスター分析は一段階で一つずつクラスター(PAC分析で言えば項目の併合)を 作っていくわけですが,どの順序でクラスターが作られるかはプログラムによって違う可能性もある。そして最初の方で違いがあれば終わりの方でそれが拡大さ れる可能性がある。

     [このページのトップへ]


8412. Re^7: クラスター分割における項目結節処理について 青木繁伸  2005/11/20 (日) 10:38
VBA で書いてあるプログラムを,距離行列から出発できるように改造してやってみました。
結果は
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/cluster4.png
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/cluster5.png
に示してあります。

これと,PDF文書にあった分析例を比較すると,最も違うのが16番目の項目の扱いでしょうね。
距離行列を見てみると16はどちらかというとというか1に近いのではないかと思い,そうするとBlac-Boxの方がもっともらしい??
クラスターの形成過程は
ステップ 平方距離 距離 融合クラスター
1 1 1 1 3
2 1 1 2 8
3 1 1 4 7
4 1 1 4 12
5 1 1 5 13
6 1 1 11 14
7 1.666666667 1.290994449 1 9
8 2 1.414213562 6 15
9 2.333333333 1.527525232 2 10
10 3.5 1.870828693 5 6
11 4.452380952 2.110066575 2 5
12 5.833333333 2.415229458 1 16
13 8.357142857 2.890872335 1 4
14 11 3.31662479 1 2
15 11.85714286 3.443420227 1 11
(桁がずれて見にくいが)
二つのクラスター(項目)が融合されたとき,クラスターの代表名(代表番号)は若い方の番号となる。

     [このページのトップへ]


8413. Re^8: クラスター分割における項目結節処理について セイジ [URL]  2005/11/21 (月) 05:13
青木先生

回答及びBVAの結果,ありがとうございます。

Black-Boxで計算させたデータ は先生のおっしゃる通りPDF文書の先頭にあるデータです。Black-BoxにはPAC分析で使用するタイプのデータを扱うオプションがなく,VBAも 改造が必要となると,統計プログラムをまさにブラックボックスとして,そのまま使うことしかできない自分としては,苦しいなあという感じです。

PAC 分析は1名の被験者から得られたデータをもとにクラスター分析を行い,解釈を行った上でデンドログラムを見せながら被験者とインタビューをし,解釈に変更 を加えるという手順をとります。このため,デンドログラム自身はインタビューを行うための道具という役割になるので,多少形が違っていても益なる情報は被 験者から得られると思うのですが,各群に含まれる番号が少しでも違うと群の解釈が変わってしまうのではと不安です。(ちなみにこのデータは孤独感に関する もので,16は絶望するという項目です。)

ちなみにPDF資料に描いたPAC分析専門書記載デンドログラムのクラスターの形成過程は以下のとおりです。

1> 1+ 3 3 1
2> 2+ 8 8 1
3> 4+ 7 7 1
4> 5+12 12 1
5> 6+13 13 1
6> 11+14 14 1
7> 3+ 9 9 1.73205
8> 7+10 10 1.73205
9> 12+15 15 2.23607
10> 8+13 13 3.24037
11> 9+10 10 5.91608
12> 13+15 15 6.14701
13> 10+16 16 6.75066
14> 16+15 15 7.29971
15> 15+14 14 8.93628

     [このページのトップへ]


8426. Re^9: クラスター分割における項目結節処理について 青木繁伸  2005/11/21 (月) 19:12
PAC 分析の問題点のまとめ

1)デンドログラムの読み取り方・解釈法に誤解がある
  基本的には HALWIN も SPSS なども,同じ情報を含むデンドログラムを出力している
  百歩譲って,,,
  手法は普遍的なのに,特定のプログラムでしか得られない分析結果に基づくのは,科学的におかしい

2)同値のおおい距離行列に対して分析をしたときに,距離の同じ複数のクラスターがどの順序で結合されるかはプログラムのアルゴリズムによる。にもかかわらず,特定の結果を解釈対象にするのはおかしい。
  同じプログラムに,データの行と列を入れ替えて,本質的に同じ距離行列を与えても,結果が異なる(しかも,場合によっては大幅に)。
  その原因は,結局,同距離のクラスターの結合順序が違ってくるからである。

3)Ward 法は,与えられる距離行列が「ユークリッド平方距離」であることを期待している。
  ユークリッド距離が与えられても,計算はできるが,実際に何を計算していることになるのか誰にもわからない。

     [このページのトップへ]


8420. Re^9: クラスター分割における項目結節処理について 青木繁伸  2005/11/21 (月) 13:38
HALWIN で計算したところ,PDF 文書の1ページの上のデータ行列から,結果を確認しました。

しかし,ここで安心するのはまだはやい。
行と列を入れ替えて以下のような距離行列に対して分析してみました

*1 *2 4 12 9 5 13 6 3 8 10 7 1 11 15 2 14 16
1 4 0 1 2 6 6 2 2 4 2 1 3 2 2 3 2 6
2 12 1 0 3 1 2 3 4 7 7 1 2 6 2 5 6 7
3 9 2 3 0 3 4 6 2 5 5 3 1 3 6 6 5 6
4 5 6 1 3 0 1 5 4 3 3 3 2 6 2 2 6 6
5 13 6 2 4 1 0 1 2 2 2 6 3 6 2 3 6 7
6 6 2 3 6 5 1 0 3 1 3 2 1 7 2 3 4 2
7 3 2 4 2 4 2 3 0 6 1 6 1 6 5 1 4 6
8 8 4 7 5 3 2 1 6 0 1 5 6 7 5 1 7 7
9 10 2 7 5 3 2 3 1 1 0 1 5 4 3 3 4 6
10 7 1 1 3 3 6 2 6 5 1 0 2 5 6 2 6 6
11 1 3 2 1 2 3 1 1 6 5 2 0 7 2 4 7 1
12 11 2 6 3 6 6 7 6 7 4 5 7 0 3 1 1 7
13 15 2 2 6 2 2 2 5 5 3 6 2 3 0 2 6 5
14 2 3 5 6 2 3 3 1 1 3 2 4 1 2 0 6 3
15 14 2 6 5 6 6 4 4 7 4 6 7 1 6 6 0 7
16 16 6 7 6 6 7 2 6 7 6 6 1 7 5 3 7 0

1行目は項目番号
1列目(*1)は以下のHALWINの分析結果に出てくる番号
2列目(*2)はもとの項目番号

結果は以下に示すリンクを見てください。
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/cluster6.png
まるっきり異なった解になっているので驚きます。
これでは,PAC分析とは何なのかと言うことになってしまいます。

なお,Ward 法は,
http://aoki2.si.gunma-u.ac.jp/lecture/misc/clustan.html
に示すように,ユークリッドの距離ではなくその平方距離を対象にするものであることに注意しましょう。
HALWIN にも,平方距離か普通の距離かの選択ができるようになっていますが,PDF 文書の結果は,平方距離ではなく距離の方を使っています。

HALWIN の作者は,「入力されたのが,距離行列なのか,平方距離行列であるかのチェックは何もしない。使用責任はユーザにある。」と申しておりました。そりゃそうですよね。選択肢を設けてあるのだから,適切な方を選択するのはユーザの責任です。

     [このページのトップへ]


8416. Re^9: クラスター分割における項目結節処理について 青木繁伸  2005/11/21 (月) 10:32
PDF 文書を印刷してよく見ていたのですが,

PCA分析実施法入門のP64の結果についてですが,デンドログラムの読み方自体について疑問があります。

3)同書の解釈
(1,3,9,4,7,10) (16,2,8,6,13,5,12,15) (11,14) の3つの群がある。
となっているのですか。

デンドログラム p68 をみても,16は(1,3,9,4,7,10)に入るのではないですか。

     [このページのトップへ]


8431. Re^10: クラスター分割における項目結節処理について セイジ  2005/11/22 (火) 19:08
青木先生

回答ありがとうございます。
確かにp68のデンドログラムの群の分け方
の16の取り扱いはおかしいような気がします。

PAC分析の問題点もありがとうございました。
PAC分析を利用してよいものか,迷いはじめて
いますが,HALWINを購入できる状況にないの
で,もし可能であれば距離行列から出発でき
るように改造したVBAのプログラム入手の
可能性についてお教えいただきたく思います。
(甘えたお願いなので,もし掲示板の方針に
合わないようでしたら,削除してください。)

     [このページのトップへ]


8432. Re^11: クラスター分割における項目結節処理について 青木繁伸  2005/11/22 (火) 20:34
科学は,誰でもが追試できなければなりません。
誰でも共通に使える道具を使って分析を行うのが良いと思います。
そういうことで,私は R をお使いになることをお勧めします。
なんと言っても無料ですから,使おうと思う人は誰でも使えます。
カンマで区切った

0, 4, 1, 3, 2, 1, 2, 6, 1, 5, 7, 2, 3, 7, 2, 1
4, 0, 1, 3, 2, 3, 2, 1, 6, 3, 1, 5, 3, 6, 2, 3
1, 1, 0, 2, 4, 3, 6, 6, 2, 1, 6, 4, 2, 4, 5, 6
3, 3, 2, 0, 6, 2, 1, 4, 2, 2, 2, 1, 6, 2, 2, 6
2, 2, 4, 6, 0, 5, 3, 3, 3, 3, 6, 1, 1, 6, 2, 6
1, 3, 3, 2, 5, 0, 2, 1, 6, 3, 7, 3, 1, 4, 2, 2
2, 2, 6, 1, 3, 2, 0, 5, 3, 1, 5, 1, 6, 6, 6, 6
6, 1, 6, 4, 3, 1, 5, 0, 5, 1, 7, 7, 2, 7, 5, 7
1, 6, 2, 2, 3, 6, 3, 5, 0, 5, 3, 3, 4, 5, 6, 6
5, 3, 1, 2, 3, 3, 1, 1, 5, 0, 4, 7, 2, 4, 3, 6
7, 1, 6, 2, 6, 7, 5, 7, 3, 4, 0, 6, 6, 1, 3, 7
2, 5, 4, 1, 1, 3, 1, 7, 3, 7, 6, 0, 2, 6, 2, 7
3, 3, 2, 6, 1, 1, 6, 2, 4, 2, 6, 2, 0, 6, 2, 7
7, 6, 4, 2, 6, 4, 6, 7, 5, 4, 1, 6, 6, 0, 6, 7
2, 2, 5, 2, 2, 2, 6, 5, 6, 3, 3, 2, 2, 6, 0, 5
1, 3, 6, 6, 6, 2, 6, 7, 6, 6, 7, 7, 7, 7, 5, 0

のようなデータファイルを用意して
R を起動して

data <- read.table("pac.dat",header=FALSE,sep=",")
d <- as.dist(data)
ans <- hclust(d,method="ward")
plot(ans,hang=-1)

とするだけでデンドログラムが得られます。
R のダウンロード,インストール,使い始めについては,
http://aoki2.si.gunma-u.ac.jp/R/
のなかのリンク集をたどればよろしいかと思います。
(今ちょっとサーバの調子が悪いようですが)

     [このページのトップへ]


8518. Rでのクラスター分析(Re^12: クラスター分割における項目結節処理について) セイジ  2005/12/01 (木) 15:47
> 科学は,誰でもが追試できなければなりません。
> 誰でも共通に使える道具を使って分析を行うのが良いと思います。
> そういうことで,私は R をお使いになることをお勧めします。
> なんと言っても無料ですから,使おうと思う人は誰でも使えます。
> カンマで区切った
>
> 0, 4, 1, 3, 2, 1, 2, 6, 1, 5, 7, 2, 3, 7, 2, 1
> 4, 0, 1, 3, 2, 3, 2, 1, 6, 3, 1, 5, 3, 6, 2, 3
> 1, 1, 0, 2, 4, 3, 6, 6, 2, 1, 6, 4, 2, 4, 5, 6
> 3, 3, 2, 0, 6, 2, 1, 4, 2, 2, 2, 1, 6, 2, 2, 6
> 2, 2, 4, 6, 0, 5, 3, 3, 3, 3, 6, 1, 1, 6, 2, 6
> 1, 3, 3, 2, 5, 0, 2, 1, 6, 3, 7, 3, 1, 4, 2, 2
> 2, 2, 6, 1, 3, 2, 0, 5, 3, 1, 5, 1, 6, 6, 6, 6
> 6, 1, 6, 4, 3, 1, 5, 0, 5, 1, 7, 7, 2, 7, 5, 7
> 1, 6, 2, 2, 3, 6, 3, 5, 0, 5, 3, 3, 4, 5, 6, 6
> 5, 3, 1, 2, 3, 3, 1, 1, 5, 0, 4, 7, 2, 4, 3, 6
> 7, 1, 6, 2, 6, 7, 5, 7, 3, 4, 0, 6, 6, 1, 3, 7
> 2, 5, 4, 1, 1, 3, 1, 7, 3, 7, 6, 0, 2, 6, 2, 7
> 3, 3, 2, 6, 1, 1, 6, 2, 4, 2, 6, 2, 0, 6, 2, 7
> 7, 6, 4, 2, 6, 4, 6, 7, 5, 4, 1, 6, 6, 0, 6, 7
> 2, 2, 5, 2, 2, 2, 6, 5, 6, 3, 3, 2, 2, 6, 0, 5
> 1, 3, 6, 6, 6, 2, 6, 7, 6, 6, 7, 7, 7, 7, 5, 0
>
> のようなデータファイルを用意して
> R を起動して
>
> data <- read.table("pac.dat",header=FALSE,sep=",")
> d <- as.dist(data)
> ans <- hclust(d,method="ward")
> plot(ans,hang=-1)
>
> とするだけでデンドログラムが得られます。

そ の後,ようやくRをインストールし,上記データを使い,同作業をやってみました。保存したテキストファイルをRに読み取らせることはできたのですが,d <- as.dist(data)の段階で,「強制変換により NA が生成されました。」というメッセージが流れ,ans <- hclust(d,method="ward")の段階で「外部関数の呼び出し(引数 11) 中に NA/NaN/Inf があります」というメッセージが出てきてしまいます。現在R-tipsを見ながらガチャガチャやっているのですが,もし解決策をご存知の方がいらっしゃい ましたらヘルプお願いいたします。

     [このページのトップへ]


8523. Re: Rでのクラスター分析(Re^12: クラスター分割における項目結節処理について) 青木繁伸  2005/12/01 (木) 17:37
data <- read.table("pac.dat",header=FALSE,sep=",")
のあとで,
data
とだけ入力してみて,data の内容がどのようになっているか確かめてみると良いでしょう。
データファイル中に半角数字と半角カンマ以外の文字がないことを確認することもお忘れなく。

     [このページのトップへ]


8527. Re^2: Rでのクラスター分析(Re^12: クラスター分割における項目結節処理について) セイジ  2005/12/02 (金) 16:46
青木先生

アドバイスありがとうございました。先生のアドバイス通りデータを出してみたところ,データにもカンマ がついていることを発見しました。どうやら,ファイル名の場所を書き込んでいる作業中に,カンマつきデータの処理に必要なsep=","を消してしまって いたのが今回のトラブルの原因のようでした。お蔭さまでデンドログラムも出すことができ,ビットマップを使って項目を書いたりすることもできました。とり あえず,分析のための道具が使えるようになりホッとしています。本当にありがとうございました。

     [このページのトップへ]


8433. Re^12: クラスター分割における項目結節処理について 青木繁伸  2005/11/22 (火) 21:55
くどいですが念のため。

同値を多く含む距離行列に基づいてクラスター分析するのは,クラスター化される順序によって結果がかなり異なってしまうということはどのようなソフトを使おうと避けられません。

#今某所に問い合わせをしているのですが,一日半経過しましたが回答はありません。

     [このページのトップへ]


8436. Re^13: クラスター分割における項目結節処理について セイジ  2005/11/23 (水) 15:40
青木先生

Rの情報ありがとうございます。

先日の先生の回答の中で(Re^9: PAC 分析の
問題点のまとめ等)データの行と列の問題が
ありました。

PAC分析で用いられるデータは,

1.ある質問をして被験者に思い浮かんだ項目
 を出してもらう。
2.それからその項目の重要度を被験者に順位
 づけしてもらう。
3.その順位を項目番号とする

で,これが行と列の設定に説得力を与えてい
るような気がするのですが,先生の回答
「本質的に同じ距離行列(Re^9: )」という
記述を見ると,そうでもないような気もして
きました。

     [このページのトップへ]


8438. Re^14: クラスター分割における項目結節処理について 青木繁伸  2005/11/23 (水) 17:59
> 2.それからその項目の重要度を被験者に順位
>  づけしてもらう。
> 3.その順位を項目番号とする

項目間の距離はどのように定義されるのでしょうか?

     [このページのトップへ]


8439. Re^15: クラスター分割における項目結節処理について セイジ  2005/11/23 (水) 21:38
青木先生

言葉足らずでした。申し訳ありません。
PAC分析の専門書に書いてある分析の手順
(これまで提示してきたデータの分析例)
について記します。

1)被験者は1名

2)被験者がどのような場面や状況で孤独
  と感じるか。頭に浮かんできた言葉や
  イメージを,思い浮かんだ順に番号を
  つけてカードに書かせる。(連想順位)

3)カードを被験者にとっての重要な順に
  並べさせる。(重要順位)

4)項目のすべてを対にし,被験者の直感
  的イメージで両者がどのぐらい似てい
  るかをAからGの尺度で判断させる。

非常に近い(A)
かなり近い(B)
いくぶんか近い(C)
どちらともいえない(D)
いくぶんか遠い(E)
かなり遠い(F)
非常に遠い(G)

5)同じ項目の組み合わせは0,Aは1,B
  は2,Cは3というふうに0から7まで
  の得点をあたえ,これをデータとする。
  項目番号は重要順位に従う。(著者によ
  ると,経験上重要順位で項目番号をふっ
  たほうが解釈に貢献することが多いそう
  です。)

6)HALWINにデータを入力し,デンドログラ
  ムを描く。

7)実験者がデンドログラムを解釈する。

8)被験者にデンドログラムを見せ,実験者
  が行った解釈を述べて,それぞれの群か
  らどのようなイメージが浮かぶかのイン
  タビューを行う。

9)補足質問として,各項目に対しプラス,
  マイナス(恐らくポジティブ,ネガティ
  ブ)のどちらのイメージを持つかも聞く。

とりあえず以上のような感じです。

     [このページのトップへ]


8441. Re^16: クラスター分割における項目結節処理について 青木繁伸  2005/11/23 (水) 21:50
重要な順に並べているということがキーポイントですかね

たとえば,4つの項目があったとして

A
B
C
D

の順に並べられて,その後,類似性を聞かれるわけですね
A B C D
A 0 4 1 2
B 4 0 1
C
D

等となったときも,A-C と B-C はともに1だが,A-C は B-C よりも強いということでしょうか??
(無理矢理という気はしないでもないですが)

     [このページのトップへ]


8450. Re^17: クラスター分割における項目結節処理について りえこ  2005/11/24 (木) 21:22
青木先生


 横レス,失礼いたします。
 PAC分析を使っている者です。
 

>たとえば,4つの項目があったとして
> A
> B
> C
> D
> の順に並べられて,その後,類似性を聞かれるわけですね
> A B C D
> A 0 4 1 2
> B 4 0 1
> C
> D
>
> 等となったときも,A-C と B-C はともに1だが,A-C は B-C よりも強いということでしょうか??
> (無理矢理という気はしないでもないですが)


  PAC分析においては,A-Cと B-Cの「1」は等価だと思いますが,そうなると結果の解釈にはどのような影響がもたらされますか? これまでのPAC分析のやり方だと,不都合が生じますか。 
  

  ご回答,よろしくお願いいたします。

     [このページのトップへ]


8451. Re^18: クラスター分割における項目結節処理について 青木繁伸  2005/11/24 (木) 21:30
>   PAC分析においては,A-Cと B-Cの「1」は等価だと思いますが,そうなると結果の解釈にはどのような影響がもたらされますか? これまでのPAC分析のやり方だと,不都合が生じますか。 

はい。全く等価だと,項目順を入れ替えても良いわけで(行と列を同時に入れ替えます)不都合が生じます。同値の距離があると,クラスター融合順序が一意に決まらないことがあります。これはプログラムの書き方にも依存するのでプログラム間で結果が違うこともあります。

しかし,「項目順を,重要な順番に並べ替え,しかる後に項目間の距離を決定する」という手順ならば,解は一意に決まるでしょう。しかし依然として,プログラムによっては結果が変わってくるかもしれません。

     [このページのトップへ]


8454. Re^19: クラスター分割における項目結節処理について りえこ  2005/11/24 (木) 21:41
青木先生


  ご回答,ありがとうございました。

 

     [このページのトップへ]


8457. Re^20: クラスター分割における項目結節処理について セイジ  2005/11/25 (金) 15:16
りえこさん,青木先生

ちょうど私も同じ質問をしようと思っていました。ありがとうございました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 035 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る