No.16816 量的・質的データの混ざっているクラスター分析について  【マーケティング初心者】 2012/04/24(Tue) 08:37

青木先生

クラスター分析について質問させてください。よろしくお願いします。

こちらのホームページ,いくつかの統計の本,ウエブサイトやクラスター分析を使った論文を読んだのですが,わからないので教えていただければ幸いです。使用している統計ソフトはSPSSです。

量的データと質的データを両方含む,1000サンプル以上のデータをもっております。クラスター分析を使って,いくつかのクラスターに分けたいと思っております。

1)量的データと質的データを両方クラスター分析する際は,twostep 法を用いればよいのでしょうか?それ以外の方法はありますか?
多くの参考書だと,クラスター分析は量的データのみ言及しています。私が使いたい質的データは,例えば「好きな色は?赤・青・黄・緑」の様に,データの標準化が難しいです。

2) クラスタ分析に用いるパラメータは,分析者が恣意的に選んでもよいのでしょうか?例えば,身長・体重・胸囲の全てを分析対象にするのか,身長のみ使うかな ど,どうやって判断すればよいのでしょうか?(手元にあるパラメータはたくさんあり,そのどれを使えば良いのか自信がもてないのです)

3) 同様にクラスター数も恣意的に決めてよいのでしょうか?SPSSに任せてクラスタ分析させると,(クラスタ精度を高めるためでしょうか?)10ものクラス タに分類されてしまい,現場でそこまで細かく分類するのも不可能なので途方にくれています。クラスター数を4つにするか,5つにするかは,どの様に判断し たらよいのでしょうか?

統計初心者の門外漢で申し訳ありません。お時間をとらせてご迷惑でしたら,何かリファレンスを教えていただければ幸いです。

No.16819 Re: 量的・質的データの混ざっているクラスター分析について  【青木繁伸】 2012/04/24(Tue) 10:06

> 多くの参考書だと,クラスター分析は量的データのみ言及しています。

重回帰分析や判別分析の場合と同じく,質的データをダミー変数にして量的変数と一緒に扱えばよいのではないでしょうか?

> パラメータは,分析者が恣意的に選んでもよいのでしょうか?

客観性をもって,恣意的に選べばよいでしょう。どんなに客観的であろうとしても,それを客観的とみなさない第三者がいないとはいえません。

> クラスター数も恣意的に決めてよいのでしょうか?

これも同じく。

> クラスター数を4つにするか,5つにするかは,どの様に判断したらよいのでしょうか?

k-means クラスターなら,目的のクラスター数を設定できます。しかし,それも,なぜその数にしたのかと,客観性を要求されるでしょう。

> 何かリファレンスを教えていただければ

どれか一冊の本で十分ということはないでしょう。クラスター分析について描いてある本を片端から読むくらいの意気込みが期待されます。

No.16839 Re: 量的・質的データの混ざっているクラスター分析について  【マーケティング初心者】 2012/04/27(Fri) 20:46

ご丁寧な回答ありがとうございました。再度分析にとりかかってみます。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る