No.06791 欠損値について  【ゆき】 2008/06/12(Thu) 15:13

300のデータを集めました。
しかし,300のうち200以上の人は1番の0回を選びました。データはかなり偏っていますが。1番を欠損値にすべきでしょうか?主成分分析したいです。
どうぞよろしくお願いいたします。

各マンションの管理人に送ったアンケートです。
過去3年間の苦情の回数についてですが。入居者からよく出る建物の補修関連に対する苦情,たとえば,
1-1.雨漏り
1),0回,2),年に1回,3),半年1回,4),月1回,5),それ以上
1-2.対応の有無
1),対応した,2),対応しなかった。
1-3.対応の仕方
1),…を取り込んだ,2),…を変更した,3),…,4),…
2-1.サビ
1),0回,2),年に1回,3),半年1回,4),月1回,5),それ以上
1-2.対応の有無
1),対応した,2),対応しなかった。
3,4,5,6,7,8,などなど45項目。

No.06797 Re: 欠損値について  【青木繁伸】 2008/06/12(Thu) 18:39

> 300のうち200以上の人は1番の0回を選びました。データはかなり偏っていますが。1番を欠損値にすべきでしょうか

欠損値にすると一つの質問で 2/3 のデータが失われ,更に次の一つで残りの更に 2/3 が失われ(独立ならばですが),そんなことを繰り返してやっていくと,分析対象となるデータが無くなってしまうでしょう。

そもそも,主成分分析をやるといっても,このデータは名義尺度や順序尺度なのでコレスポンデンスアナリシス(数量化III類)をやることになると思いますが。そうすると,別に偏っていようがどうしようが構わない(実際そうなんだから)ということになるのでは?

● 「統計学関連なんでもあり」の過去ログ--- 041 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る