★ 欠損値の置き換えについて ★

8221. 欠損値の置き換えについて Ermengarde 2005/11/07 (月) 00:04
└8224. Re: 欠損値の置き換えについて 青木繁伸 2005/11/07 (月) 09:32
 └8228. Re^2: 欠損値の置き換えについて Ermengarde 2005/11/07 (月) 10:19


8221. 欠損値の置き換えについて Ermengarde  2005/11/07 (月) 00:04
はじめて質問させていただきます。

私は,少し特殊なモデル・分析を用いて研究を行っているのですが,分析に必要なプログラムが,欠損値を認めない(例えば,99や0を数値として読む)もののため,欠損値の処理に困っています。

最初,欠損値は僅かであるため,欠損値のある披調査者のデータを削除しようとしましたが,そうすると,分析にほしい人数を下回ってしまうことがわかりました。そこで,代表値で置き換える方法を取ろうとしています。

プ ログラムのマニュアルには,平均値,中央値,最頻値のどれかで置き換える方法があるとされていました。プログラムの都合で,できれば整数を使いたく思って いるので,小数が出てくる平均値ではなく,中央値,最頻値のどちらかを使いたいと思っています。1-5までの5件法でのデータで,例えば4,5,5,5, 5の中からの代表値という部分もあるのですが,どちらが適当でしょうか。それとも,平均値でなくてはあまりよくないでしょうか。よろしくお願いします。

     [このページのトップへ]


8224. Re: 欠損値の置き換えについて 青木繁伸  2005/11/07 (月) 09:32
> 欠損値は僅かであるため,欠損値のある披調査者のデータを削除しようとしましたが,そうすると,分析にほしい人数を下回ってしまう

わずかの欠損値を除くと分析に欲しいデータ数を確保できないということでしたら,もともとぎりぎりに近いデータ数だったわけですから,わずかの欠損値を代替値で置き換えるメリットとそれによるデメリットを秤に掛ける必要があるでしょう。

欠損値の置き換えは実際にはないものを当てる訳ですから,異論が出ると水掛論争になりかねない。平均値,中央値,最頻値どれで置き換えても同じ。
データ数が少ないのは,「少ないね」だけで終わる。

平均値,中央値,最頻値それぞれで置き換えて,および欠損値を除いて,計4通りの分析をして比較してみるのも良いのでは?(後知恵の分析と非難されるかな?)

     [このページのトップへ]


8228. Re^2: 欠損値の置き換えについて Ermengarde  2005/11/07 (月) 10:19
> 欠損値の置き換えは実際にはないものを当てる訳ですから,異論が出ると水掛論争になりかねない。平均値,中央値,最頻値どれで置き換えても同じ。
> データ数が少ないのは,「少ないね」だけで終わる。

なるほど,そうですよね・・・。置き換えに伴うそのデメリットはとても気になります。しかし,小集団を用いての分析で,一人の削除がグループ全体の削除となってしまうところがありかなりの痛手なので,データ数の確保を優先したい側に傾いてもいます。

> 平均値,中央値,最頻値それぞれで置き換えて,および欠損値を除いて,計4通りの分析をして比較してみるのも良いのでは?(後知恵の分析と非難されるかな?)

どうもありがとうございます。その結果を見つつ考えることにしたいと思います。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 035 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る