★ 離れ値や間違いデータ ★

2477. 離れ値や間違いデータ 鈴木 2004/02/25 (水) 15:22
└2478. Re: 離れ値や間違いデータ 青木繁伸 2004/02/25 (水) 15:36
 └2481. Re^2: 離れ値や間違いデータ 鈴木 2004/02/25 (水) 17:26


2477. 離れ値や間違いデータ 鈴木  2004/02/25 (水) 15:22
いつもお世話になります。

私は,間違いデータを探すとき,はまず,入力前にチェックして,その後エクセルのオートフィルターで確認してゆきます。そのあと単純集計で確認します。あり得ない値はそんな処理でよろしいでしょうか?

離れ値は,どの程度が離れ値かよくわから無くなりました。指標を得たくてスレッドを探しましたが,見あたりません。

たとえば,あるデータが
a変数 の最小値 -71=1人,-67=1人,-66=1人,
         -65=1人,-63=1人・・
b変数 の最高値 19.75=1人,18.6=1人,...
c変数 の最高値 6.7=1人,6.1=1人,・・・
のとき,あるIDの者が a=-66,b=19.75,c=6.7だとして,この人のデータは除去すべきかたよったデータでしょうか?
ちなみにこの対象者数は900人a,b,c共に正規分布をなしており,仮説は aが低い者はb,cが高いです。
ですからこのデータは仮説の通りですが・・

おかしな質問かもしれませんが,現在丁寧にデータ処理をし直しています。離れ値の発見の仕方というプログラムをやってみましたがうまくいきませんでした。この間青木先生に助言頂いたのですが・・SASは言うことを聞いてくれませんでした。
それで自分で最小値と,最高値を調べてみました・・・
そしてたらいったいどのくらいが離れ値なのか,どのようなものが具体的に不適当なデータかよくわからなくなってしまい。
ご助言をお願いしたいと思います。宜しくお願いします。
また,このような初期のデータ処理に関して具体的に書いてある書籍をご存じでしたら教えて頂けると幸いです。


     [このページのトップへ]


2478. Re: 離れ値や間違いデータ 青木繁伸  2004/02/25 (水) 15:36
外れ値といっても,明らかな測定間違い・記録間違いでないかぎり,除外すべきではないでしょう。

     [このページのトップへ]


2481. Re^2: 離れ値や間違いデータ 鈴木  2004/02/25 (水) 17:26
青木先生
お返事ありがとうございます。

本当にいつもいつも心から感謝しています。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 028 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る