★ 異常値の混入をキャッチする統計手法とは? ★

3353. 異常値の混入をキャッチする統計手法とは? tak 2004/06/04 (金) 23:48
└3355. Re: 異常値の混入をキャッチする統計手法とは? 青木繁伸 2004/06/04 (金) 23:57
 └3356. Re^2: 異常値の混入をキャッチする統計手法とは? tak 2004/06/05 (土) 00:10
  └3357. Re^3: 異常値の混入をキャッチする統計手法とは? 青木繁伸 2004/06/05 (土) 00:23
   └3358. Re^4: 異常値の混入をキャッチする統計手法とは? tak 2004/06/05 (土) 00:26
    └3359. Re^5: 異常値の混入をキャッチする統計手法とは? 青木繁伸 2004/06/05 (土) 00:36
     └3360. Re^6: 異常値の混入をキャッチする統計手法とは? tak 2004/06/05 (土) 00:40


3353. 異常値の混入をキャッチする統計手法とは? tak  2004/06/04 (金) 23:48
tak@統計初心者 と申します。
あるグループは身長,体重が似た値の人が集まって構成されていたのですが,あるときを境に身長,体重がこれまでの人々とは異なる
人も集まってくるようになり,グループ全体の「体型」の「傾向」が変わってきたとします。この「傾向」が変化してきた推移を「身長」と「体重」という2変数を統計処理することによりキャッチする方法としてどのような方法がございますでしょうか?
(すみません。幼稚なたとえしかできませんでしたが,要はデータ群にこれまでにデータとは傾向の異なる異常サンプル,特異サンプルが発生してきた時点でそれをキャッチする方法が教えていただきたいのです。)お手数おかけしますが何卒宜しくお願いします。

     [このページのトップへ]


3355. Re: 異常値の混入をキャッチする統計手法とは? 青木繁伸  2004/06/04 (金) 23:57
これまでにも,「たとえ話」をあげての質問はたくさんありましたが,そのたとえが成功したという例は数えるほどしかないような気がします

ですので,今回のお答えは,「たとえ話に沿った回答」をいたします。

体重と身長の関係を捉えるにはある程度確立されたやり方があります。
BMIというものです(言葉だけは聞いたことがあるけどその実際は,体重と身長について知らない人にはわからないかもしれません)。
横軸に時間(年度など)をとり,縦軸にBMIをとって測定値をプロットすれば,もし従来の関連と異なる人たち(異星人か!!)が入ってくると,すぐに(本当にすぐか???)わかると思います。
というか,それでとらえられないようなじょじょたる,びびたる変化はとらえようがないでしょう。

#なんか,最近,辛口コメントばかりで,嫌われそうです。というか,嫌われた?というか,嫌われた!

     [このページのトップへ]


3356. Re^2: 異常値の混入をキャッチする統計手法とは? tak  2004/06/05 (土) 00:10
tak と申します。早々のご返答ありがとうございます。

> ですので,今回のお答えは,「たとえ話に沿った回答」をいたし>ます。

申し訳ないのですが,実は私が実際に扱っているデータは身長,体重ではないのです。そこで一般的な方法について,(可能であれば身長,体重という言葉を使いながら)ご説明いただけないでしょうか?

> #なんか,最近,辛口コメントばかりで,嫌われそうです。

いえいえ,私の質問に回答していただけて感謝しております。
宜しくお願いいたします。

     [このページのトップへ]


3357. Re^3: 異常値の混入をキャッチする統計手法とは? 青木繁伸  2004/06/05 (土) 00:23
> 申し訳ないのですが,実は私が実際に扱っているデータは身長,体重ではないのです。そこで一般的な方法について,(可能であれば身長,体重という言葉を使いながら)ご説明いただけないでしょうか?

ですから,一般的なお話ではことが済まないと言っております。
挙げられた例をそのまま受け取った解決法というのは,二変数の関係を要約するような「適切な指標」を計算し,横軸を時系列としてプロットすれば,指標の転換点というのは,転換点を境として左と右のデータ点の列を近似する直線の交点であろう。ということです。
例を挙げて解法を望むなら,例を元にした解法をもとにして,自分の実際の例に適用するにはどうしたらよいかを工夫する必要があるでしょう。

ま, 二変数なら,縦軸と横軸に二変数を配置して,各データをプロットし,年次に沿って各データをプロットするデータ間のプロットを結ぶ矢印(折れ線)の変化を 探すということくらいしかいえないでしょう。しかし,この手法とて,身長と体重のデータを前期のようなBMIという一つの指標に変換して時系列プロットす るということに比べていかに稔りの少ないことか,わかりますか?

     [このページのトップへ]


3358. Re^4: 異常値の混入をキャッチする統計手法とは? tak  2004/06/05 (土) 00:26
>二変数の関係を要約するような「適切な指標」を計算し,

2データについて「歪度」といった統計値で分布の形状に変化が出てきたことをなんとなくつかむということはナンセンスでしょうか?

     [このページのトップへ]


3359. Re^5: 異常値の混入をキャッチする統計手法とは? 青木繁伸  2004/06/05 (土) 00:36
> 2データについて「歪度」といった統計値で分布の形状に変化が出てきたことをなんとなくつかむということはナンセンスでしょうか?

最初の質問で,「多変量データ」に基づく変化というように承ったのですが,そうではないと言うことでしょうか?
二変量あるいは多変量の「歪度」ってどういうように理解すればいいのでしょう。

基 本的には,私は「何時の時点で変化が起きたのか」を簡単にわかりやすくつかむ(表現する)のは,横軸を時間,縦軸を測定値(あるいはその関数値)としたグ ラフに基づく統計量というとらえ方をしました。ですから縦軸は一変量もしくは多変量の合成変数(一個)だと感じています。
縦軸は歪度でも,現象を説明できる変数なら単独のものでも合成されたものでも,何でもいいでしょうが要するに「縦軸に目盛ることのできる一つの値」というように,今の私は考えています。

どなたか,ほかの意見の方,フォローをお願いします。

     [このページのトップへ]


3360. Re^6: 異常値の混入をキャッチする統計手法とは? tak  2004/06/05 (土) 00:40
もうしわけございません。もう少し勉強してから後日あらためて質問させていただきます。ご迷惑をおかけいたしました。今後ともよろしくお願いいたします。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 029 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る