No.11691 Re: 二つの極大値がある1次元度数分布の検定 【青木繁伸】 2010/01/14(Thu) 13:09
一般的には,検定というものは「仮説を証明するものではありません」注。
例えば, 「帰無仮説:母平均は0である」を棄却することはできますが,棄却されなかったときにも「母平均が0であるが証明されたことにはなりません」。よって, 「ピークがn個ある」とか「ピークの値はxである」ということは証明できません。例えば「帰無仮説:母分布は一様分布である」という検定はできますから, それが棄却されると「一様分布ではない」ことになります。しかし,だからといって二峰性だということにはなりません。正規分布かも知れないし,三峰性の分 布かも知れないし,二峰性だとしても,どんな二峰性分布かについては何もわかりません。ピークを取る値についても同じような議論になるでしょう。
検 定以外のアプローチとしては,ある分布を仮定して,その分布を決めるパラメータを推定するというやり方があります。そして,どれくらい当てはまりがよいか を検討するのです。しかし,この場合にも,どのような分布を仮定するかというところが難しいところでしょう(少なくとも定式化できないといけないでしょ う)。
注:同等性の検定というのがありますが
No.11735 Re: 二つの極大値がある1次元度数分布の検定 【オボボ】 2010/01/18(Mon) 12:41
青木繁伸 さん ご回答ありがとうございました。
返信が遅くなり申し訳ございません。
確かに,ご返信の通りですね。
正規分布の検定や一様分布の検定があるので,
二峰性か否かも検定できそうだと,変な直感で考えていました。
自分の勉強不足で手間取らせてしまってすみませんでした。
No.11742 Re: 二つの極大値がある1次元度数分布の検定 【ひの】 2010/01/18(Mon) 21:15
分布についていくつかの仮定が置ければ検定(厳密には検定ではないが)することは可能です。
たとえば正規分布を仮定できるとすると,そのデータが一個の正規分布なのか,2個の正規分布が重なったものか,それとも3個の正規分布が重なったものか, データが十分にあれば,それぞれのモデルに対してのフィッティングを行えます。それらのモデルへの当てはまりの良さをAICなどで評価して最も妥当なモデ ルはどれかを選択すると,いくつのピークを持った分布とみなすのが妥当であるかが導かれます。ただしこれはモデル選択の問題であって,検定ではありませ ん。モデル選択の場合,最初に想定した複数のモデルの中で「どれが一番ましなモデルか?」が導かれるだけです。最初に想定した複数のモデルの中に真理があ るという保証は存在しません。
正規分布を仮定してよいかどうかは別の問題。データの性質からどのような分布型がベースにあるのかが理論 的に分からない場合には難しいと思います。複数の正規分布が仮定できるケースとしては,動物の体サイズ分布があります。複数の年齢群からなる動物の集団の 体サーズデータは,同じ年齢の群内では体サイズが正規分布すると仮定できますので複数の正規分布の重なりと捉えることができて,上記のような解析が適用で きます。
● 「統計学関連なんでもあり」の過去ログ--- 043 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る