★ 適合度検定の解釈 ★
7189. 適合度検定の解釈 西浦博 2005/07/15 (金) 08:17
└7190. Re: 適合度検定の解釈 青木繁伸 2005/07/15 (金) 09:11
└7193. Re^2: 適合度検定の解釈 西浦博 2005/07/15 (金) 11:14
└7194. Re^3: 適合度検定の解釈 青木繁伸 2005/07/15 (金) 11:35
└7200. Re^4: 適合度検定の解釈 西浦博 2005/07/15 (金) 19:43
7189. 適合度検定の解釈 西浦博 [URL] 2005/07/15 (金) 08:17
西浦@チュービンゲン大学医学部計量生物学と申します。Siegelを読んで70年代の論文を掘り起こした後に,ちょっと
labyrinthにハマったような質問ですいません。適合度検定一般について話します。条件によってchi-squareでもlikelihood-
ratio
testでもKS,Cramerでもどれでもいいです。例えば,青木先生のポアソンの説明(aoki2.si.gunma-
u.ac.jp/lecture/GoodnessOfFitness/poissondist.html)では,Estimator利用してポアソン描
いた後にchi-squareをやっていますが,Nullは「母分布はポアソン分布でないとはいえない」でいいのでしょうか。Nullは
「significant
deviationがない」ではどうでしょうか。これがもし,正しければパラメトリック・ノンパラに限らずGoodness-of-fitというのは変な
logicに感じます(「悪くない」=「良い」ではない)。ということは,本当に良いを言うために全ての有り得る分布を考慮した本当のテストが出来ても良
いと思うのですが(Exactの概念は近いような気が)。変な文ですが解釈誤ってないかcomment待ってます。
|
[このページのトップへ]
7190. Re: 適合度検定の解釈 青木繁伸 2005/07/15 (金) 09:11
> Estimator利用してポアソン描いた後にchi-squareをやっていますが,Nullは「母分布はポアソン分布でないとはいえない」でいいのでしょうか。Nullは「significant deviationがない」ではどうでしょうか。
帰無仮説は「ポアソン分布である」ですね。
普通の検定においては,帰無仮説はたとえば「平均値の差が0」ということで,普通は帰無仮説が棄却されて初めて「うれしい」わけです。
こ
れに対して適合度の検定は「帰無仮説が採択されたらうれしい」という状況が多いので,帰無仮説の設定が逆のような気がするわけでしょうね。しかしこれも,
たとえばメンデルの遺伝法則に従わないだろうと予測してデータをとった研究者は,ほかの検定と同じく「やった,おれの遺伝法則にしよう」と喜ぶわけです。
> ということは,本当に良いを言うために全ての有り得る分布を考慮した本当のテストが出来ても良いと思うのですが。
これも,「平均値の差が0である」という積極的な検定があるかということと同じですね。(同等性検定というのもありますが)
お答えになっているでしょうか。
|
[このページのトップへ]
7193. Re^2: 適合度検定の解釈 西浦博 [URL] 2005/07/15 (金) 11:14
> 帰無仮説は「ポアソン分布である」ですね。
> 普通の検定においては,帰無仮説はたとえば「平均値の差が0」
意
味が伝わらずすいません。いつもInputが英語なので日本語Outputだと統計学って難しいです(笑。いわゆるNeyman-Pearson
criterionとHypothesis特性が原因で生じている「消極的な(という日本語は正しいか不明)」検定結果ということそのものを意図した質問
ではないです。そういうのはFisher先生の時代にも既に指摘されてきたことかと。
1点目(ポアソンの例に戻ります):Nullは「ポ
アソンでないとは言えない」となっていましたが,厳密にはchi-square test statisticは"the squared
statistical difference which follows chi-square
distribution"ですから,Nullは「no significant diviations (or no significant
difference in
frequency)」になるべきなのではないかと思いました。これは「ポアソンでないとは言えない」のレベルでも飛躍になるのではないかと感じましたが
いかがでしょう。
(2点目)これまでに疫学とかで利用されてきた多くの同等性検定の手法ではなくてExact
testのRejectする領域を定義するような試験はないのかなあ,というような意図でした。というのは,ノート上に計算式が出来てうまくいきそうだっ
たので興奮していたからなのですが,調べているうちに類似の方法が既に出版されていることがわかっちゃいました(Biometrics 2001;
57: 478-483)。最近の発展がフォローできてなかったために今晩の徹夜予定が無駄になってしまい鬱状態です…。
|
[このページのトップへ]
7194. Re^3: 適合度検定の解釈 青木繁伸 2005/07/15 (金) 11:35
> 1点目(ポアソンの例に戻ります):Nullは「ポアソンでないとは言えない」となっていましたが,
結論のところのことですか?
帰無仮説の採否を決める。
* P > α のとき,帰無仮説を採択する。「母分布はポアソン分布でないとはいえない」。
* P ≦ α のとき,帰無仮説を棄却する。「母分布はポアソン分布ではない」。
この,最初の方を意味しておられる?
この意味は,もっとデータを集めるとポアソン分布じゃないと言えるかもしれないけど,今のデータの限りでは,ポアソン分布でないとはいえませんねぇということですよね?
|
[このページのトップへ]
7200. Re^4: 適合度検定の解釈 西浦博 [URL] 2005/07/15 (金) 19:43
> 結論のところのことですか?
> * P > α のとき,帰無仮説を採択する。「母分布はポアソン分布でないとはいえない」。
やっ
ぱりlabyrinthの中なのですが,どうも私の勘違いでした。前の文章で"no significant deviation with
hypothesized Poisson
dist"というだけのことで解決しました。「もっとデータを集めるとポアソンじゃない」は,nが大きいとRejectされやすいPearson's
chi-squareの欠点ですね。調べてみると,modified chi-squareは比較的知られていても,Kullback's
information (Statistical Methods in Cryptanalysis,
1938)がここで出てきてLRTになるのですね。
いずれにしても適合度検定の話,スッキリするためには(1)"Badness-of-
fit"と命名し,Equivalence
testを整理してGoodness-of-fitとする,(2)KSの各手法は良いとしてもchi-squareには様々な問題点があるので離散で名義
尺度の場合,modificationやCochrane's ruleとかを利用するよりも自分でexact
probabilityを算出するようにする,ということ辺りがポイントかと勝手に自分で結論づけてみました。
|
[このページのトップへ]
● 「統計学関連なんでもあり」の過去ログ--- 034 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る