No.23085 検出力について  【ビギナー】 2021/06/24(Thu) 10:48

データが正規分布する場合,パラメトリック検定の方がノンパラメトリック検定より検出力が高いと言われていますが,非正規 分布を対数変換して正規分布にし,パラメトリック検定を行った場合と対数変換せずにノンパラメトリック検定を行った場合とではどちらの方が検出力が高いの でしょうか?
ご指導の程よろしくお願い致します。

No.23086 Re: 検出力について  【aoki】 2021/06/24(Thu) 14:01

あなたが考えているのは,ノンパラメトリック検定としてマン・ホイットニーのU検定,パラメトリック検定としてt検定でしょうか。

段階を追って考えて見ましょう。

1. マン・ホイットニーのU検定は,元のデータをどのように線形変換しようが同じ結果になります。

2. 対数正規分布するデータを正規化するのが妥当であるとすれば,正規化されたデータのt検定は妥当でしょう。

3. あるデータに対して,t検定もマン・ホイットニーのU検定も妥当であるとすれば,U検定はt検定に比べて,検定効率は,3/π≒95.5% ほどです。これは,わかりやすくいえば,パワーアナリシスで,U検定で有意となるのに必要なサンプルサイズがnのとき,t検定では0.955nで十分であ る。(同じことだが,t検定で有意となるのに必要なサンプルサイズがmのとき,U検定では1.05m必要ということ)検出力はt検定の方が高いです が...ほとんど差がないですね。

4. ところで,あなたの持っているデータは対数正規分布しているのですか?理論的に対数正規分布しているのですか?それとも,「対数正規分布に近い分布」なのですか?つまり,対数をとる理論的根拠はあるのでしょうか。

No.23087 Re: 検出力について  【ビギナー】 2021/06/25(Fri) 10:32

青木先生

ご多忙中のところ,ご回答いただきありがとうございました。
私が考えております統計手法は,ノンパラメトリック検定としてマン・ホイットニーのU検定,パラメトリック検定としてt検定でございます。
成 書にはデータが非正規分布である場合,データを変数変換(ここでは対数変換)し正規分布にしてからt検定を行う方法と元のデータをマン・ホイットニーのU 検定を行う方法があると記載されておりました。対数変換後の解析結果は元データの尺度における解析結果ではありませんので,対数変換後(変換後は正規分布 であることを仮定)にt検定を行う方法と元のデータをマン・ホイットニーのU検定を行う方法とでは検出力はどちらが良いのか疑問に思いました。私がこれま で読みました解析報告書ではほとんどが前者の方法で解析していましたので,おそらく前者の方が検出力が高いからだと思いましたが,私が調べました成書では そのことが記載されていませんでしたので,質問したしだいでございます。
U検定はt検定に比べて,検定効率は,3/π≒95.5% であることは知りませんでした。
U検定とt検定の検出効率にほとんど差がありませんので,母集団の分布が不明でサンプルサイズが小さい場合,マン・ホイットニーのU検定で解析した方が良いと思いました。
サンプルサイズが小さい場合,母集団が正規分布するか否かを判断するのは難しいと思いました。
「U検定で有意となるのに必要なサンプルサイズがnのとき」⇒ここでいうサンプルサイズとは2群の総数という理解でよろしいでしょうか?

No.23088 Re: 検出力について  【aoki】 2021/06/25(Fri) 15:24

> 「U検定で有意となるのに必要なサンプルサイズがnのとき」⇒ここでいうサンプルサイズとは2群の総数という理解でよろしいでしょうか?

これは,パワーアナリシスの具体的手順で,2群合わせてのサンプルサイズか各群のサンプルサイズは明示(区別)されているでしょう。
それを具体化したコンピュータプログラムも,いずれのサンプルサイズが表示されるかどうかは説明されているはずです。 たとえば,R だと
> power.t.test(power = .90, delta = 1)

Two-sample t test power calculation

n = 22.0211
delta = 1
sd = 1
sig.level = 0.05
power = 0.9
alternative = two.sided

NOTE: n is number in *each* group

No.23089 Re: 検出力について  【ビギナー】 2021/06/25(Fri) 15:55

青木先生

例を挙げてご説明いただきありがとうございました。

U検定に比べt検定の方が検出力が高いと言われていましたので,かなり差があると思っていましたが,ほとんど差がないことに驚きました。

サンプルサイズが小さい場合は無闇にt検定で解析しないように注意いたします。

大変勉強になりました。

ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 048 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る