No.22686 簡単なサンプルサイズの求め方について  【清水せつ子】 2019/02/26(Tue) 17:59

ある特定の母集団の血液中の化学物質の濃度を求めるために実験を委託したいと考えており,
血液中の化学物質の濃度の90%タイル値を信頼水準95%で予測するためのサンプル数を計算しています.
計算はできる限りシンプルにしたいと思っています.

私は,過去のデータを整理して,血液中の化学物質の濃度を正規分布に従い,母分散が既知と仮定することができるから,母平均の検定に使われる検出力の式で求められるのではないかと考えています.

検出力=P(|z|>Zalpha/2)

ここで,Zは,標本平均を期待値と分散で標準化した値.alphaは有意水準.

そんな中,某研究仲間から,二項分布に従うと仮定すれば,一つのサンプルをとり,それが90%タイル以上となる確率は0.9,n個のサンプルのすべてが90%タイル以上となる確率は0.9^nだから,

1-0.9^n= (1-信頼水準)    (1)

という数式でサンプルサイズnが求まると言われました.

・ その研究者に「血液中濃度を二項分布に仮定することはできないのではないか」と問いましたところ,不良品の計算と同じだから,0.9%タイル値を超えるか 超えないかといった二値でみればいいのだと言われました.また,血液濃度の分布は,ノンパラメットリックで見ているという回答を得ました.

母集団の分布が変われば,90%タイル値を95%の信頼水準で予測するためのサンプルサイズは異なるはずですが,(1)式では母集団がどのような分布であっても,サンプルサイズは同じとなるのでおかしいと思います.

すなわち,この回答に様々な理論的な間違いが含まれていると思いますが,どこに間違いがあるか今のところ答えが見つかりません.

・さらに,二項分布で仮定して,90%タイル値を超えるか超えないかといった二値でみれるならば,
(1)式は 1-p(n)=(1-信頼水準),ここでp(n)はBin(n,p)ではないかと思います.

以上,不適切な質問かもしれませんが,以上の2点についてご助言いただけませんでしょうか.

な お,私がこのFAQで問いたいのは,上記の間違いを理論的に説明したく,そのご助言をいただきたいということです.参考のため,私が以前に作成した血液濃 度のサンプルサイズに関するファイルを添付しようと思いましたが,ファイルサイズが大きく添付できませんでした.この件でまた悩みがでましたら,改めて投 稿させていただきます.

No.22687 Re: 簡単なサンプルサイズの求め方について  【青木繁伸】 2019/02/26(Tue) 18:50

利用上の注意に書いてあるように,

画像などのバイナリーファイルをアップロードすることが可能です。

添付可能ファイル : PNG, ZIP
最大投稿データ量 : 150 KB

ということです。


> それが90%タイル以上となる確率は0.9
  ? 0.1 では?

> 0.9%タイル値を超えるか超えないか
  ? 90%タイルの書き間違い?

検出力と信頼率(信頼度)を混同している?

No.22688 Re: 簡単なサンプルサイズの求め方について  【清水せつ子】 2019/02/27(Wed) 11:17

青木先生

早速の回答ありがとうございます.
添付ファイルについては承知いたしました.
ご丁寧な情報をありがとうございます.

> それが90%タイル以上となる確率は0.9
  ? 0.1 では?

> 0.9%タイル値を超えるか超えないか
  ? 90%タイルの書き間違い?

はい,1-0.9,90%タイルが正しいです.

また,次の文章にも訂正があります.

>n個のサンプルのすべてが90%タイル以上となる確率は0.9^nだから,

0.9^n→(1-0.9^n)です.

どれも私の書き間違いです.
申し訳ありません.

・(1)式は検出力と信頼度を混合しているということですね.
そのとおりだと思いました.
まとめます.

検出力というのは,ある検定方法を用いて,ある値thetaに対する帰無仮説を棄却する確率です.
つまり,標本平均が母平均と同等という帰無仮説を立てた場合,標本平均が母平均と異なる対立仮説が示せる確率,ある標本の不良率が,母不良率と同等であるという帰無仮説を立てた場合は,それが異なる対立仮説が示せる確率を表すものです.

一方,信頼度は,帰無仮説が正しいとされる確率です.ここでは,95%信頼水準が当てはまります.

検定を行うことによる間違いが2種類あって,帰無仮説が正しいのに間違いだとする過誤を示すのが信頼度,対立仮説が正しいのにそれを間違いだとする確率を示すのが(1-検出力)です.

(1)式では,明らかに,検出力と信頼度が区別されていません.

・また,信頼度か検出力を求めようとしている式が,1-0.9^nというのも間違い.

もし混合していて,(1)式の左辺が検出力,右辺が1-信頼水準としているのであれば,

左辺は不良率と同じように検出力を求めることができ,1-0.9^nではなく,

1-P(n),

ここで,p(n)は二項分布(n,p),nは標本数,pは不良確率

となります.

以上,これが私の理解です.
間違いがあればご指摘ください.よろしくお願いいたします.

No.22689 Re: 簡単なサンプルサイズの求め方について  【青木繁伸】 2019/02/27(Wed) 12:10

> 帰無仮説が正しいのに間違いだとする過誤を示すのが信頼度

違います。「帰無仮説が正し いのに間違いだとする過誤」は第一種の過誤(その過誤を犯す確率がα)。信頼度は 1-α で表される。同じようにしてデータを収集し,信頼限界を計算したとき,その信頼限界が母数(帰無仮説で仮定した統計量)を含む確率。信頼度をを大きくする にはサンプルサイズを大きくする必要がある。

> 検出力というのは,ある検定方法を用いて,ある値thetaに対する帰無仮説を棄却する確率です.

微妙だけど正確ではない。検出力とは,帰無仮説が間違っている場合に,帰無仮説を棄却できる確率(1-β)。βは,帰無仮説が間違っているのに帰無仮説を棄却できない確率。サンプルサイズを大きくすれば,検出力は大きくなる。

つ まり,あなたの場合は,「血液中の化学物質の濃度の90%タイル値」を「誤差範囲内」で推定する際に,推定値「90%タイル値±誤差」が真値である 「90%タイル値」を信頼度95%で含むようにするためにはサンプルサイズが幾つ必要かということでしょう。しかも,調査は1回しか行われないので,その 調査が成功する為には検出力も高くする必要があるので,サンプルサイズはもっと必要であると。

母平均を求めるのならば http://aoki2.si.gunma-u.ac.jp/lecture/SampleSize/muconf.html ,特にその後半の方法が使えるのだが,90%タイル値を求めるのはこれではだめでしょうね。

解を求める直接的な方法はないかもしれない。モンテカルロ法で求めることはできるかも。

No.22690 Re: 簡単なサンプルサイズの求め方について  【清水せつ子】 2019/02/27(Wed) 12:33

青木先生

早速のお返事ありがとうございます.

訂正ありがとうございます.
また,モンテカルロ法に対する助言についてもありがとうございます.
大変参考になります.
平均ではなく,90%タイル値の求め方については,少しやってみて,後日,躓きましたら再度投稿いたします.

よろしくお願いいたします.

● 「統計学関連なんでもあり」の過去ログ--- 048 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る