信頼率 $(1 - \alpha)$ のもとで,母比率 $\pi$ を $\pm x$ の精度で推定するために必要な標本の大きさ $n$ は,以下の式で見積もることができる。
\[ n \geqq \left (\displaystyle \frac{Z_{\alpha/2}}{x} \right )^{2} \pi\ (1-\pi) \tag{1} \] 式に出てくる母比率 $\pi$ はなんらかの意味での推定値である。それまでに行われた似通った調査結果や,予備調査の結果から推定するとよい。もし,そのよう推定値がないときには,$\pi = 0.5$ を仮定するとよい。そのようにすれば,必要な精度を満たすための標本サイズの上限値が計算される。
例:
類似の過去の調査結果から,母比率が 0.6 程度であると考えられる。このとき,信頼率 $95\%$ で母比率を $\pm10\%$ の精度で推定するためにはどのくらいの標本が必要か。
答え:
$\alpha = 0.05$ であるから,$Z_{\alpha / 2} = Z_{0.025} ≒ 1.96$ となる。したがって,
$n ≒ \left (\displaystyle \frac{1.96}{0.1} \right )^{2} \times 0.6 \times 0.4 = 92.1984$
(1)式はいろいろな教科書に載っているものであるが,検出力を指定できないので,場合によっては不都合である。
検出力を指定して必要な標本の大きさを求めるには,(2)式を使う。この式においては,$p$ を標本比率とする(上と同じ記述法で言えば,$\pi + x = p$ ということ)。
ちなみに,(1)式と(2)式を比較してみると,分子に $Z _{\beta}$ が含まれているかどうかの違いであり,上に示した式で得られるのは検出力が $50\%$ のときのものであることがわかる($Z_{\beta} = Z_{0.5} = 0$)。
\[ n \geqq \left (\displaystyle \frac{Z_{\alpha/2}\sqrt{\pi\ (1-\pi)} + Z_\beta\sqrt{p\ (1-p)}}{p-\pi} \right )^{2} \tag{2} \] 上の例題を,検出力 = 0.8 として解いてみよう。
$1-\beta = 0.8$ すなわち,$\beta = 0.2$ であるから,$Z_{\beta} = Z_{0.2} ≒ 0.8416$ となる。したがって,
\[ n ≒ \left ( \displaystyle \frac{1.96 \sqrt{0.6 \times 0.4} + 0.8416 \sqrt{0.7 \times 0.3}}{0.1} \right )^{2} = 181.1365 \]