片側検定と両側検定

     初出:Dec 31, 2002
     Last modified: Sep 10, 2003


1. 二群の比率の差の検定と $k(\geqq 3)$群の比率の差の検定

1.1 二群の比率の差の検定

通常行われるのは, \[ Z_0 =\frac{p_1-p_2}{\sqrt{p(1-p)\Bigl(\displaystyle \frac{1}{n_1}+\frac{1}{n_2}}\Bigr)} \tag{1} \] であるが,正規分布に従うことによる(記号の割り当てについては,一般的なやり方に従うので,略)。
両側検定のときには,$\Pr\{Z > |\ Z_{0}\ |\ \}$ の確率を求め有意確率とする。統計数値表やコンピュータを使う関数では,$\Pr\{Z > 1.96\}=0.05$ という結果が得られるようになっている場合もあるが,場合によっては $\Pr{Z > 1.96}=0.025$ とか $\Pr{Z > 1.96}=0.95$ あるいは $\Pr{Z > 1.96}=0.975$ となっている場合もある。どのようになっているかは重要なことなので,確認しておくべきである。
例えば,Excel では NORMDIST(1.96)=0.975002175 であるが,R では pnorm(1.96)=0.9750021 であるし,pnorm(1.96,lower=F)=0.02499790 である。 いずれにしろ,$Z=1.96$ のときの両側検定の有意確率は $P=0.05$ である。

ところで,同じデータについて,$\chi^2$分布を使う検定では, \[ \chi^2_0 = \frac{n(ad-bc)^{2}}{efgh} \tag{2} \] ということになる。
ここで,同じデータに基づいた場合には, 先の $Z_{0}$ とこの$\chi^2_0$には \[ Z_{0}^{2} = \chi^2_0 \] が成り立ち,$\Pr\{Z > Z_{0}\}=\Pr\{\chi^2 > \chi^2_0\}$も成り立つ。つまり,両者は同じ検定結果を生み出す等価な検定ということになる。

さて,$\chi^2$ 検定の定義においては $a$ のセルが期待値より多い方向にずれようと,少ない方向にずれようと$\chi^2_0$は大きくなる方向にしか変化しない。つまり,$\chi^2_0$は,実測値が理論値と同じ場合には 0 であるが,実測値が理論値より大きかろうが小さかろうが,とにかく「違う」場合には,必ず正の値を取るということである。 つまり,$\chi^2$ 分布を用いる検定では形式的には食い違いの方向性を仮定する片側検定ができないのである。

しかし,$Z_{0}$ を用いる場合には片側検定ができる。片側検定 $\pi_{1} < \pi_{2}$ のときならば,有意確率は $\Pr\{Z < Z_{0}\}$ とすればよいし,$\pi_{1} > \pi_{2}$ のときならば,有意確率は $\Pr\{Z > Z_{0}\}$ とすればよいのである。

ちなみに,$\chi^2$ 検定の棄却域は,$P 値 = \Pr\{\chi^2 > \chi^2_0\}$ という形式から見てわかるとおり,右側にのみ取られる。これをもって「片側検定」と言う人はいないのに,後述の $F$ 分布を使う検定で,「$F$ 検定は,棄却域を片側(右側)のみに設けるから $F$ 検定は片側検定だ」という人がいるのはちょっと納得がいかない。

もう一つ付け加えておく。比率の差を $\chi^2$ 分布を用いて検定するときに,左側の例えば $0.05\%$ は何を意味するであろうか。それは,「偶然とは思えないほど差がない」ということである。これは比率の差の検定ではあまり取り上げられないが,適合度の検定(これも比率の差の検定としても解釈できる)の場合には「データがねつ造された可能性」を示唆するものとして取り上げられることがある。すなわち,$\chi^2$ 分布の左側は「理論に一致しすぎる」,右側は「理論と乖離しすぎる」ということである。中庸がもっともあり得るという立場から検定すれば,「$\chi^2$ 検定の場合にも両側検定はあり得る」。

1.2 三群以上の比率の差の検定

三群以上の比率の差の検定は,$\chi^2$分布を用いる検定になる。これは,二群の場合の$\chi^2$分布を用いる検定と何ら変わることがない。 二群の場合に(2)式を使うがそれは簡略化したものであり,実際には \[ \chi^2_0 = \sum\sum\frac{(O_{ij}-E_{ij})^{2}}{E_{ij}} \tag{3} \] により計算する結果と同じになる。
後者の式は二群であろうと,三群以上であろうと同じである。
違うのは,自由度が変わるというだけである。

さて,(3)式を見ても分かるとおり,$E_{ij}$ が $O_{ij}$ より大きい場合でも小さい場合でも,検定統計量($\chi^2_0$)は大きくなる方向に変化することが分かる。つまり,二群の比率の差の検定のときに述べたのと同様,両側検定しかない訳である。
三群以上の場合には二群の場合にあった正規分布を使う方法はないので,片側検定は絶対できないのである。

1.3 まとめ

標準正規分布に従う統計量 $Z$ があるとき,$Z^{2}$ は自由度 1 の $\chi^2$ 分布に従う。このため,自由度 1 の $\chi^2$ 分布に従う検定統計量を用いる検定は,標準正規分布に従う検定統計量を用いる検定と同じである。
ただし,同じであるのは両側検定の場合のみであって,$\chi^2$ 分布を用いる検定は両側検定しかできないが,標準正規分布を用いる検定は片側検定もできる。
ただし,できるできないは表面的なものではある。
しかし,$\chi^2$ 分布を用いる検定であっても,自由度が 2 以上になる場合には,対応する,標準正規分布を用いる検定は存在し得ないので,必然的に両側検定しかできない。

2. 二群の平均値の差の検定と $k(\geqq 3)$群の平均値の差の検定

2.1 二群の平均値の差の検定

二群の平均値の差の検定(等分散性が仮定できるとき)は, \[ t_{0} = \frac{m_{1}-m_{2}}{\sqrt{U\Bigl(\displaystyle \frac{1}{n_1}+\frac{1}{n_2}\Bigr)}} \tag{4} \] となる($U$ は両群をプールした分散)。
この式の見かけは $t$ は正・負の符号を取りうると言う点で,(1)式と類似している。
すなわち,両側検定を行う場合に有意確率は,$\Pr\{|\ t\ | > |\ t_{0}\ |\}$ を計算する。片側検定の場合には,帰無仮説の方向性($t_{0}$)により, $\Pr\{t < t_{0}\}$ もしくは $\Pr\{t > t_{0}\}$ として求められる。
これも,1.1 の場合と同じである。

2.2 三群以上の平均値の差の検定

さて,先に,三群以上の平均値の差の検定について述べる。通常はこの検定は一元配置分散分析という名前で呼ばれ,使われるのは $F$ 分布である。細かいことをいう必要はないが,一元配置分散分析では,「群間分散/群内分散」の比が $F$ 分布に従うことを利用する。群間分散は群内分散より必ず大きいので用いられる検定統計量は 1 より大きい。
$F$ 分布において,「ある値より大きい $F$ 値が得られる確率」は片側確率として与えられる(Excel で は <FDIST(2.34, 2, 4) = 0.212363822,R では,pf(2.34, 2,4, lower.tail=FALSE)=0.2123638)。
では,一元配置分散分析の帰無仮説が成り立たない方方向(棄却域)は $2.5\%$ とればいいのか $5\%$ とればいいのか。
これは,「群間分散/群内分散」がどのように構成されるかを考えればよい。たとえば,標本サイズと分散が全く同じで平均値が異なる a, b, c の三群の平均値がこの順に並んでいようが,c, b, a の群であろうが, b, c, a であろうが(あと 3 つあるが)三つの平均値間の距離が同じであれば検定統計量は全く同じになる。つまり,一元配置分散分析では仮説に方向性がない---両側検定なのである。
さきほど,$F$ 分布の棄却域は片方(右側)とか,「群間分散/群内分散の比は必ず 1 より大きい」といったが,それに注目すれば片側検定であるが,意味的には両側検定なのである。
というか,一元配置分散分析を両側検定だとか片側検定だとか区別することに意味がないように思える。
有意水準 $\alpha= 0.05$ で,帰無仮説から考えてより起こりにくいことを表す $P$ 値は,$F$ 分布の右側(上側)確率で,その確率の大きさは $0.05$ とするのである。

なお,1 章の比率の差の検定における標準正規分布と自由度 1 の $\chi^2$ 分布の関係と結びつければ,以下のようなことがある。
群間分散の自由度が 1(すなわち二群の場合の一元配置分散分析)の場合には,一元配置分散分析として計算した $F_0$ 値と,二群の平均値の差の検定として計算した $t_{0}$ 値には,$F_0 = t_{0}^{2}$ という関係がある。
この関係は先に示した,$\chi^2_0 = Z_{0}^{2}$ と同じである。すなわち,二群の平均値の差の検定と見た場合には片側検定があり得るが,一元配置分散分析には片側検定(意味的な片側検定)はない。

前述した,「$F$ 検定は右側にのみ棄却域を設けるから,片側検定である」という主張は,形式的なものに過ぎない。「二群の平均値の差の $t$ 検定を両側検定で行うと,棄却域は右と左の両側に設けられるから両側検定である。同じデータを,$F$ 検定で行うと,棄却域は右側だけであるから片側検定である。」それは,屁理屈というものである。同じデータについて検定を行い,両方の $P$ 値を求めて比較してみると容易に分かることであるが,$t$ 分布の左右両側の棄却域に対する $P$ 値も,$F$ 分布の右側のみの棄却域に対する $P$ 値も,全く同じ値になる。

さらに,群間分散の自由度が 2 以上になる(すなわち,三群以上の平均値の差の検定--一元配置分散分析の)場合にも当然,意味的な片側検定はあり得ない。

2.3 ノンパラメトリック検定との関係で

2 群の代表値の差の検定に対応するノンパラメトリック検定はマン・ホイットニーの $U$ 検定,3 群以上の場合にはクラスカル・ウォリス検定がある。
ここで,それぞれのノンパラメトリックの漸近近似が標準正規分布と $\chi^2$ 分布を用いるということを指摘しておく。
つまり,$t$ 分布と $F$ 分布の関係が,標準正規分布と,$\chi^2$ 分布の関係と類似点があると言うことである。

3. $\chi^2$ 分布や $F$ 分布を利用する検定には片側検定はないのか

そんなことはない。

3.1 母分散の検定

母分散の検定では,母分散がある値より大きいか・小さいかという方向性を持った対立仮説がたてられる。

3.2 二標本の分散比の検定

通常,$t$ 検定の前段階として二群の等分散比の検定を行うが,そのときに,「不偏分散の比を取るときに,1 以上の値になるように分子・分母を設定する」という所がある。これはうっかりすると,なんでこんなことをやるんだろうと見逃すところであるが,これは,従来の統計数値表がどのように作られているかに関連している。すなわち,「$F$ 分布表は上側確率しか用意していない(ことがおおい)」ということである。
2.2 の一元配置分散分析において,右側(上側)$5\%$ が棄却域であるとのべたことは,まさにこれを意味している。
しかし,ここに落とし穴がある。等分散性の検定というのは,例えば $F_0 = \displaystyle \frac{u_{1}}{u_{2}}$ を計算するとき母分散が等しいなら検定統計量は 1 になるだろうが,帰無仮説がはずれる方向は 2 方向つまり,$F_0 < 1$ と $F_0 > 1$ の二通りの場合があるということである。$F$ 分布表は後者に対応して作成されているので,この $F$ 分布表で例えば有意水準 0.05 の両側検定を行うためには $\Pr\{F > F_0\}$ が0.025(!!)より大きいか $\Pr\{F < F_0\}$ が 0.025 より小さい場合に「二群の母分散は等しくない」と結論するのである。
そして,後者の場合の判定を行う統計表は添付されていないので前者のみ $\Pr\{F > F_0(> 1)\}$ の判定を行う訳である。そして,そのためには,$\alpha=0.025$ の統計数値表が必要なのである(なぜ $\alpha= 0.025$ とか $\alpha = 0.005$ などという,半端(?)な $\alpha$ に対する統計数値表があるのかの説明でもある)。

ちなみに,R で二群の分散が等しいといえるかどうかの検定を行うと,検定統計量は 1 以上の値を取るようには調整されない。しかし,ちゃんと $P$ 値を計算してくれる(当たり前である)。

おまけ

この記事は,統計に関する FAQ のつもりで書いたものである。
この記事を読んで更に反論する方もいたが,別のきっかけでその後以下の本の記述に気づいた。
新訂 ユーザのための 教育・心理統計と実験計画法
田中敏,山際勇一郎
教育出版
81ページ
1989年4月20日 初版第1刷
2002年10月8日 二版14刷

◆ 片側・両側検定の区別のある方法とない方法

 $\dots$ 両側検定・片側検定の区別がない方法もある。分散分析や $\chi^2$ 検定(後述)がそうである。実際は,これらの方法における検定は当該分布の片側にしか「有意差の区域」をもうけないので,分布の両側を使用しているか片側を使用しているかという観点から言えば「片側検定」である。$\dots$

 しかし,分布の使い方でなく,帰無仮説に対する対立仮説を両側に設定しているか片側に設定しているかという観点から言えば,分散分析は「両側検定」である。$\dots$

 このような紛らわしさを避けて,例えば分散分析は「片側分布の両側仮説」であると表現することもあるが,研究の実用上は片側・両側の区別のない方法であると考えたほうがわかりやすいであろう。

 以上,検定結果の記述に「両側検定」のコトバを必要としない方法は,実質的に両側検定にしかならい方法なのである。


Go to トップページ  ・ 直前のページへ戻る
・ E-mail to Shigenobu AOKI