解析結果は画面には必ず表示される。画面への出力のほかに,プリンタまたはファイルのいずれか1つに出力することができる。ファイルに出力された解析結果は,後でプリンタに出力できるほか,ワープロソフトなどで利用可能である。また,分析結果の一部を切取ってデータファイルとすることにより,別の分析に用いることもできる(例えば,主成分得点をもとにしてクラスター分析を行うなど)。
一旦ファイルに出力された解析結果をプリンタに出力するには,MS-DOS のプロンプト(A>など)が表示されているときに,
TYPE ファイル名 >PRN 最後にリターンキーを押すことと入力すればよい。
結果の出力は原則として有効桁7桁の浮動小数点数として行われるが,論文などに引用する場合には示された桁数を全て用いる必要はない。むしろ,以下のように丸めた数値を引用しなければならない。→浮動小数点表記
多くの統計ソフトでは,検定は原則として両側検定を行った結果を示す。また,検定結果は検定統計量とその有意確率(P値)で表示する。P≦0.01 以下のとき「** Significant. α=1%」,0.01<P≦0.05 のとき「* Significant. α=5%」,0.05<P のとき「n.s. Not significant.」という表示を添えた。
もし,片側検定の結果が必要な場合には,表示された有意確率(P値)をもとに判定すればよい。例えば,対応のない2群の平均値の差のt検定で,t=1.73,自由度=45のとき,表示される P 値は 0.0904844 である。これは,|t|≧1.73 となる確率が約9% であることを表わしている。片側検定に対するP値はその半分の約 4.5% なので,5% の有意水準で帰無仮説を棄却する。
ただし,検定によっては片側検定が定義できない場合がある。
注意 検定の結果,両側検定では有意でないが片側検定ならば有意であるというようなときに,有意な結果が欲しいからといって片側検定を行ってはならない(逆の場合も同様)。両側検定にするか片側検定にするかは,データの分析に先立って決めなければならない(または自ずと決る)。
検定と区間推定はものごとを別の観点から見ているだけで,本質は同じである。論文を投稿しようとする学会誌によっては,検定結果だけでなく信頼区間についても記述を求められることがある。特に医学論文などでは,単に有意かどうかよりも,信頼区間を付記するほうが望ましい場合がある(例えばケース数が少ない場合)。
検定統計量を S0,標本統計量を X,標本統計量の標準誤差を SE,標本統計量の母数を θとする。
t検定(2群の分散が等しいと仮定できる場合)
| Xa-Xb | t0 =--------------------------------------- (1)式 sqrt{母分散の推定値・(1/Na+1/Nb)} (Na-1)・Ua + (Nb-1)・Ub 母分散の推定値 =------------------------- , Ua,Ub は各群の不偏分散 Na+Nb-2 t0 は自由度が Na+Nb-2 の t分布に従う。 出力結果(部分) ------------------------------------------------------------------------------ N Mean Variance S.D. ------------------------------------------------------------------------------ Group 1 37=Na 19.243243243=Xa 153.35585586=Ua 12.383693143 Group 2 41=Nb 14.000000000=Xb 116.50000000=Ub 10.793516572 Entire group 78 16.487179487 139.16217116 11.796701707 ------------------------------------------------------------------------------ ** t test When variances are equal. t ・・・・・・・・・・・・・・・・・・・・ 1.997842 = t0 = S0 = 検定統計量 Degrees of freedom ・・・ 76 = 自由度 P ・・・・・・・・・・・・・・・・・・・・ 0.0493122 * Significant. α=5%. 有意確率 SE(diff.) ・・・・・・・・・・・・ 2.624454 = SE = 平均値の差の標準誤差(1-α)・100% 信頼区間を求める手順
ちなみに,この95%信頼区間にゼロが含まれないことと,上記の検定結果「5%の危険率のもとで帰無仮説が棄却される」は等価である(下側信頼限界値がゼロに非常に近いのと,検定結果の有意確率(P値)が 0.05 に非常に近いことに注意)。
検定を行う場合,ケース数が大きければどのようなわずかの差であっても帰無仮説が棄却されることがある。逆に,ケース数が小さい場合にはどんなに差があっても帰無仮説は採択されてしまうことがある。
例えば,相関係数の検定(母相関係数=0)を考えてみよう。
母相関係数の検定1
帰無仮説 H0:「母相関係数ρ=0」相関関係はない。
対立仮説 H1:「母相関係数ρ≠0」。
両側検定を行う。
(標本相関係数)・sqrt(ケース数-2) t0= -------------------------------- ,自由度が(ケース数-2)のt分布に従う。 sqrt{1-(標本相関係数)2}式を見れば明らかなように,ケース数が大きいほど,また,標本相関係数が大きいほどt0の値は大きくなる。以下にいくつかの仮想例について検定を行った結果を示す。
------------------------------------------------------------------------------ ケース数 標本相関係数 t0 有意確率(P値) 母相関係数の95%信頼区間 ------------------------------------------------------------------------------ 10 0.1 0.284268 0.7834244 [-0.565,0.686] 50 0.1 0.696311 0.4895926 [-0.183,0.368] 100 0.1 0.994937 0.3222174 [-0.098,0.291] 250 0.1 1.582735 0.1147563 [-0.024,0.221] 500 0.1 2.242834 0.0253466 * [ 0.012,0.186] 1000 0.1 3.175029 0.0015441 ** [ 0.038,0.161] 10 0.3 0.889499 0.3996915 [-0.406,0.782] 10 0.5 1.632993 0.1411133 [-0.189,0.859] 10 0.7 2.772413 0.0242063 * [ 0.126,0.923] 10 0.9 5.839971 0.0003872 ** [ 0.624,0.976] ------------------------------------------------------------------------------標本相関係数の2乗は一方の変数が他方をどれくらい説明できるかを表わすので,標本相関係数が 0.1 とは,わずか 1% しか説明できないことを表わす。にもかかわらず,ケース数が 1000 にもなると統計学的には「有意な相関がある」という検定結果が得られる。逆に,ケース数が 10 の場合には標本相関係数が 0.5 の場合(25%説明できる)でも,統計学的には「有意な相関があるとはいえない」ことになる。25% しか説明できないとはいうものの,読者は自分の持っているデータで相関係数が 0.5 以上になるのはどれくらいあるかみてみればよい。標本相関係数が 0.5 というのは,実際上は相当意味のある数値である。ちなみに,母相関係数の信頼区間は [-0.189,0.859] であるから,もしかしたらもう少しケース数を集めればもっと標本相関係数が大きくなることもあり得る(当然,同じか,さらに小さな値の標本相関係数が得られるかもしれないが)。
-------------------------------------------------------------------------------------- 実質的な意味 検定結果 取るべき行動 -------------------------------------------------------------------------------------- 意味がある 有意である 得られた知見を採用する。 意味がある 有意でない ケース数を増やす。測定(調査)精度を高める。 意味がない 有意である 得られた知見は捨てる(そもそも検定など不要である)。 意味がない 有意でない 得られた知見は捨てる(そもそも検定など不要である)。 --------------------------------------------------------------------------------------