「統計学関連なんでもあり」の過去ログ--- 045

No.16666　「独立性の検定」と「二元配置分散分析」の違いについてです。　　【つかさ】　2012/03/21(Wed) 22:50

　初めて質問させていただきます。
こちらのホームページ等を参考にしながら，統計の検定手法を独学していますが，「独立性の検定（カイ二乗検定）」と「二元配置分散分析」の違いが十分理解できません。

　例えば，下記の問いを立てた場合，「独立性の検定（カイ二乗検定）」と「二元配置分散分析」のどちらがより適切な検定手法といえるのでしょうか？（私の不勉強で，両方不適切，両方やるべき，といった可能性もあるかもしれません）

（問）「263 人の新入職員について，最終学歴（中卒，高卒，大卒，院卒）を調査した結果が，表 1 （3×4 の分割表）のようになった。出身地で最終学歴に差があるかを 5% の有意水準で検定しなさい。」

　　表 1. 出身地別の最終学歴（架空例）
----------------------------------------------
         [中卒] [高卒] [大卒] [院卒] [合計]
[愛知県]      7     21     53     24    105
[三重県]      2     31     43     12     88
[岐阜県]     10     26     29      5     70
[合　計]     19     78    125     41    263
----------------------------------------------

　なお，R version 2.14.2 でそれぞれ計算してみると
以下の結果（一部抜粋）を得ました。

----------------------------------------------
> chisq.test(tbl1)

	Pearson's Chi-squared test

X-squared = 21.1577, df = 6, p-value = 0.001719

> twoway.anova(x, a, b)
> summary(aov(x ~ f1+f2, df1))
            Df  Sum Sq Mean Sq F value  Pr(>F)  
f1           2  153.2    76.6   1.135 0.38188   
f2           3 2152.9   717.6  10.636 0.00814 **
Residuals    6  404.8    67.5
----------------------------------------------

　もし私が最初に立てた問いに問題がある場合は，どこに誤解の原因があるとお考えになるかもご指導いただけると幸いです。

　何卒ご教授よろしくお願い致します。長文失礼しました。

No.16667　Re: 「独立性の検定」と「二元配置分散分析」の違いについてです。　　【青木繁伸】　2012/03/22(Thu) 10:59

このようなデータに二元配置分散分析を適用するということは，サンプルサイズを測定値と見なすことになるわけです。二元配置分散分析の典型例は，あなたの示した表1の各ます目にあるのは測定値です。合計欄に示すものは各水準の標本平均（なので，合計欄という名称は不適切になりますが）。サンプルサイズも測定値も，数値だけを見れば区別が付かないとはいうものの，意味は全く違う（違うというかそもそも似てる・似てないと比較する意味もないもの）。
もし，数値が本当にサンプルサイズであるならば，数値を全部10倍（100倍でもなんでも）して，独立性の検定と「二元配置分散分析」を適用してみるとよいでしょう。独立性の検定のP値は変わるでしょう。サンプルサイズは検定統計量に影響を及ぼし，結果的にP値も変わるからです。これに対して，「二元配置分散分析」の結果は「不変」でしょう。測定値と見た場合は，10倍しても何倍しても，測定値ならば線形変換（単位変換と同じ）の影響は受けないので当たり前です（センチで表したデータとミリで表したデータ，どちらを使ってt検定しても，結果は変わりませんね)。
ただし，あなたが示した例は（この掲示版ではよくあることなのだけど）不適切なたとえ話になっている可能性がある（だから，分かりやすいだろうなどと思って適当なたとえ話をするのは，お互い何のメリットもないのです）。例えば，表にある数値が例えば単位当たりのある特性を持つものの個数のような場合は，その数値は水準の組み合わせにおける「測定値」の性格を持つものになることもあるでしょう。

No.16676　Re: Re: 「独立性の検定」と「二元配置分散分析」の違いについてです。　　【つかさ】　2012/03/25(Sun) 13:41

　青木先生，早速のご回答ありがとうございました。
私の方はお返事が遅くなり大変申し訳ありません。
先生のご回答を理解し，変化の生じた自分の考えをまとめるのに時間がかかりました。

　最初に，ご確認いただきたいのですが，私の理解が正しければ，先生のご指摘およびご指導は以下の 5 点でした。いずれも私に欠けていた認識でした。
改めて感謝致します。

・前提として，サンプルサイズと測定値は，両方とも「数値である」という類似点以外には，差異しか持たない関係にあり，比べる価値がないほど異なる意味をもつ。
・そして，二元配置分散分析は，極めて多くの場合，測定値を対象とする。
・したがって，質問の例では，二元配置分散分析を適用するのは適切であるとはいえない。
・しかし，表にある数値が，例えば「住民1000人当たりの議員数」のように「測定値」の性格を持つ場合は，その限りではない（より適切な検定手法は逆転する）。
・例え話は，相当注意しなければ，双方に有害な影響を与える蓋然性が高い。

　加えて，報告ですが，例示した数値を全部 1000 倍して検定し直してみました。先生が教えてくださった通りの結果になることを自分でも確認できました。
----------------------------------------------
> chisq.test(tbl1)
        Pearson's Chi-squared test
X-squared = 21157.69, df = 6, p-value < 2.2e-16 (= 0.00000000000000022)

> summary(aov(x ~ f1+f2, df1))
            Df    Sum Sq   Mean Sq F value  Pr(>F)
f1           2 1.532e+08  76583333   1.135 0.38188
f2           3 2.153e+09 717638889  10.636 0.00814 **
Residuals    6 4.048e+08  67472222
----------------------------------------------
　先生のご指導を元に，私なりに調べたり解釈したりしてみて，以下の 2 つの考えに至りました。

・サンプルサイズと測定値を分ける最大の違いは，その数値が「近似値（誤差を含む）」かどうかである。
・（逆の見方をすれば）独立性の検定は，極めて多くの場合，サンプル数（＝データの個数）を対象とする。

　しかし，ご質問させていただいた「独立性の検定と二元配置分散分析のどちらがより適切な検定手法か？」について，まだ独力で判断できる自信が持てません。解決できずにいる疑問が，2 つ残りました。つきましては，重ねての質問をお許しください。以下は，私の無知が大きな原因と感じられる疑問ですが，恥を忍んで述べさせていただきます。

　私が解決できずにいる疑問のひとつめは，以下の考察から生じました。

　まず，前提として，度数（＝サンプルサイズ，サンプル数，データの個数）は少なくとも標本内においては「真の値」であるが，測定値は「誤差を含んだ近似値である」，を設定しました。

　しかし，例えば，人口統計資料の集計表でしばしば目にするように，単位「千人」を使って度数を測定値（の性格を持つ数値）に変換したり（千人未満を切り捨てたり），「男性 50名，女性 51名の計101名」という結果を「男性 49.5％，女性 50.5％」というように度数を比率に変換したり（小数点以下第2位を四捨五入したり）できる以上，「独立性の検定と二元配置分散分析のどちらがより適切な検定手法か？」という問いの答えは「調査者の好みによる」となってしまいます。（もちろん，測定値を度数に変換することは通常できませんが）。

　換言すれば，調査者は，度数を恣意的に測定値に変換できるのであるから，恣意的に二元配置の分散分析を使用（選択）することができるのではないか？ということです。

　二元配置分散分析の方が，一度の検定で，2要因のそれぞれについて，要因効果の有無を検定できるため，独立性の検定より得られる情報が多いと考えます。しかし，「得られる情報が多い（少ない）」といった理由だけで検定手法を恣意的に選択できるとすれば，仮説の弱い研究デザインを立案した調査者が，好んで二元配置分散分析を用いる蓋然性が高くなる，と自然に考えることができます。

　その場合，どちらの検定手法を用いるかは，調査者の「好み」や「倫理観」に依存するということになってしまう，と考えられますが，これはおそらく統計学的にはよろしくないことだと私には感じられます。

　私が解決できずにいる疑問のふたつめは，以下のことを学習したことによります。

・分散分析では実行するためのいくつかの前提条件があり，それは，「正規性」，「分散の等質性」，そして「観測値の独立性」である。
・このうち，「正規性」と「分散の等質性」に対しては，分散分析はある程度の頑健さを有することが知られている（つまり，多少この前提条件が破れても，結果に大きなゆがみは生じない）。
・しかし，「観測値の独立性」に対しては，分散分析はやや弱いことが指摘されている（栗田, 1999)。

　適切な例え話ができる自信がありませんので，先生が解説されている「二元配置分散分析　各水準の繰返し数が等しく，1 である場合」で用いた例を拝借します。
----------------------------------------------------------------------------
「表 1 のようなデータがある。4 種の肥料間で収量に差があるか，また，3 種の品種ごとに差があるか検定しなさい。」

    　　表 1. 各水準の繰返し数が等しく，1 である場合
    -----------------------------------------------------
　　　　　　　　[肥料　B1][肥料 B2] [肥料 B3] [肥料 B4]
    [品種　A1]　　　　　9　　　　17　　　　12　　　　16
    [品種　A2]　　　　　1　　　　21　　　　16　　　　11
    [品種　A3]　　　　　7　　　　19　　　　 6　　　　 9
    -----------------------------------------------------

> summary(aov(x ~ f1+f2, df1))		
            Df  Sum Sq Mean Sq F value  Pr(>F)
f1           2  21.500  10.750  0.6593 0.55103
f2           3 268.667  89.556  5.4923 0.03719 *
Residuals    6  97.833  16.306
----------------------------------------------------------------------------
　この場合，検定手法を分ける根拠は，最初の解釈でいくと，「収穫」の単位だけであると考えられます。

　通常，収穫高は「トン」や「キログラム」のような「測定値」です。したがって，先生は「二元配置分散分析」を用い，「品種の差があるとはいえない」と「肥料の差がある」の 2 つの結論を導きました。しかし，例えば，表にある数値が例えば「個」や「匹」で表わされる度数の場合，表内の数値の期待値は，品種A3-肥料B1に対応する桝目のみ5未満（= 4.84）ですので，「カイ二乗検定」が「二元配置分散分析」より適切な検定手法ということになります。
----------------------------------------------------------------------------
> chisq.test(tbl1)
        Pearson's Chi-squared test
data:  tbl1 
X-squared = 11.3865, df = 6, p-value = 0.07714

 警告メッセージ： 
In chisq.test(tbl1) :  カイ自乗近似は不正確かもしれません 
----------------------------------------------------------------------------
　有意水準 5％とすると，「2 要因は独立でないとはいえない（関連があるとはいえない）」という結論が導かれます。

　しかし，「観測値の独立性」が前提として成立すると考えれば，先生が（おそらく単位「トン」か「キログラム」で）選択したように，「二元配置分散分析」を選択した方が良いのか？
　一方で，二元配置分散分析を選択する場合は，前もって独立性の検定をしなければならない（「観測値の独立性」という前提を確保しなければならない）とすれば，多重性の問題が生じるため，有意水準を例えばボンフェローニの方法で 0.025としなければならないのか？

　自身でも，細かすぎるというか，言葉遊びのようになっている感じが否めませんが，何とぞよろしくご指導願います。考えをまとめるのが苦手なため，再び長文であることをお詫びいたします。

No.16677　Re: 「独立性の検定」と「二元配置分散分析」の違いについてです。　　【青木繁伸】　2012/03/25(Sun) 18:55

> 　通常，収穫高は「トン」や「キログラム」のような「測定値」です。したがって，先生は「二元配置分散分析」を用い，「品種の差があるとはいえない」と「肥料の差がある」の 2 つの結論を導きました。しかし，例えば，表にある数値が例えば「個」や「匹」で表わされる度数の場合，表内の数値の期待値は，品種A3-肥料B1に対応する桝目のみ5未満（= 4.84）ですので，「カイ二乗検定」が「二元配置分散分析」より適切な検定手法ということになります。

データは度数で測るとしても，それは単位当たり（例えば1平方メートル当たりとか一株当たり）ということなので，独立性の検定は不適切です。そのデータを2平方メートル当たりとか10株あたりという単位を変えれば，単位に比例することがわかるでしょう？

No.16684　Re: 「独立性の検定」と「二元配置分散分析」の違いについてです。　　【つかさ】　2012/03/25(Sun) 22:43

　青木先生，丁寧にご対応いただき，ありがとうございました。まだ，考え方を十分に身につけられたという実感はありませんが，少なくとも今後の学習の方向性は見出せたように感じます（もちろん学ぶことは多くありました）。

　まず，私がしっかりと学習し直す必要があることは，「サンプルサイズ」と「測定値」の違いについてです。そして私が改めるべき誤解は，おそらく「検定手法を分ける根拠は，単位である」という理解でしょう（「単位」についても復習します）。
　誤解の背景には，「度数」という用語の意味を，自身が曖昧にしたまま使っていることがひとつの原因として挙げられると考えました。

　今回のご指導で理解できたことは，一部繰り返しになりますが，以下の 5 点です。
・サンプルサイズと測定値は，両方とも「数値である」という類似点以外には，差異しか持たない関係にあり，比べる価値がないほど異なる意味をもつ。
・二元配置分散分析は，極めて多くの場合，測定値を対象とする。
・独立性の検定は，極めて多くの場合，サンプルサイズを対象とする。
・サンプルサイズのデータに二元配置分散分析を適用するということは，サンプルサイズを測定値と見なすことになる（それゆえ，適切であるとはいえない）。
・測定値のデータに独立性の検定を用いることは不適切である。

　現時点での理解としては（まだ誤解している蓋然性は高いですが）以下の 2 点です。
・独立性の検定が扱うのは，「度数分布」であり，「確率」や「生じやすさ」である。
・二元配置分散分析が扱うのは，「測定値」であり，「長さ」「重さ」などの量である。

　これからも統計の学習を続けることをお約束します。本当にありがとうございました。