★ 分散分析 ★

 77 分散分析  tanpopo  2001/12/21 (金) 17:01
  78 Re: 分散分析  青木繁伸  2001/12/21 (金) 17:12
   79 Re^2: 分散分析  tanpopo  2001/12/21 (金) 23:36
    81 Re^3: 分散分析  青木繁伸  2001/12/22 (土) 00:15
     83 Re^4: 分散分析  青木繁伸  2001/12/22 (土) 00:32
      86 Re^5: 分散分析  tanpopo  2001/12/23 (日) 14:13


77. 分散分析  tanpopo  2001/12/21 (金) 17:01
分散分析は,標本データを用いて母集団の平均に統計的有意な差があるかどうかを検定するための分析手法だと理解しているのですが,全数調査で得られたデータを用いる場合は,単純に平均値の比較・よみこみをすればよいだけでしょうか?
つまり,わざわざ分散分析で等分散性を確認して,F検定をするという手順をする必要はないのでしょうか?

     [このページのトップへ]


78. Re: 分散分析  青木繁伸  2001/12/21 (金) 17:12
> 分散分析は,標本データを用いて母集団の平均に統計的有意な差があるかどうかを検定するための分析手法だと理解しているのですが,全数調査で得られたデータを用いる場合は,単純に平均値の比較・よみこみをすればよいだけでしょうか?
> つまり,わざわざ分散分析で等分散性を確認して,F検定をするという手順をする必要はないのでしょうか?

ありません。
全ての検定は,標本データに基づいて母数についての仮説を検証することですから,母数がわかっている(全数調査)のにそんなことをする必要は微塵もないわけです。

しかし,

「あなたが全数調査したのは,母集団ですか?」

たとえば,ある町の成人全員を調査したとして,それがあなたが考える母集団でしょうか。だったら,結論は変わりません。

しかし,「ある町の成人全員」は,「日本全国の成人という母集団」からの標本だと考えるのならば(決して,良い標本の取り方ではないですが),検定することにも意味はあるでしょう。

どっちですか?

     [このページのトップへ]


79. Re^2: 分散分析  tanpopo  2001/12/21 (金) 23:36
> 「あなたが全数調査したのは,母集団ですか?」
自分自身が調査収集したというのではなく,国勢調査など官公庁の既存統計資料を利用しようと考えているのですが。。

例えば,仮に全員が正しく課税申告をしていると考えることができた場合に,課税所得を自治体住民でわり,”1人当たり課税所得”をつくるとします。
この概念的に算出された”1人当たり課税所得”が自治体の人口規模別(1万未満,1万〜3万,3万〜5万などカテゴリー化)で平均値に差があるかどうかを調べたいときに,分散分析を行うのはナンセンスでしょうか?

単純に平均値をプロットすればたりるのでしょうか?

この場合,母集団が厳密には何なのかよくわかりませんが,日本国民でしょうか。

     [このページのトップへ]


81. Re^3: 分散分析  青木繁伸  2001/12/22 (土) 00:15
そうですね。むずかしいでしょうね。

データというのを考えるときに,一つ重要なのは,観察単位(ケース)が何であるかということでしょう。

今の場合は,観察単位は「自治体(市町村)」ですね。そして,観察データは市町村の特性「1人当たり課税所得」です。確かに,一人あたりの課税所得の算出は全数調査を基準にしてはいます。でも,そのデータは全数調査に基づいた,市町村の特性値とも解釈できます。ですから,その市町村のデータは標本値とも見ることができます。「1人当たり課税所得」の母集団は「同じような構成からなる日本の市町村」(そんなものがあるのか??)ということになり,そのような母集団は存在するのか?ということにはなるでしょう。

たとえば「1万未満」の人口規模における「1人当たり課税所得」の平均値を考えると,それは「「1万未満の人口規模」の市町村の母集団の母数を推定する標本平均と考えることはそう無理のあることではないかもしれません。

つづきます

     [このページのトップへ]


83. Re^4: 分散分析  青木繁伸  2001/12/22 (土) 00:32
ここで,区別しなくてはいけないのは,「人口万未満の人口規模にある市町村の課税所得を合計したものを対象数で割った平均」と「人口万未満の人口規模にある市町村の課税所得」の平均とは違うと言うことでしょう。前者は母数そのものだし,後者は厳密に言うと正しい平均ではないし,ある意味では標本平均(つまり,各標本の測定値の平均値)ということでしょう。どちらの見方を取るかによっても,扱いは異なると言うことになるのではないかと思います。

一方,明確に結論を出すことのできるのは以下のような場合。
   肺ガンの死亡率は,A県は○○,B県は△△。
   両県に統計学的有意差はあるか?
このような問題設定は,ナンセンス。
なぜなら,○○も△△も母数であり,統計学的に差があるか否かないとか言う問題ではない。
違えば違う(どれだけ違うか),同じなら同じ。

そうでない場合は,場合による??

母集団が何かというのは,難しい??? 難しいわけがない???

     [このページのトップへ]


86. Re^5: 分散分析  tanpopo  2001/12/23 (日) 14:13
ありがとうございます。非常に参考になりました。
「一応,参考までに分散分析を行って,このような結果が見られた。ただし,〜〜〜のため,分散分析を行う必要性・意義については,議論が分かれる」という文章を注意書きとしてつけるつもりです。

実験をともなう場合と異なり,地域統計分析には常にこのような問題がつきまとうのでしょうね。。。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 017 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る