No.01379 全数調査の検定について  【竹内】 2006/10/20(Fri) 17:00

2つの比率の差の検定で質問です。取ってくる標本が全数調査だった場合,差の検定を行い,有意差があったとしても,それは 意味が無いのでしょうか?それとも,全数調査であったも,それは標本と考えて,母集団とは考えないのでしょうか?よろしくお願いします。ありがとうござい ました。

No.01380 Re: 全数調査の検定について  【青木繁伸】 2006/10/20(Fri) 17:38

> 取ってくる標本が全数調査だった場合

この表現自体,矛盾しています

全数調査ということは母集団を観察したということです

No.01383 Re: 全数調査の検定について  【竹内】 2006/10/20(Fri) 18:39

早速のご回答ありがとうございます。すいません,もう少し,質問させてください。例えば,たばこを吸う人の中で, 性別によって,死亡率が違うかを知りたいとします。仮に全数調査ができたとして,男性の死亡率がP1,女性の死亡率がP2だったとします。P1とP2につ いて差があることを言いたいために,差の検定を行うことは間違いなのでしょうか?(例があまり良く無いのですが,言い換えると,2つの母集団のある比率が 差のあることを示したい場合に,比率の差の検定を行うのは間違いでしょうか?)

No.01385 Re: 全数調査の検定について  【青木繁伸】 2006/10/20(Fri) 22:28

そもそもの前提で認識の誤りがあります

統計学は,全数を調べなくても母集団の特性についてものをいうことができるということが特徴であり,メリットであります。

全数を調べれば,物事の決着はつくのです。
男は女より○○である。
とか,
20歳代のものの平均値は□□であるが,30歳代のものは△△である。
これは,なんの誤差もない真実ですよね。

ところが,近代統計学では,母集団からの標本でものをいいます。
母集団から抽出した標本において,男は女より■■であった。
当然,全数を調査していないのですから,その結論には誤り(誤差)が含まれているでしょう。
し かし,その誤差に比べて男女の差というのが大きければ,男女に差があると言っていいではないですか。その誤差がどれくらいであるかというのは確定できない ですが,確率的には推定できるのです。相対的に,標本で得られた差は誤差よりも遙かに大きいといえるかどうかが,問題になるわけです。

ということで,ああだこうだいいましたが,

全数調べることができたら,それ以上のことを知る必要というか,それ以上の事実はないわけですね。
全数調べられない(全数調べられない場合でも)ものをいうことはできる。それが近代統計学。

そういうことです。

唯一あなたが陥っている罠は,あなたが母集団と思っている(全数調査した)と思っているものと,もう少し上位の母集団の関係ではないでしょうか。

つまり,たとえば,ある中学校の3年生全員に調査した。
  あなたは,それを,「全数調査した」と思っている。
しかし,あなたは,「全国の中学3年生についても同じ仮説が成り立つのだろうか」と考えている。
  ここで,あなたが考えている「母集団」と,本来の「母集団」に乖離がある。
あなたが考えている「中学3年生」は,全国の「中学3年生の母種団」の「標本」に過ぎない。(「過ぎない」という表現は過激かもしれないが)

No.01388 Re: 全数調査の検定について  【竹内】 2006/10/21(Sat) 00:24

大変丁寧なご回答ありがとうございました!私が考えているのは,仮に日本全国を調査したとしても,データ数が少な いようなもの・・の場合,確かに,これから得られる率は,母集団からですので,真値ではありますが,それほどデータ数がないので信頼性は低い。したがっ て,これは一種の標本と考え,仮に検定を行った場合,推定しているのは,架空の母集団という考え方は良いのかなという質問です。よろしくお願いします!

No.01390 Re: 全数調査の検定について  【青木繁伸】 2006/10/21(Sat) 00:33

> 仮に日本全国を調査したとしても,データ数が少ないようなもの
これも,表現とあなたが思っていることは大違いでは?

あなたが言っている「データ数」というのは,割合でいえば「分子」のことでしょう。
「日本全国を調査したとしても」というのが,分母です。
そして,あなたが言っていることを統計学的にいうと「母比率が小さい(低い)場合」というだけのことです(というか,あなたの記述ではそうとしか解釈できません)。
そして,それは「仮に日本全国を調査したとしても」というように,母集団≡日本全国,ということで,それはあなたが調査したものではない(あなたは日本全国を調査したものではない。もし調査したならそれは,以前のコメントで決着済み)。
「それほどデータ数がないので信頼性は低い」というのは,実際は母集団≡日本全体ではない,つまりあなたは「標本」を調査したということを意味しているのでしょう?

「母比率が低い」ということと,「信頼性が低い」というのは別ものですよ。

日本の人口が12000万で,その中で○○病の患者が2人であった。
ある国の人口が13000万で,その中で○○病の患者は3人であった。
我が国とある国の有病率に差があるか検定したい。
というようなものなんでしょうかねぇ。

検定するまでもなく,日本の有病率は2/12000万,ある国では3/13000万である。
それ以上でも以下でもない。
事実である。

抽象的な言い方ではなかなかはっきりしないので,あなたがどういう調査をして,どういうことをいいたいのかをはっきり書いた方がいいのではないでしょうか?
守秘義務とか,特許とか,先端的研究に関わる場合は,ぼやかしてもいいですけど,統計学の本質に関わる部分はぼやかしたら,適切な解答は得られないものと思ってください。

No.01392 Re: 全数調査の検定について  【竹内】 2006/10/21(Sat) 01:14

深夜に及ぶ回答で申し訳ありません。。もう少し,ぼやかして質問させてください。たとえば,日本にある病気の人が 全部で500人いて,そのうち,死亡したのが20人。すると,その病気の死亡率は4%。ある国でのその病気の人は全部で1000人いて,そのうち死亡した のが,50人。すると,その国ではその病気での死亡率は5%。この4%と5%について差の検定をすることは,意味のあることなのでしょうか?

No.01393 Re: 全数調査の検定について  【青木繁伸】 2006/10/21(Sat) 01:30

致死率と死亡率を混同しているでしょう。
致死率は,病気にかかった人の死亡率ですから,分母になっている 「病気にかかっている人」というのが母集団になるのでしょうが,その母集団は確定していますか?というのがわかりにくければ,たとえば日本全国でその病気 にかかっている人数は確定していますか?たいていの場合は,幾つかの(全部じゃないですよね)病院に受診して確定診断された人数でしょう?(その意味では 標本ですよね。しかも,かなり偏り・バイアスのある標本)。そして,そのうちで死亡した人が分子ですよね。
まあ,そういう意味では確かに「*偏*り*の*あ*る*割合」の差を比較することになるわけでしょう。
し かし,このようなものも,標本あるいは標本値と見るのではなくて「母数」と見る方がよいのではないかと思います。すなわち,「不正確な母数」とみるわけで す。「不正確」の度合いは,対象によって実に様々,ほとんど信頼できないものから十分信頼に足るものまで,千差万別では?

No.01394 Re: 全数調査の検定について  【竹内】 2006/10/21(Sat) 02:21

ここまでお付き合いして頂き,本当にありがとうございました。私が扱っているのは,実は,交通事故のデータでし て,先生の質問にある「人数は確定しているか?」に対してはYESだと思います。交通事故のデータは全て調査されていますが(怪我をすれば交通事故となり ます),それを使って,よく比率の差の検定が行われていて,本当に良いのかなと疑問を持ち,質問させていただきました。見ず知らずの私に丁寧にお答えいた だき,本当にありまがとうございました。もう少し悩んでみます!もう寝ましょう!

No.01397 Re: 全数調査の検定について  【ひの】 2006/10/21(Sat) 11:30

>交通事故のデータは全て調査されていますが(怪我をすれば交通事故となります),

 そん なことはありません(交通事故の定義によりますが)。交通事故(人身事故)の当事者たちがそのように申告しなければお役所は交通事故(人身事故)として計 上せず,記録もしません。私自身の経験から。双方の不注意による出会い頭の衝突で互いに怪我(私は肩鎖関節脱臼)をしましたが,人身事故として申告すると 双方とも免停になるので警察では物損事故として処理してもらいました。免許証の提示が求められただけでそれ以上は何も聞かれませんでした。警察もその方が 仕事が減って楽なので歓迎なのでしょう。警察のそのときの対応から,こういうこと(実際には怪我をしていても人身事故として取り扱わないケース)はよくあ ることらしいと感じました。

 このように,警察の交通事故の統計は「全数データ」ではありません。人身事故として記録すると当事者も警察も不利益をこうむるような場合には事実と異なる記録がなされるというのは普通に行われていると思います。

No.01398 Re: 全数調査の検定について  【竹内】 2006/10/21(Sat) 12:11

ひのさん,貴重なコメントありがとうございます。まさにその通りなんです。この様なデータは,仮に,表面的には全 数調査されていても,かなりの実際に上がってこないデータがあります(物損事故件数は人身事故件数の数倍あるそうです)。このようなデータを使う場合,標 本として扱うという考え方もありそうです。しかし,かなりのバイアスを含んだ標本であり(人身事故として登録されない人身事故がある),ともて難しいで す。だんだん,頭の中が整理されてきました。もう少し,自分で考えてみます。

No.01399 Re: 全数調査の検定について  【にゃんちゅう】 2006/10/21(Sat) 16:40

なんか微妙な方向に進んでいるような。
国勢調査は厳密な意味では全数ではないですが,みなし全数なのではないでしょうか。しかし,去年のように回収率が減ってくると,そう見なしていいかという問題はあるでしょう。

交通事故のデータが全数から特定のバイアスがかかっているから標本というのはどうなんでしょう。非標本誤差は統計学では処理しきれない問題だから,標本と扱っていいかどうか問題がありそうです。

このあたりきちんと論じているものがあるのでしょうか?

No.01417 Re: 全数調査の検定について  【竹内】 2006/10/23(Mon) 11:56

にゃんちゅうさん,コメントありがとうございました。問題,課題が整理されてきたと思います。これが大事です。がんばります,ありがとうございました。

No.01418 Re: 全数調査の検定について  【韮澤】 2006/10/23(Mon) 12:26

やはり,母集団の考え方が違う様に思います。統計の目的は,一般に,過去に起きた事を分析するのが目的ではなく, その結果から,将来起きることも含めて,結論を出す場合が多いと思います。例えば,「男の方が交通事故を起こしやすい」という結論を導くとすれば,母集団 は,過去,交通事故を起こした人ではなくて,今後,起こす人を(しかも,まだ生まれてもいない人をも)含めた,計測不能な母集団に対して,判断したいので はないでょうか?
検定したい目的に沿って,どうあるべきか考えてみるべきでしょう。

● 「統計学関連なんでもあり」の過去ログ--- 039 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る