★ 総数の10%をサンプルとして,全体の結果を推測することの精度は? ★
26 総数の10%をサンプルとして,全体の結果を推測することの精度は? SHO 2000/01/01 (土) 01:43
29 Re: 総数の10%をサンプルとして,全体の結果を推測することの精度は? マンボウ 2000/01/01 (土) 22:09
31 1人が重複署名を何人分したか??? SHO 2000/01/01 (土) 23:30
39 Re: 1人が重複署名を何人分したか??? マンボウ 2000/01/02 (日) 22:56
32 Re: 1人が重複署名を何人分したか??? 堀 啓造 2000/01/02 (日) 00:20
33 Re^2: 1人が重複署名を何人分したか?コメント続き 堀 啓造 2000/01/02 (日) 00:21
35 Re^3: 1人が重複署名を何人分したか?コメント続き 堀 啓造 2000/01/02 (日) 01:10
42 Re^4: 1人が重複署名を何人分したか?コメント続き 堀 啓造 2000/01/03 (月) 09:41
26. 総数の10%をサンプルとして,全体の結果を推測することの精度は? SHO 2000/01/01 (土) 01:43 |
署名数の推定重複率を調べるために以下のような方法を採りました。
果たして,その信頼度はどの程度のものになるでしょうか?
ご教示いただければ幸いです。
>署名総数は335,858人分だった。
>サンプルとして約一割に当たる35,457人分の署名をコンピューターで精査したところ,10.3%に当たる3,652人分の署名が重複していた。
>このため,署名総数から推定重複率10.3%を差し引き,署名総数を算出した。
http://www.topics.or.jp/daijyuzeki/news991210.html#1
|
[このページのトップへ]
[このページのトップへ]
31. 1人が重複署名を何人分したか??? SHO 2000/01/01 (土) 23:30 |
早速のレスありがとうございます。
実は,この問題では以下のような指摘がありまして???状態に陥っています。
>20人分の署名のうち,重複率が10%だったとします。
>つまり,2人分の署名が無効ということですから,以下の二つのパターンが考えられます。
>(1) 1人が3人分の署名,あとは重複なし
>(2) 2人が2人分の署名,あとは重複なし
>ここから,サンプルとして1割に当たる2人分の署名を調べると,その無作為に選んだサンプルから得られる推定重複率は,
>(1) の場合,
> 3/190 の確率で,50% (2人分の署名が同一),
>187/190 の確率で, 0%
>(2) の場合,
> 1/ 95 の確率で,50% ,
> 94/ 95 の確率で, 0%
>となります (簡単な組み合わせの計算ですので,ご確認ください)。
>(2) よりも (1) の方が期待値は大きいのですが,それでも 1% にも及ばず,本当の重複率 (10%) には遠く及びません。
|
[このページのトップへ]
39. Re: 1人が重複署名を何人分したか??? マンボウ 2000/01/02 (日) 22:56 |
この問題を統計学や数学の問題として解くのは面白いかもしれないですが,もともとは住民の意見を政治に反映するための署名活動なわけですから,標本を抽出して重複率を推定するなどということは論外なのでは?
数万もの署名を集めて何処そこへ提出したとかいうニュースはよく聞くのですが,重複や偽の署名を除いたものだけを提出したとか言う話はついぞ聞いたことがないですね。
受け取る側もいいかげんなのだろうし,受け取りたくないと思うと何とでも難癖が付けられるということもあるんでしょうね。
統計学とそれてしまった。
だけど,統計学はどのようなときに使うのかということではつながりがあるかな。
|
[このページのトップへ]
32. Re: 1人が重複署名を何人分したか??? 堀 啓造 2000/01/02 (日) 00:20 |
> >1% にも及ばず,本当の重複率 (10%) には遠く及びません。
この指摘が正しいでしょう。
つまり,1割を抽出した場合,残り9割との重複をとっていないですから,重複率の正しい推定ではないのです。
すべての人が2回署名している場合。おそらくこれを50%の重複率と計算するものと思います。1割を正しくサンプリングすれば,重複率の期待値は5%でしかありません。5%を見て,50%を推測するのが,今回の場合です。このような場合を想定すると10%は異常に高い数字です。
|
[このページのトップへ]
33. Re^2: 1人が重複署名を何人分したか?コメント続き 堀 啓造 2000/01/02 (日) 00:21 |
続き
今回の母集団は署名全体です。それを正しくサンプリングして,数値を出しているでしょうか?おそらくそうではないものと思います。特定の地域でとったものだけで調べていたら,前提がまったく違います。
ブロック化されていて,他の地域とは重なりはないことを前提にすれば計算方法は違ってきます。ただし,その場合もブロックのサンプリングの問題があります。それをこなしているとすれば,通常の調査法のサンプリング誤差を適用することも可能かと思います。すると,精度はきわめて高いことになります。サンプル以外との重なりがない(もしくはあってもきわめて小さい)という前提がないと調査法のサンプリング誤差は適用できません。なお,調査法のサンプリング誤差を計算する方法はたいていの調査法の本にあります。
西平重喜『統計調査法 改訂版』培風館 p109-110
|
[このページのトップへ]
35. Re^3: 1人が重複署名を何人分したか?コメント続き 堀 啓造 2000/01/02 (日) 01:10 |
結局,どういう1割をとるようにサンプリングしたのかを明らかにしないと,意味のない議論になりそうです。
ちなみに,全くランダムなサンプリングをしていないのは明らかです。
この場合は10%を越えることはない。
|
[このページのトップへ]
42. Re^4: 1人が重複署名を何人分したか?コメント続き 堀 啓造 2000/01/03 (月) 09:41 |
解決法は2つ考えられます。
(1)新たにランダムサンプリングをする。これはコストからいって,普通とる方法ではないです。
(2)コンピュータに打ち込んでいるはずの1万人強のデータから,同じサンプリング法(いいかげんであったとしても同じようなシステムのいい加減さにする)でサンプリングして,1割とったときの%の挙動を調べる。もちろん,何回もやる必要がありますが,データの大きさからいって,100回もする必要はないでしょう。数回でおおよその数値をだせるでしょう。しかし,1回は危険です。
そこから,推論するのです。このとき,前に挙げた2つのタイプ
(a)まったくランダムに選んだ
(b)きっちりと,ブロック化して選んだ
の理論数値の間になるはずですから,そこからどう外挿するか考える必要があります。
(a)のほうは,基本的に13%が期待値です。
(b)のほうは,どれだけの繰り返しがあったかによるチェックをしてませんが,サンプリングした結果でてくるのおそらく1.3%になります。
同じいい加減なサンプリング法を再現するのが難しいかもしれません。
ま,そこを明らかにするなら,もうちょっとつっこんだ示唆を与えることができるかもしれません。 |
[このページのトップへ]
● 「統計学関連なんでもあり」の過去ログ--- 005 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る