★ 無作為抽出 ★

 27 無作為抽出  srs  2001/08/10 (金) 09:15
  28 Re: 無作為抽出  なかはら  2001/08/10 (金) 10:10
   30 Re^2: 無作為抽出  srs  2001/08/10 (金) 10:44
    33 Re^3: 無作為抽出  なかはら  2001/08/10 (金) 11:43
   29 Re^2: 無作為抽出  なかはら  2001/08/10 (金) 10:17
    39 Re^3: 無作為抽出  srs  2001/08/10 (金) 15:51
    31 Re^3: 無作為抽出  srs  2001/08/10 (金) 10:53


27. 無作為抽出  srs  2001/08/10 (金) 09:15
単純無作為抽出は多くの教科書で以下のように説明されています.
「あらゆる可能なk個の標本のうちどの標本も等確率 1/k で抽出する方法」たとえば有限母集団サイズ N=4,標本サイズ n=2 とすると,
Nからnを同時に抽出するやりかたは,

(1) NCn = N! / n!(N-n)! = 4! / 2!(4-2)! = 6 = k

なので.単純無作為抽出とはこの6標本のどれも等確率 1/6
ぼくは,あらゆる可能な標本は,

(2) N^n = 4~2 = 16

種類であり.「どの標本の要素」も等確率 1/16 で抽出するのが単純無作為抽出だと思っていました.(1)の場合,「同時に2個」を抽出する方法はいろいろありますが,「同時」を「重複を許さない」という意味にしたときは非復元抽出になります.4個から1個抽出するときは1/4の確率で,2個目は1/3の確率で抽出され,等確率ではない.(2)はいつも1/4の等確率です.これが「等確率で抽出する単純無作為抽出」だと思ってたけど違う.

標本の要素は(1)のように非復元抽出で,標本の要素が等確率で抽出されなくても,単純無作為抽出という理解でいいのでしょうか.このへん詳細に書いた

     [このページのトップへ]


28. Re: 無作為抽出  なかはら  2001/08/10 (金) 10:10
> 単純無作為抽出は多くの教科書で以下のように説明されています.
> 「あらゆる可能なk個の標本のうちどの標本も等確率 1/k で抽出する方法」たとえば有限母集団サイズ N=4,標本サイズ n=2 とすると,
> Nからnを同時に抽出するやりかたは,
>
> (1) NCn = N! / n!(N-n)! = 4! / 2!(4-2)! = 6 = k
>
> なので.単純無作為抽出とはこの6標本のどれも等確率 1/6

1/6 ではないのではないでしょうか?

A,B,C,D さんがいて,このなかから2人を選ぶのは
AB,AC,AD,BC,BD,CD の6通りですが,A さんが選ばれるのはこのうちのAB,AC,AD の3通りだから 1/2 の確率です(B,C,D さんも同じく 1/2 の確率で選ばれます)。この 1/2 は(2人選ぶ)/(4人から)=1/2 でしょう。

上の4人から3人選ぶときは,
ABC,ABD,ACD,BCD の4通りで,B さんが選ばれるのはそのうちの3通りで 3/4 です。これも,(3人選ぶ)/(4人から)=3/4 でしょう?

これはこういう風に考えるといいのではないでしょうか?
N 人の人がくじを引く。当たりくじは n 本。
さて,各人の当たりくじを引く確率は?
答え:n/N 非常に明解(^_^;)

当たりくじを引いた人が調査対象になります。

     [このページのトップへ]


30. Re^2: 無作為抽出  srs  2001/08/10 (金) 10:44
ちょっと書き方も不十分でした.

> A,B,C,D さんがいて,このなかから2人を選ぶのは
> AB,AC,AD,BC,BD,CD の6通りですが,

AA,BB,CC,DDという標本は考えないのでしょうか?.金魚すくいのように「同時に」抽出する場合を前提にするからですか?.ABとBAは同じ標本なので納得できますが.

人間の抽出では,金魚すくいでなく(金魚すくいや,よくかきまぜた玉の箱から一握り--は無作為抽出ではない),1人ずつ抽出しますから乱数を使いますが,非復元抽出では,1番目の人は1/Nの確率で抽出され,2番目の人は1/N-1の確率で抽出され・・・となります.この非復元抽出の時,標本の要素は「等確率」で抽出されていると考えていいのでしょうか?.
抽出前にすべての人が1/Nの確率で抽出される状態にあるだけですよねえ.

     [このページのトップへ]


33. Re^3: 無作為抽出  なかはら  2001/08/10 (金) 11:43
スネデッカー・コクランでは,「標本が母集団のごく小部分である場合これら(重複を許す無作為抽出と重複を許さぬ無作為抽出のこと)2つの方法は実際上は同じである。というのは同じものが2回以上標本に現れる確率は無視できるほど小さいから。ところで,本書の全体にわたってこれら2つの方法は区別しないことにする。」と書いてあります。

     [このページのトップへ]


29. Re^2: 無作為抽出  なかはら  2001/08/10 (金) 10:17
よく読んでみたら,結果としての標本(セット)が等確率だといっているのですね。
でも,前の発言のようにして標本(対象)を選んだら,結果として,どの標本(セット)も等確率になりますね。

ケンドールの統計学用語事典では,
無作為抽出法:可能な標本が一定の定められた確率で選出されるよう,抽出単位を選ぶ方法。
と書いてありますね。
最初の「標本」は標本のセットのこと,「抽出単位」は母集団の構成要因ですね。

     [このページのトップへ]


39. Re^3: 無作為抽出  srs  2001/08/10 (金) 15:51
> ケンドールの統計学用語事典では,
> 無作為抽出法:可能な標本が一定の定められた確率で選出されるよう,抽出単位を選ぶ方法。
> と書いてありますね。

ありがとうございます.僕も本棚にあった辞典を見てみました.

Simple random sampling :
A form of sampling design in which n distinct units are selected from the N units in the population in such a way that every possible combination of n units is equally likely to be the sample selected .With this type of sampling design the probability that the t th population unit is included in the sample is πi = n/N , so that the inclusion probability is the same for each unit . Designs other than this one may also give each unit equal probability of being included, but obly here does each possible sample of n units have the same probability. [ SMR Chapter 8. ]

Everitt (1998) The Cambridge Dictionary of Statistics .


distinct units って「重複なし」(非復元)が前提ということでしょうかね.
every possible combination of n units とも言っているし・・・.

     [このページのトップへ]


31. Re^3: 無作為抽出  srs  2001/08/10 (金) 10:53
> よく読んでみたら,結果としての標本(セット)が等確率だといっているのですね。
> でも,前の発言のようにして標本(対象)を選んだら,結果として,どの標本(セット)も等確率になりますね。

はい.標本の等確率は明確で疑念の余地はありません.

> ケンドールの統計学用語事典では,
> 無作為抽出法:可能な標本が一定の定められた確率で選出されるよう,抽出単位を選ぶ方法。
> と書いてありますね。
> 最初の「標本」は標本のセットのこと,「抽出単位」は母集団の構成要因ですね。

では,標本の要素(抽出単位=母集団の構成要因)はどうでしょう?.サイズをnに固定した後で,要素を1つずつ抽出するときの「等確率」は.

帰着するのは復元抽出と非復元抽出ということだったかな?.
両者で「可能な標本」の数は(nを固定したもとで)異なる.
しかし,両者のいずれでも確かに,標本の等確率は成立するなあ.

なるほど,単純無作為抽出とは,単に「標本の等確率」で定義されるんですね!
標本の要素は復元,非復元2通りある--ということか.

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 015 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る