No.03176 母体数が中途半端な数の場合の無作為標本抽出  【綾瀬香司】 2007/04/11(Wed) 15:02

初歩的な問題で申し訳ありませんが
(1)180人の年齢データから大きさ20の標本を抽出
(2)(1)の標本の観測データ表の作成
(3)36人の年齢データから大きさ20の標本を抽出
ができません。色々調べてみたのですが,特に(1)で乱数表から三桁を拾うと使えない数字が多すぎて大きさ20の標本ができませんでした。(2)の観測データ表の方ですが,観測データ表と標本の違いは何なのでしょうか?
レベルの低い質問で申し訳ありませんが,教えていただけると幸いです。

No.03178 Re: 母体数が中途半端な数の場合の無作為標本抽出  【青木繁伸】 2007/04/11(Wed) 17:16

> 特に(1)で乱数表から三桁を拾うと使えない数字が多すぎて

紙ベースでやっているんで しょうか。何の計算もしたくないと言うことなら,3桁を拾うしかないでしょう。当然,わざわざ拾った3桁の数を 82% も捨てなくてはなりません。捨てるのがいやだったら,色々な回避法を考えることもまるっきり意味のないことではありませんね。たとえば,5桁の数を拾って その前に[0.]をつけて小数点以下5桁の数とする。たとえば 03478 を拾ったら,0.03478 とするのです。全体で必要な標本の大きさ(今の場合は  180 ですね)にその値を掛けて1を加え,その整数部分を取ります。180 × 0.03478 + 1 = 7.2604 なので 7。これにより,7 番目のデータを抽出するのです。後は同じように。
こういうことを,乱数 表と電卓でやるのは馬鹿馬鹿しいでしょうから,コンピュータを使うことを考える方が良いでしょうね。そこでたとえば,Excel を使うことにします。乱数表から5桁の数を拾って小数を作ってということは Excel なら,rand() という関数を使うことになります。そして,整数部のみを取り出すなら =int(180*rand()+1) とすればよいわけです。

まあ,R なら,180から20取り出すなら,sample(180, 20) だけでよいことになります。
> sample(180, 20)
[1] 125 8 153 105 7 106 49 16 129 149 20 64 147 78 127 48 4 119 146 18
(2) 観測データ表と標本の違い

「観測データ表」というような用語法はあまり聞いたことがないのですが,上との関係から言えば,
「標本」とは母集団の中の何番目のものを取り出すか,というか取りだしたもの
上の例では,母集団構成要素に背番号を付けておいて,「125番,8番,153番...」を取り出すときの 125, 8, 153 ... などでしょう。
「観測データ」とは,取り出した標本が持っているデータの値で,「観測データ表」とは,それを列挙したものでしょう。たとえば取り出された20人の身長の一覧表。

(3) 36人から20人を取り出す

のがなぜできなかったのか,よく分かりませんね。R なら,
> sample(36, 20)
[1] 13 9 36 18 6 16 27 32 21 15 29 19 10 28 5 7 17 35 20 3
ですね。

(蛇足:sample(x, y) の結果は,毎回異なります)

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る