No.10332 ブートストラップ標本の大きさについて  【波音】 2009/07/10(Fri) 01:01

ブートストラップ標本を得るとき,ブートストラップ標本の大きさは抽出元となる標本の大きさよりも大きくなってはいけないのでしょうか?

n = 100の標本から,n' = 200となるような(n < n'となるような)ブートストラップ標本を得ることはご法度なのでしょうか,ということです。

それからもう1つ教えていただきたいのですが,http://books.google.co.jp/books?id=j2UN5xDMbIsC&printsec=frontcover&dq=randomization+bootstrap+and+monte+carlo+methods+in+biology&as_brr=3&ei=hw9WSpDSA4_SlAT4ktiRBwの44ページに「mean of the 1000 bootstrap estimates of σ is 0.97.」とあります。55ページのTable 3.1を見るとたしかにBootstrap mean 0.97とあります。

こ れはmean(0.46, 1.33,0.54, ..., 1.07, 0.87)といったように,1000個のブートストラップ標本の標準偏差の平均値ということでよろしいでしょうか。そして表中のBootstrap SD = 0.25というのが,その標準偏差(sd(0.46, 1.33,0.54, ..., 1.07, 0.87))ということでしょうか。

No.10337 Re: ブートストラップ標本の大きさについて  【ひの】 2009/07/10(Fri) 18:04

>これはmean(0.46, 1.33,0.54, ..., 1.07, 0.87)といったように,1000個のブートストラップ標本の標準偏差の平均値ということでよろしいでしょうか。そして表中のBootstrap SD = 0.25というのが,その標準偏差(sd(0.46, 1.33,0.54, ..., 1.07, 0.87))ということでしょうか。

その解釈でよいと思います。

No.10339 Re: ブートストラップ標本の大きさについて  【波音】 2009/07/10(Fri) 18:52

回答ありがとうございます。ブートストラップに関する日本語の書籍が少ないので,洋書にも頼らなければいけないのですが,やはり英語は好きじゃないので(^_^;)骨が折れます。

(数式やグラフがあると英文を読む助けになりますが,数式自体が高度になってくると手がつけられない・・・)

No.10353 Re: ブートストラップ標本の大きさについて  【韮澤】 2009/07/13(Mon) 08:58

私も理論を完全に理解しているとは言い難いので,御法度かどうかの答えに正しい答えになっていませんが・・・

前に母集団をサイコロの目(1〜6の整数値の一様分布)に対してブートストラップをやってみた事があります。これは,元データが6個と見なせますが,サンプルサイズ n=20などで実行しても,一応の答えは出ましたから,御法度と言うほどではない様な気がします。

た だ,ブートストラップ法は,中心極限定理によって,母集団分布形状に関わりなく分散が推定できるのが重要なメリットです。そう考えると,中心極限定理をき ちんと発揮できる様に,サンプルサイズよりもサンプルの数(抜き取り回数)を大きくする方が重要だと思いますから,計算量の都合も考えると,サンプルサイ ズはむしろ小さい方が望ましいのではないでしょうか? 正確な誤差の理論計算は手に負えませんが,上記の実験での経験では,n=20,抜き取り回数1万回で,分散の誤差は1%未満でしたから,n=20程度で十 分かと思います。

No.10354 Re: ブートストラップ標本の大きさについて  【波音】 2009/07/13(Mon) 10:25

なるほど,中心極限定理が生じることを考えると,たしかにサンプルサイズよりは繰り返し抽出の数を多くした方がよいだろうと直感的にも理解できます。

実際にやるときには,標本の大きさと標本の数をいくつかの組合せの下で行ってみるとよいということですね。

● 「統計学関連なんでもあり」の過去ログ--- 042 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る