★ サンプルサイズについて ★

 387 サンプルサイズについて  ブライアン  2000/02/14 (月) 10:48
  408 Re: サンプルサイズについて  マンボウ  2000/02/16 (水) 00:07
  389 Re: サンプルサイズについて  出口慎二  2000/02/14 (月) 12:45
   390 Re^2: サンプルサイズについて  ブライアン  2000/02/14 (月) 13:22
    391 Re^3: サンプルサイズについて  出口慎二  2000/02/14 (月) 13:46
     395 Re^4: サンプルサイズについて  ブライアン  2000/02/14 (月) 16:56
      398 Re^5: サンプルサイズについて  出口慎二  2000/02/14 (月) 22:42
       405 Re^6: サンプルサイズについて  ブライアン  2000/02/15 (火) 20:15
        409 Re^7: サンプルサイズについて  出口慎二  2000/02/16 (水) 02:10
         415 Re^8: サンプルサイズについて  ブライアン  2000/02/16 (水) 15:40
          419 Re^9: サンプルサイズについて  マンボウ  2000/02/16 (水) 23:42
          418 Re^9: サンプルサイズについて  出口慎二  2000/02/16 (水) 22:35
       404 Re^6: サンプルサイズについて  勉強中  2000/02/15 (火) 16:59
        407 Re^7: サンプルサイズについて  出口慎二  2000/02/15 (火) 22:14
         413 Re^8: サンプルサイズについて  勉強中  2000/02/16 (水) 11:37
          414 Re^9: サンプルサイズについて  出口慎二  2000/02/16 (水) 12:42


387. サンプルサイズについて  ブライアン  2000/02/14 (月) 10:48
自分の行っている研究で適切なサンプルサイズを見積もるために,「医学的研究のデザイン」という本を見て勉強しているものです。
その中に標準化効果量というものがありました。おおまかな理屈は分かるのですが,巻末の付録を見ると,この値は0.1〜1.0の値しか表示されていませんでした。
標準化効果量=効果量/(結果因子の)標準偏差と書いてあったのですが,これが1.0を越えることはないのでしょうか?
また1.0を越えた場合はどのようにサンプルサイズを見積もれば良いのでしょうか?
お分かりの方がいらっしゃいましたらぜひ教えて下さい。

     [このページのトップへ]


408. Re: サンプルサイズについて  マンボウ  2000/02/16 (水) 00:07
サンプルサイズを求める手段については,ここでも何回か取り上げられましたね。

フリーウエアの G*power というのが優れものです。

堀さんの
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc003/188.html#192
などをご覧ください。

日本語マニュアルもあります。
http://www.nuis.ac.jp/~mat/fpr/gpowermanual.html

     [このページのトップへ]


389. Re: サンプルサイズについて  出口慎二  2000/02/14 (月) 12:45
> 標準化効果量=効果量/(結果因子の)標準偏差と書いてあったのですが,これが1.0を越えることはないのでしょうか?

「効果量」とは何でしょうか?

> また1.0を越えた場合はどのようにサンプルサイズを見積もれば良いのでしょうか?

「標準化効果量」をどう使ってサンプルサイズを計算する方法なのですか?

> 自分の行っている研究で適切なサンプルサイズを見積もるために,…

通常ある,誤差率(標準誤差の変動係数,という言い方で良いのでしょうか?)によるサンプルサイズの決定とは違うものなのでしょうか.なんとなくこれと同じようなことをしているようにも感じるのですが.

     [このページのトップへ]


390. Re^2: サンプルサイズについて  ブライアン  2000/02/14 (月) 13:22
> 「効果量」とは何でしょうか?
研究の中でとらえたいと思う関連(効果)の強さを仮定する時にでてくるものです。
例えば,ある薬Aを飲めば癌の発生率が10%減少するとします。この10%減少のことを効果量と呼びます。

> 「標準化効果量」をどう使ってサンプルサイズを計算する方法なのですか?
残念ながら,具体的な計算方法は分かりません。
ただ,本の中に早見表のようなものが載ってたので,それを見ただけです。

> 通常ある,誤差率(標準誤差の変動係数,という言い方で良いのでしょうか?)によるサンプルサイズの決定とは違うものなのでしょうか.なんとなくこれと同じようなことをしているようにも感じるのですが.
あまり詳しくは分かりませんが,おそらく標準誤差を利用して算出しているものと思われます。(不勉強で申し訳ありません)

     [このページのトップへ]


391. Re^3: サンプルサイズについて  出口慎二  2000/02/14 (月) 13:46
> > 通常ある,誤差率(標準誤差の変動係数,という言い方で良いのでしょうか?)によるサンプルサイズの決定とは違うものなのでしょうか.なんとなくこれと同じようなことをしているようにも感じるのですが.
> あまり詳しくは分かりませんが,おそらく標準誤差を利用して算出しているものと思われます。(不勉強で申し訳ありません)

もし通常の方法で問題なさそうでしたら,予想される測定値の分布形についての情報が必要です.

例えば,比率の形で与えられるデータでしたら,2項分布になります.そうでなければ,大雑把に,正規分布か,楕円形の分布(かまぼこ型)か,2等辺三角形のような分布か,直角三角形のような分布(その場合,90度の角は左に来るか,右に来るのか),矩形の分布か,といったことです.分布形により,同じ精度を得る為に必要なサンプルサイズは異なります.

あとは,必要な精度ですね.標準誤差が,平均値に対して何パーセント程度に収まっていて欲しいか,という値です.社会調査などでは5%とするのが相場のようですが.

     [このページのトップへ]


395. Re^4: サンプルサイズについて  ブライアン  2000/02/14 (月) 16:56
> もし通常の方法で問題なさそうでしたら,予想される測定値の分布形についての情報が必要です.
> あとは,必要な精度ですね.標準誤差が,平均値に対して何パーセント程度に収まっていて欲しいか,という値です.社会調査などでは5%とするのが相場のようですが.

測定値の分布形は正規分布です。
標準誤差は平均値に対して5%程度の精度で考えています。
あと,いいわすれていましたが,実験は前後の比較をおこない,paired t-testを用います。

     [このページのトップへ]


398. Re^5: サンプルサイズについて  出口慎二  2000/02/14 (月) 22:42
> 測定値の分布形は正規分布です。
> 標準誤差は平均値に対して5%程度の精度で考えています。

0.05=se/mean
se=sd/sqrt(n)より,
0.05=(sd/sqrt(n))*(1/mean)
0.05*sqrt(n)=sd/mean
sqrt(n)=(sd/mean)/0.05
従って,
n=((sd/mean)/0.05)^2
ここで,変動係数cv=(sd/mean)と置くと,
n=(cv/0.05)^2  … (I)

正規分布の場合,mean-3*SDからmean+3*sdの間にほぼ全てのデータが収まる.
従って,大きく次のように考えられる.
両側の0.3%を無視した場合,最小値を0,最大値を6とすると,平均は3,標準偏差は1になる.
だとすると,正規分布の場合,変動係数cv=1/3とできる.
(I)式に,cv=1/3=(near-equal)=0.33を代入すると,
n=(0.33/0.05)^2=6.6^2=(near-equal)=44

考え方は上記の通り.必要に応じて応用してください.

     [このページのトップへ]


405. Re^6: サンプルサイズについて  ブライアン  2000/02/15 (火) 20:15
非常に分かりやすい説明でだいたい理解できました。ありがとうございます。
ちなみに,あとで調べてみたら以下のような方法が本に載ってました。
サンプルサイズ(N)=[(1/q1+1/q2)S2(Zα+Zβ)2]/E2

q1:群1に属する対象者の比率
q2:群2に属する対象者の比率
S:結果因子の標準偏差
Zα:αの標準正規偏差
Zβ:βの標準正規偏差
E:効果量
この中でS2,E2などの2は二乗を表します。うまく表示できず申し訳ありません。

     [このページのトップへ]


409. Re^7: サンプルサイズについて  出口慎二  2000/02/16 (水) 02:10
> サンプルサイズ(N)=[(1/q1+1/q2)S2(Zα+Zβ)2]/E2
>
> q1:群1に属する対象者の比率
> q2:群2に属する対象者の比率
> S:結果因子の標準偏差
> Zα:αの標準正規偏差
> Zβ:βの標準正規偏差
> E:効果量
> この中でS2,E2などの2は二乗を表します。

これは,等分散の場合の対応のない2群の平均値の差のt検定(片側)のように見えます.(Zalpha+Zbeta)の部分が分からないのですが,対応のある場合について,前に書いたように考えると,

E=Zalpha*SE(尚,両側検定ならalphaの部分がalpha/2)
SE=SD/sqrt(n)より,(このSDは,対応のあるデータの差dについてのSD)
E=Zalpha*SD/sqrt(n)
sqrt(n)=Zalpha*SD/E
従って,
n=(Zalpha*SD/E)^2
並べ替えると,
n=(SD^2*Zalpha^2)/E^2

上記を参考に考えると,対応のあるデータの場合,2変数のように見えて,実は差のデータ1変数しか見ないわけですので,1行目の式の,
>(1/q1+1/q2)
の部分は不要に思えるのですが,いかがでしょう.

もっとも,(Zalpha+Zbeta)の部分が分かっていないので,根本的に違うかもしれませんが.

     [このページのトップへ]


415. Re^8: サンプルサイズについて  ブライアン  2000/02/16 (水) 15:40
> サンプルサイズ(N)=[(1/q1+1/q2)S2(Zα+Zβ)2]/E2
> 1行目の式の,(1/q1+1/q2)の部分は不要に思えるのですが,いかがでしょう.
>
> もっとも,(Zalpha+Zbeta)の部分が分かっていないので,根本的に違うかもしれませんが.

ご指摘ありがとうございます。
実際には(1/q1+1/q2)の部分はq1=q2=1となると思います。
あと,(Zα+Zβ)はαエラー(両側)=0.05,βエラー=0.20とすると
Zα+Zβ=1.96+0.84=2.8となります。
また,この式の中で,Sは対応のある場合,結果因子の変化量の標準偏差という
解釈になると思うのですが,いかがでしょう。

     [このページのトップへ]


419. Re^9: サンプルサイズについて  マンボウ  2000/02/16 (水) 23:42
> また,この式の中で,Sは対応のある場合,結果因子の変化量の標準偏差という解釈になると思うのですが,いかがでしょう。

その本にはどのように書いてあるのでしょうか?
あの式を,対応のあるt検定のときに使ってもいいのでしょうか?

G*power のマニュアルをちょっと読んだ限りでは,対応のある場合とない場合ではかなり違いがあるように書いてありますけどね。
http://www.psychologie.uni-trier.de:8000/projects/gpower/reference_manual_06.html

     [このページのトップへ]


418. Re^9: サンプルサイズについて  出口慎二  2000/02/16 (水) 22:35
> また,この式の中で,Sは対応のある場合,結果因子の変化量の標準偏差という解釈になると思うのですが,いかがでしょう。

そうだと思います.

     [このページのトップへ]


404. Re^6: サンプルサイズについて  勉強中  2000/02/15 (火) 16:59
 計算方法に興味があるのですが,この方法の適当な参考書を教えていただけないでしょうか?

> 0.05=se/mean
> se=sd/sqrt(n)より,
> 0.05=(sd/sqrt(n))*(1/mean)
> 0.05*sqrt(n)=sd/mean
> sqrt(n)=(sd/mean)/0.05
> 従って,
> n=((sd/mean)/0.05)^2
> ここで,変動係数cv=(sd/mean)と置くと,
> n=(cv/0.05)^2  … (I)
>
> 正規分布の場合,mean-3*SDからmean+3*sdの間にほぼ全てのデータが収まる.
> 従って,大きく次のように考えられる.
> 両側の0.3%を無視した場合,最小値を0,最大値を6とすると,平均は3,標準偏差は1になる.
> だとすると,正規分布の場合,変動係数cv=1/3とできる.
> (I)式に,cv=1/3=(near-equal)=0.33を代入すると,
> n=(0.33/0.05)^2=6.6^2=(near-equal)=44
>
> 考え方は上記の通り.必要に応じて応用してください.

     [このページのトップへ]


407. Re^7: サンプルサイズについて  出口慎二  2000/02/15 (火) 22:14
>  計算方法に興味があるのですが,この方法の適当な参考書を教えていただけないでしょうか?

とのことで,ちょっと探してみたのですが,すみません,見当たりません.尚,以前こうした考え方を本で見た際にも,そこには,

> > n=(cv/0.05)^2  … (I)

の,"0.05"の部分が,(目標とする誤差率)を表す記号で表された一般式と,いくつかの分布形における変動係数の一覧しか記載されていなかったように記憶しています.

多分,標本調査法方面の本を探して頂くと見つかるのでは,と思うのですが.

しかし,今探してる最中に見てみた2冊の本では,いずれも,目標精度は絶対的な値,つまり,平均値に対して…といった相対的な値(誤差「率」)ではなく,(平均値)+(いくつ),の「いくつ」という値が具体的に想定できる場合(分散もしくは標準偏差そのままの値が既知の場合)のものでした.

あまり「通常ある」方法ではなかったのかもしれません.

     [このページのトップへ]


413. Re^8: サンプルサイズについて  勉強中  2000/02/16 (水) 11:37
> > > n=(cv/0.05)^2  … (I)

 詳しくは知りませんが,おそらく目標精度の他に信頼度も必要であろうと思います.

 もし,95%の信頼度を仮定するならば,すくなくとも上の計算値の4倍程度は必要になるのではないかと思います.上の計算が44ならば,160-170程度でしょうか.

     [このページのトップへ]


414. Re^9: サンプルサイズについて  出口慎二  2000/02/16 (水) 12:42
>  詳しくは知りませんが,おそらく目標精度の他に信頼度も必要であろうと思います.
>
>  もし,95%の信頼度を仮定するならば,…

というものとは考え方が異なっています.この点が「通常ある」ではなかったのだと思います.混乱を招いて申し訳ありません.見ての通りで,標準誤差が平均に対して5%,ということを考える為の計算です.

例えば,事前に十分な情報があり,Mean=100で,これの95%信頼区間が+-5の範囲に収まるようにしたい,とするならば,私の書いた考え方だと,1.96*SEが5,つまり,1.96*SE/Mean が 5/100=0.05 になると考えられますので,

> 0.05=se/mean

の部分を,

0.05=1.96*se/mean

として計算します.従って,

> n=((sd/mean)/0.05)^2



n=(1.96*(sd/mean)/0.05)^2

となり,(I)式は,

n=1.96^2*(cv/0.05)^2

ご指摘のとおり,1.96^2倍,つまり,ほぼ4倍のn数が求まります.

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 006 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る