No.13874 層別サンプリングについて  【初心者】 2010/11/27(Sat) 08:57

少々長くなってしまい恐縮ですが,層別サンプリングについて質問させて頂けないでしょうか。研究テーマとしてある地方を対 称に,医療機関に通っている「ある疾病の患者の治癒の速度」と,「その患者の住む市の平均年収」との関係を調べるとします。各医療機関にアンケート用紙を 送り,そこに通う患者に任意で回答をもらうという方式で,上記の2種類のデータを取得します。

しかし全ての医療機関に調査票を送付するの は困難であるため,サンプリングをして対象医療機関を減らすことにしたのですが,以下の問題がありました。その県の医療機関の総数のうち,10%が病院で 残り90%が診療所なのですが,総患者数の半分が病院へ,残りの半数が診療所で治療を受けています。したがって普通のサンプリングを用いた場合,患者の半 数が病院で治療を受けているにも関わらず病院の総数はわずか1割であるため,これらの患者サンプルが不当に少なくなってしまう恐れがありました。特に病院 の方が診療所よりも医療機関としての質が高いと見受けられるため,この点を看過することはできません。

そこで以下のデザインの層別サンプ リングを行いました。第一に各市をその‘平均年収’を元に4分位にわけ,次にその4グループをさらにそれぞれ‘総医療機関数のうち病院の占める割合’を元 に4分位にわけ,計16グループを作りました。そしてそのグループごとにランダムサンプリングを行い,調査対象となる医療機関を抽出することになります。

こ こまでは過程として良く分かるのですが,ランダムサンプリングで取り出す診療所の数と病院の数はそれぞれ1対1の割合で抽出するようにと先輩に言われまし た。現在その先輩は休暇に入ってしまい連絡が取れなくなってしまったのですが,何故ここで1対1の割合で診療所と病院の数を取り出すのか,知りたいと考え ております。しかし何冊かサンプリングについて書かれた書籍を読んでみても,その理由を把握することができませんでした。直感的には,病院に通う患者数と 診療所に通う患者数が1対1だから,ランダムサンプリング後に取り出す病院と診療所の数も1対1とする,というのがその理由なのではないかと考えているの ですが,私の解釈は正しいでしょうか?

アドバイスをいただけましたら幸いです。

● 「統計学関連なんでもあり」の過去ログ--- 044 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る