No.03229 投稿の削除について  【青木繁伸】 2007/04/16(Mon) 22:00

投稿を削除すると,それについてのコメントも全部削除されてしまいます。

投稿が不適切だったというなら,やむを得ないかもしれませんが,それならそれで,ちゃんと適切な質問として再提起して欲しいものです

無かったものにするのなら,それは,その質問がそもそも不適切だったと言うことを認めることになります。

No.03230 Re: 投稿の削除について  【青木繁伸】 2007/04/16(Mon) 22:16

このような掲示板で,複雑な数式をもてあそぼうとするなら,一番のやり方は,LaTeX等で生成した数式をディス プレイに表示したものをキャプチャするとか(まあ,MS office の数式エディタを使いたい人は使えばよいでしょうが),PDFファイルやPSファイルから切り取るとかしたものをアップロードする。
別の方法では,丁寧に手書きした数式をスキャンするとかデジカメで撮影するとかして画像としてアップロードする。

No.03233 Re: 投稿の削除について  【綾子】 2007/04/17(Tue) 10:26

質問の修正をしたものを,アップロードしたつもりが,
誤って削除してしまいました。
ご迷惑をおかけし申し訳ございません。
ご教示いただきましたとおり,数式の部分は画像ファイルとして添付し,
近日中に再掲させていただければと思っております。

なお,取り急ぎ学習を進められればと考えており,もし可能でしたら
母比率の標準誤差の求め方について詳述されている書籍,資料を
ご紹介いただけますでしょうか。
宜しくお願いします。

No.03234 Re: 投稿の削除について  【青木繁伸】 2007/04/17(Tue) 10:45

古い本ですが,古典的名著ではないかと思われる
西平重喜「統計調査法」培風館

比率に平均や分散が出てくるのは,データを 0/1 の二値データと考えれば,たとえば
1,1,1,1,0,0,0,0,0,0
平均値=4/10 ← 比率に他ならない
分散=(4*(1-0.4)^2+6*(0-0.4)^2)/10=0.24 ← 比率の分散 p(1-p) に他ならない

No.03236 Re: 投稿の削除について  【綾子】 2007/04/17(Tue) 19:54

書籍をご紹介いただきましてありがとうございました。
書籍の内容も並行して勉強していきます。画像データの作成ができましたので
改めて質問をさせていただきます。お手数ですが添付ファイルをご参照ください。

●質問内容
1.一般的な母比率の標準誤差の求め方と,ある標本統計調査の資料の(2)標準誤差の求め方をみると大分内容が異なるようにみえますが,どのような考え方の違いがあるのでしょうか。

2.ある標本統計調査の資料の(2)標準誤差の求め方の方法で標準誤差を算出する具体的な作業方法についてお尋ねします。
労働組合ありを「1」,なしを「0」,不明はブランクとしてデータを持っています。そして母比率(拡大推計)結果は東京都の労働組合ありとの回答は30%とします。
この場合,エクセルで0/1,ブランクの入力データそのものを範囲としてVar関数を使用,また平均値を算出した結果を,(式4)に代入する方法でよろしいのでしょうか。

fig


No.03237 Re: 投稿の削除について  【青木繁伸】 2007/04/17(Tue) 22:47

1. は,一般の標本抽出の場合(層別抽出ではない,つまり標本をまとめて考える)
ちなみに,「標準誤差」と書いてあるが,それは「標準偏差」(つまり,標本比率の分散の平方根)。。。。標準誤差と標準偏差は大違い!

2. は,層別抽出した結果から母集団における比率とその標準偏差を推計する方法について書いてある。ここでの説明は,No.3234 に書いたのと同じく,特性なし・ありを 0/1 データで考えていることに注意。

(1) の母比率の推計は,母集団から取り出した標本のうち,特性ありのものの割合から,母集団中での特性ありの数を推計し(単純に比例関係を用いているだけ。母 集団が100で,そこから50の標本を取り出して,その中に特性あり(1)が20なら,母集団中には 20*(100/50)=40 が特性ありとなっているのだろうということ),それを全層で合計して(つまり,母集団中で特性ありの数の推計),母集団サイズの合計で割ることにより,特 性ありの母比率の推計をしている。

(2) 5式は,平均値を計算する式になっているがNo.3236 に示したとおり,その値は,その層における標本比率である。
6式は,各層の比率の不偏分散(分散にあらず)である。この数値は,No.3236 の通り,その層の標本比率をp,サンプルサイズを n とすると,p(1-p)*n/(n-1) に等しくなる。
以上2つの式により,各層の標本比率と比率の不偏分散を求め,それを 4式によって母集団の割合の分散にまとめているのである。(4式は,これで正しいのかなぁ?)

(1),(2) については,ここに書かれているやり方以外の推計法もある。

いきなり数式を解釈しようとしないで,実際に簡単な例を作ってそれを式の意味を考えながら解いてみる(解いてみることによって,式の意味も明らかになる)というようにしていけばよいのではないかな?

No.03240 Re: 投稿の削除について  【綾子】 2007/04/18(Wed) 11:12

青木先生,早速の明快なご返答をありがとうございます。
特性あり・なしを0/1の数値データとして考える旨,了解しました。
この場合,一般的には不明(無回答)も「特性なし」と捉え,「0」としてよろしいでしょうか。
ご紹介いただきました書籍を入手しましたので,読み進めたいと思います。
実 は統計ど素人の私が訳あって,NO.3236の4式と同様の形式で分散を求めることになりました。やはり,先生のご指摘どおり式からではなく意味を考えな がら解いてみることが大切だと思いますでトライしてみます!4式の是非につきましては,またご意見をいただければ幸いです。

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る