「統計学関連なんでもあり」の過去ログ---009

★ 標本と調査統計の比較 ★

　186　標本と調査統計の比較　　K_YAMADA　　2000/08/22 (火) 12:17
　　187　Re: 標本と調査統計の比較　　青木繁伸　　2000/08/22 (火) 12:38
　　　205　Re^2: 標本と調査統計の比較　　K_YAMADA　　2000/08/23 (水) 10:46
　　　　206　Re^3: 標本と調査統計の比較　　膳膳　　2000/08/23 (水) 12:02
　　　　　209　Re^4: 標本と調査統計の比較　　K_YAMADA　　2000/08/23 (水) 18:24
　　　　　　210　Re^5: 標本と調査統計の比較　　膳膳　　2000/08/24 (木) 14:21
　　　　　　　211　Re^6: 標本と調査統計の比較　　K_YAMADA　　2000/08/24 (木) 15:22
　　　　　　　　213　Re^7: 標本と調査統計の比較　　マンボウ　　2000/08/24 (木) 21:32
　　　　　　　　　214　Re^8: 標本と調査統計の比較（つづき）　　マンボウ　　2000/08/24 (木) 21:32
　　　　　　　　212　Re^7: 標本と調査統計の比較　　K_YAMADA　　2000/08/24 (木) 15:35
　　　　　　　　　216　Re^8: 標本と調査統計の比較　　マンボウ　　2000/08/24 (木) 21:56
　　　　　　　　　　220　Re^9: 標本と調査統計の比較　　???　　2000/08/29 (火) 07:24
　　　　　　　　　　　222　Re^10: 標本と調査統計の比較　　マンボウ　　2000/08/29 (火) 21:22
　　　　　　　　　　　　223　Re^11: 標本と調査統計の比較　　???　　2000/08/30 (水) 07:52
　　　　　　　　　　　　　224　Re^12: 標本と調査統計の比較　　K_YAMADA　　2000/08/30 (水) 15:54

186.　標本と調査統計の比較　　K_YAMADA　　2000/08/22 (火) 12:17

前回の投稿では御教示いただけず，再投稿です。
ある要因を持つ1群が低身長であると予想して，さまざまな年齢の100名程の身長データを取ったとします。政府統計による各年齢の平均身長との比較で検討しようとすると，各サンプルごとにすべて対応する母集団が異なることになります。この場合，どのような統計検定が可能でしょうか?根本的な無知・誤解などがあればあわせてご指摘いただけると幸いです。

　　　　　[このページのトップへ]

187.　Re: 標本と調査統計の比較　　青木繁伸　　2000/08/22 (火) 12:38

> ある要因を持つ1群が低身長であると予想して，さまざまな年齢の100名程の身長データを取ったとします。政府統計による各年齢の平均身長との比較で検討しようとすると，各サンプルごとにすべて対応する母集団が異なることになります。この場合，どのような統計検定が可能でしょうか?根本的な無知・誤解などがあればあわせてご指摘いただけると幸いです。

対象者の年齢はどのような分布ですか?
年齢によっては，±αで階級分けして，比較する母集団はその中央年齢に設定するとか。

年齢と身長が直線的な年代であれば，対象群において年齢と身長の回帰直線の傾きの違いを検定するとか。

一番いいのは，対照群をとること。
性別は考えなくていいのですか（遺伝疾患などでどちらか一方の性だけが問題になるという状況なのかもしれないけど）
対照群を作るとき，性・年齢でマッチングするのは基本的ではないかな。
その他，たとえば居住地（都市と農村とか），所得，教育水準など，身長に影響をを与える可能性のある要因をちゃんと考慮しておかないと，差があったなかったといっても，注目している要因がその原因かどうかわからなくなってしまいます。

　　　　　[このページのトップへ]

205.　Re^2: 標本と調査統計の比較　　K_YAMADA　　2000/08/23 (水) 10:46

> 対象者の年齢はどのような分布ですか?
20才～70才で各年代10-20名程度で計100名弱です。

> 一番いいのは，対照群をとること。
そう思います。しかし，現実的にはいろいろとマッチさせた対照群を集めるのは大変ですから・・・

ある遺伝子欠損症の臨床症状を調べています。身長に関して各個人を厚生省のデータ(http://wwwdbtk.mhw.go.jp/toukei/kihon/data/KHDK009_01.html)で比較したところ，やや低身長の傾向があるように感じました。でも統計処理は難しそうですね・・・

　　　　　[このページのトップへ]

206.　Re^3: 標本と調査統計の比較　　膳膳　　2000/08/23 (水) 12:02

> > 対象者の年齢はどのような分布ですか?
> 20才～70才で各年代10-20名程度で計100名弱です。

> ある遺伝子欠損症の臨床症状を調べています。身長に関して各個人を厚生省のデータ(http://wwwdbtk.mhw.go.jp/toukei/kihon/data/KHDK009_01.html)で比較したところ，やや低身長の傾向があるように感じました。でも統計処理は難しそうですね・・・

検定力が低くてもいいなら，対応する年齢の平均身長に対して，高ければプラス，低ければマイナスで符号検定をするという手があるでしょう。

もう少し進めると，対応する年齢の身長を引いて，信頼限界を求め0をまたぐか調べる。

身長だけ（つまり一変量）ならそういうことも可能でしょう。

　　　　　[このページのトップへ]

209.　Re^4: 標本と調査統計の比較　　K_YAMADA　　2000/08/23 (水) 18:24

> 検定力が低くてもいいなら，対応する年齢の平均身長に対して，高ければプラス，低ければマイナスで符号検定をするという手があるでしょう。

non-parametric testはdistribution freeということではあっても2群が同一分布からのものであることがやはり帰無仮説になるのではないでしょうか?
Wilcoxon符号付順位和検定や符号検定についても，対応する年齢ごとに母集団が異なることが問題かな・・・と思っています。

> もう少し進めると，対応する年齢の身長を引いて，信頼限界を求め0をまたぐか調べる。

具体的にどういう手法なのでしょうか?すみません・・・教えていただけるとありがたいのですが・・・

　　　　　[このページのトップへ]

210.　Re^5: 標本と調査統計の比較　　膳膳　　2000/08/24 (木) 14:21

> > 検定力が低くてもいいなら，対応する年齢の平均身長に対して，高ければプラス，低ければマイナスで符号検定をするという手があるでしょう。
>
> non-parametric testはdistribution freeということではあっても2群が同一分布からのものであることがやはり帰無仮説になるのではないでしょうか?

同一分布とはどういうことをいっているのかよくわかりません。きちんといっていただけないでしょうか。

符号検定で分布の話があったのですかね。

あなたは対応させて分析するという考え方を知ってますか。

　　　　　[このページのトップへ]

211.　Re^6: 標本と調査統計の比較　　K_YAMADA　　2000/08/24 (木) 15:22

> 同一分布とはどういうことをいっているのかよくわかりません。きちんといっていただけないでしょうか。

与えられた2群の母集団は同一の分布関数を持つ，または2群が同じ母集団からの抽出である，ということが帰無仮説になるといえばいいでしょうか?

> 符号検定で分布の話があったのですかね。

いくつかの成書を調べましたが，符号検定でも分布の話は出てきます。

> あなたは対応させて分析するという考え方を知ってますか。

だいたいは理解しているつもりですが・・・統計が専門ではないので自信はありません。

　　　　　[このページのトップへ]

213.　Re^7: 標本と調査統計の比較　　マンボウ　　2000/08/24 (木) 21:32

分布に依存しない distribution free ということの解釈は一通りではないかもしれません（正誤に関わらず）

件の場合には，年齢は共変量とみなすことができるわけですね。
また，「母集団」というのは概念的なもので，階層構造があると思います。（つまり，以下では，年齢の異なるすべての対象を包含するものを母集団と考える）

　　　　　[このページのトップへ]

214.　Re^8: 標本と調査統計の比較（つづき）　　マンボウ　　2000/08/24 (木) 21:32

つづき

それらを考慮すると，

各被検者について，ある被検者の年齢に対応する年齢母集団の「母平均値」と，その被検者の測定値のいずれが大きいかを二値データ（大小）として測定（記録）するのは問題ないと思います。

通常の「符号検定」では，対応のある2つの測定値の大小関係で検定統計量を計算しますが，その考え方に反するものではないと思います。

ただ，普通の符号検定と異なるのは，比較の基準となるのが母平均値であるか対応する測定値であるかということだと思います。
前者の場合には，符号検定が仮定するよりも強い仮定があります。すなわち「測定値は平均値より大きいか?小さいか?」ということで，これは，符号検定が仮定する「測定値は中央値より大きい?小さいか?」というのとはちょっとことなると思います。

身長に関しては，「ほぼ正規分布に従う」ということで，中央値より大きいか小さいかを，平均値より大きいか小さいかに置き換えてもよさそうに思えますが，，，，厳密に言えば難しい所なんでしょうか。

　　　　　[このページのトップへ]

212.　Re^7: 標本と調査統計の比較　　K_YAMADA　　2000/08/24 (木) 15:35

追加コメントです。

符号検定について
「H0は母集団から2つの値x1，x2を対応させて無作為抽出するときx1> x2の確率とx1<x2の確率が1/2に等しい。」（やさしい医療系の統計学，P.178，医歯薬出版）
「分布の形がどのようであっても，中央値より大きな値と小さな値は，等しく全体の50%である。」（医学統計学ハンドプックP.51，朝倉出版）
「符号検定の検出力は真の分布に依存する。」（自然科学の統計学，P.218，東京大学出版）
など，符号検定でも分布を仮定していると解釈していますが・・・

（P.S.明日から夏休みで5日ほどレスできません。）

　　　　　[このページのトップへ]

216.　Re^8: 標本と調査統計の比較　　マンボウ　　2000/08/24 (木) 21:56

> など，符号検定でも分布を仮定していると解釈していますが・・・

distribution free ということを，どのようなレベルで考えるかは非常に重要な問題と思います。

例えば，代表値の差の検定の範疇に分類されるものとして，マン・ホイットニーのU検定，van der Waerden 検定，中央値検定などがありますが，検出力の面から言えば，それぞれの検定が得意とする母集団分布というのはあります。しかしそれは，distribution free とは何の関係もありませんよね（ですよね?）。

この問題について私が衝撃を受けたのは，t 検定と同じ検定方式によるものが distribution free test と解説されていたものでした。
シーゲルの本の中にあった検定ですが，今，その名前を思い出せません。（Wald-Wolforiz test だったっけ，綴りは全く自信なし）

　　　　　[このページのトップへ]

220.　Re^9: 標本と調査統計の比較　　???　　2000/08/29 (火) 07:24

>
> この問題について私が衝撃を受けたのは，t 検定と同じ検定方式によるものが distribution free test と解説されていたものでした。
> シーゲルの本の中にあった検定ですが，今，その名前を思い出せません。（Wald-Wolforiz test だったっけ，綴りは全く自信なし）

　どのような検定法なのでしょうか?　教えていただけないでしょうか?

　　　　　[このページのトップへ]

222.　Re^10: 標本と調査統計の比較　　マンボウ　　2000/08/29 (火) 21:22

最初にお詫びです。
Wald-Wolfowitz 検定は順序尺度変数・独立2標本の場合の検定でした。

私の記憶にあった方は，確率化検定ということで，特別な名前は（Siegel では）あげられていませんでした。

小標本の場合には普通どおり確率化検定を行う説明があります。
大標本の場合には，(1)二標本を合併したときの尖度が小さいこと，(2)各群の標本の大きさの比が1/5～5の間にあること（1/5 ≦ n1/n2 ≦ 5）という 2つの条件を満たすとき，平均値の差の検定（t 検定）の公式により得られる統計量が近似的に自由度 n1+n2-2 の t 分布に従うということを使う。

このような説明の後，『読者が注意されたいのは，たとえ，式（16.6）が通常の t 検定であっても，母集団が等分散の正規分布であるという仮定は不必要であるから，この検定は，この場合にパラメトリックな統計的検定のように用いられるものではないということである。しかし，それを用いるためには，上述の 2 つの条件が満たされていることだけでなく，スコアが少なくともある間隔尺度での測定を表していることが必要となる。』と書いてあります。

　　　　　[このページのトップへ]

223.　Re^11: 標本と調査統計の比較　　???　　2000/08/30 (水) 07:52

> このような説明の後，『読者が注意されたいのは，たとえ，式（16.6）が通常の

　詳しくお教えいただき，ありがとうございました。
　私が見ているものとは版が違うようなので，章立てや記述が異なるために探せなかったようです。

　　　　　[このページのトップへ]

224.　Re^12: 標本と調査統計の比較　　K_YAMADA　　2000/08/30 (水) 15:54

レスいただいた方々，ありがとうございました。
いろいろと勉強になりました。

　　　　　[このページのトップへ]

● 「統計学関連なんでもあり」の過去ログ--- 009 の目次へジャンプ
 ● 「統計学関連なんでもあり」の目次へジャンプ
 ● 直前のページへ戻る