★ 全数調査における検定について ★

 27 全数調査における検定について  MICHOM  2002/07/10 (水) 22:49
  28 Re: 全数調査における検定について  青木繁伸  2002/07/10 (水) 23:04
   29 Re^2: 全数調査における検定について  MICHOM  2002/07/10 (水) 23:41
    31 Re^3: 全数調査における検定について  青木繁伸  2002/07/11 (木) 09:04
     32 Re^4: 全数調査における検定について  MICHOM  2002/07/11 (木) 11:00
    30 Re^3: 全数調査における検定について  いちろう  2002/07/11 (木) 08:46


27. 全数調査における検定について  MICHOM  2002/07/10 (水) 22:49
全数調査における検定について不要だという見解が過去のスレッドにありましたが,重回帰係数のパラメーターの有意性の検定は有効であると青木先生がかかれていましたが,その理由を教えてください。
全数調査で得たデータの場合は,重回帰係数,相関係数,決定係数ほかすべての検定はすべて不要だという人もいるのですが。。実のところよくわからないのです。

     [このページのトップへ]


28. Re: 全数調査における検定について  青木繁伸  2002/07/10 (水) 23:04
> 全数調査における検定について不要だという見解が過去のスレッドにありましたが,重回帰係数のパラメーターの有意性の検定は有効であると青木先生がかかれていましたが,その理由を教えてください。

やはり,標本と母集団のとらえ方の違いだと思います。
全数調査のデータであっても,それを重回帰モデルとしてとらえるときには,そのようなデータは母集団からの標本として考えている。そうでなければ,得られたデータ点の最小二乗近似解が唯一無二の真値であり,そもそも,その解に基づく予測値とかが出る場がない。
重回帰分析の重要な応用は,将来データの予測ですから,そういう意味からも,過去のデータは未来のデータをも含む,無限母集団からの標本と考えているわけではないでしょうか。
また,たとえば,ある経済現象を予測するモデルは,その基礎データがたとえば日本におけるデータであっても,応用はアメリカとかイギリスとかになるかもしれず,そういう意味でも,日本におけるデータは世界という母集団からの標本なのでしょう。

     [このページのトップへ]


29. Re^2: 全数調査における検定について  MICHOM  2002/07/10 (水) 23:41
> やはり,標本と母集団のとらえ方の違いだと思います。
私も基本的にはとらえかたの違いだと思っています。ただ,ある論文で全国市町村データを用いて重回帰分析を行ったさいに,係数にT値や有意確率をつけたら「これが全数調査なのだから,重回帰分析の結果にT値や有意確率をつけるのはおかしい」と査読者から指摘されました。これに対するディフェンスとして,標本と母集団のとらえかたの違いを述べたところ,「全国市町村データを使っているのだから,全数調査であることに違いがない」と言われてしまいました。
どういうふうに対処していいかわかりません。仮に全数調査であったとしても,重回帰分析などでパラメーターの有効性の検定をすることが問題ではないということが書かれた本や論文はないでしょうか?

     [このページのトップへ]


31. Re^3: 全数調査における検定について  青木繁伸  2002/07/11 (木) 09:04
> ある論文で全国市町村データを用いて重回帰分析を行ったさいに,係数にT値や有意確率をつけたら「これが全数調査なのだから,重回帰分析の結果にT値や有意確率をつけるのはおかしい」と査読者から指摘されました。これに対するディフェンスとして,標本と母集団のとらえかたの違いを述べたところ,「全国市町村データを使っているのだから,全数調査であることに違いがない」と言われてしまいました。

いちろうさんが書いているように,時間を元に戻すということも必要なくて,この場合には,毎年毎年同じ変量について観察値が得られる時系列データですよね。そして,そんなに長い年月での話ではないとすると,今年のデータはここ数年間の時系列母集団(そんな言葉あったかな?)の標本と見て良いのでは?

別の話として,計量経済学でも年次データを使って重回帰モデルを構築するようですが,そこでもt統計量は計算するようです(ただ,p値までは計算せず,t>2で有意などとおおざっぱな判断をするようです)。

なお,以上の話と,たとえばA県とB県の肺ガンの死亡率の有意差検定が無意味であることとは全く別ですから念のため。

     [このページのトップへ]


32. Re^4: 全数調査における検定について  MICHOM  2002/07/11 (木) 11:00
> いちろうさんが書いているように,時間を元に戻すということも必要なくて,この場合には,毎年毎年同じ変量について観察値が得られる時系列データですよね。そして,そんなに長い年月での話ではないとすると,今年のデータはここ数年間の時系列母集団(そんな言葉あったかな?)の標本と見て良いのでは?

私も同様のことを思い,反論したのですが,「時間経過による変動が想定されたとしても,それを一時点のデータ間の変動をもとにした検定をやればいいわけではない」という指摘をうけました。


> 別の話として,計量経済学でも年次データを使って重回帰モデルを構築するようですが,そこでもt統計量は計算するようです(ただ,p値までは計算せず,t>2で有意などとおおざっぱな判断をするようです)。

そうですよね。私も多くの論文でそのような対応がなされているのを目にしました。しかし,どれも理論的根拠を述べていないので,査読者からすると「慣習」にすぎないと見えるようです。。。。。

> なお,以上の話と,たとえばA県とB県の肺ガンの死亡率の有意差検定が無意味であることとは全く別ですから念のため。

それはおっしゃるとおりだと思います。

     [このページのトップへ]


30. Re^3: 全数調査における検定について  いちろう  2002/07/11 (木) 08:46
全国市町村データがある標本であると主張するのであれば,これらには実は母集団が存在していて,手元にあるのは,たまたま,それをランダムサンプリングして得られた例に過ぎないとされてはいかがでしょうか。事実,時間が戻せるとして全国市町村データを繰り返し得ると,それらの標本から得られる統計量は微妙に異なっているはずです(?)。あるいは,ある要件を満たす社会を観察し,たまたま得られたデータの一つが,その全国市町村データであるとしてはいかがでしょうか。いずれにしても,そのデータから背景にあるであろう母集団のなんらかの特徴を推定しようとしているかどうかがポイントになると思います。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 020 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る