No.22683 独立変数の水準サイズについて  【畠山】 2019/02/20(Wed) 17:28

はじめて質問させて頂きます。

ロジスティック回帰分析で各独立変数の水準サイズはどの程度あれば良いのでしょうか?

「作業者」という独立変数が3つの水準(スタッフA,スタッフB,スタッフC)を持ち,
それぞれの数がスタッフA:250,スタッフB:500,スタッフC:1,000であった場合,得られた結果は各水準のサイズの差が大きく影響しますでしょうか?

あるreviewerから,この数の差が大きいので結果が信用ならないとのコメントを頂きました。
全体のサンプルサイズは独立変数×10以上であり,十分かと思うのですが,水準ごとの数についてわからず質問させて頂きました。

お忙しいところ恐縮ですが,宜しくお願い申し上げます。

No.22684 Re: 独立変数の水準サイズについて  【青木繁伸】 2019/02/20(Wed) 19:52

査読者は,水準ごとのサンプル数が 2,4 倍とかなり異なることを言っているのでしょう

この違 いが恣意的なものなら問題になるでしょうが,各水準での抽出割合を同じにして標本を抽出すると,結果として母集団の構成を反映することになります。このよ うな標本抽出は,むしろ好ましいことでしょう。逆に母集団で 1:2:4 の割合で存在するものを,抽出割合を無視して 1:1:1 でサンプルを取って分析したらその方がよほど問題だと思いますが。

このようなことは事前に抽出数を決定しない変数には常に存在するもので す。サンプルを無作為抽出した後,いろいろな変数ごとに集計すると水準ごとのサンプルサイズには相当な違いが出てくるでしょう。全ての変数で,ある要素を 持っているものと持たないものの割合が 1:1 になることなんてないでしょう。変数によっては数倍から数十倍になるものもあるでしょう。

どうも,査読者は古典的な実験で,対照群と各処理群のサンプルサイズを全て同じにすべしという例数設定と同じだと誤解しているのではないか?

例 えば,社会調査のような非実験系の統計で,平均値の差の検定のような単純な場合でも,データを無作為抽出した後にいろいろな属性で再分類して検定を行うよ うな場合,例数がかなり異なることはよくあることです。「そのような場合に検定は行えないし,行ったとしても信用ならない」なんて,誰もいいませんよね。

平均値の差の検定だろうがロジスティック回帰分析だろうが,「水準ごとのサンプルサイズが違うからだめだ」ということにならないのは明らかでしょう。

No.22685 Re: 独立変数の水準サイズについて  【畠山】 2019/02/21(Thu) 10:08

青木先生

ご返答ありがとうございます。
今回は臨床データを後方視的に検討したものだったので,恣意的なものではありませんでした。

各水準のサンプル数を意図的に変えたわけではない旨を上手く査読者の先生に伝えたいと思います。
お忙しいところご返答下さり誠にありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 048 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る