No.20246 統計ソフトのランダムサンプル抽出は、データの改ざん・ねつ造になるのか  【採血】 2013/09/26(Thu) 17:00

以下。ご教示くださると幸いです。

病気の群と健康なコントロール群で,ある血液の値を比較する研究をしています。
この値は性別の影響をうけることがわかっています。
病気の群は,男女のN数の比が約1:1でした。
コントロール群は,男女のN数の比が約2:1でした。
そこで,統計ソフトのランダムにサンプルを抽出する機能を使い,コントロール群の男のN数を半分にして,コントロール群の男女のN数の比を約1:1にしました。
上記のような操作は,データの改ざん・ねつ造に類するものでしょうか。

どうか教えてください

No.20247 Re: 統計ソフトのランダムサンプル抽出は,データの改ざん・ねつ造になるのか  【青木繁伸】 2013/09/26(Thu) 18:43

分析に使用するデータをどのように選別したかを明記すれば,改竄・捏造とはいわないでしょう。
しかし, 「ランダムに抽出」した結果何らかの知見が得られた場合,「たまたまそういうデータが選ばれたのではないか」という意見には反論できないでしょう。とする と,データのランダム抽出とその分析を何回か(何回も)行って,同じような結果が得られる確率がどの程度などというようなことになるでしょうか。そんな, データ解析結果はあまり見たことがないですが。
そもそも,データ解析は,得られたデータは全て使うのが原則。
性別の影響を受ける変数を分析する場合には,男女のデータを別々に分析する,あるいは性別を表す変数を同時に多変量解析するというのが常套手段でしょう。男女の比を同じにすればよいというような問題ではないと思います。

No.20248 Re: 統計ソフトのランダムサンプル抽出は,データの改ざん・ねつ造になるのか  【採血】 2013/09/26(Thu) 19:45

青木先生,丁寧なご回答ありがとうございました。大変参考になります。

病気の群のデータの正規性が保たれておらず,ノンパラメトリック解析を用いる必要があり,男女の比を同じにしようとしてしまいました。

もう一度,解析方法を考え直してみます。ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 046 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る