はじめて投稿します。ご教示頂ければありがたく思います。
数量化I類や重回帰分析で
データセットに重みづけを行うことは可能でしょうか。
例えば
X11,X12,X22,X32(←説明変数), Yにしたい事象
1 0 1 1 1 62秒中60秒見た
1 0 1 0 0 355秒中 0秒見た
1 0 1 0 1 176秒中49秒見た
0 1 1 0 1 301秒中15秒見た
0 1 1 0 0 191秒中20秒見た
0 1 0 1 0 183秒中39秒見た
:
:
というデータがあり,見た割合と説明変数の相関関係をみたい場合,
おそらく
X11,X12,X22,X32,Y
1 0 1 1 1 60/62(←分数です)
1 0 1 0 0 0/355
1 0 1 0 1 49/176
0 1 1 0 1 15/301
0 1 1 0 0 20/191
0 1 0 1 0 39/183
:
:
として解けばいいのでしょうが,この場合例えば 60/62 と 0/355 を同じ重みで扱っていいのか?という疑問があります。
分母の秒数に比例して,例えば 0/355 の方が 60/62 より 355/62 倍 信頼性が高い,など重みづけをして解いた方がいいような気がします。
原始的な方法としては,
1 0 1 1 1 60/62 のデータセットを62個
1 0 1 0 0 0/355 のデータセットを355個用意するなどして解くという方法が考えられると思いますがもっと賢い解法(理論?)はあるのでしょうか? |