No.16418 MatchBalanceに投入する共変量  【sassa】 2012/02/13(Mon) 16:05

統計初心者,R初心者です。MatchBalanceに投入する共変量をどのように選択して調整していくのか分かりません。
http://sekhon.berkeley.edu/papers/MatchingJSS.pdf
の中の内容について質問します。

R> MatchBalance(Tr ~ age + I(age^2) + educ + I(educ^2) + black + hisp +
+ married + nodegr + re74 + I(re74^2) + re75 + I(re75^2) + u74 + u75 +
+ I(re74 * re75) + I(age * nodegr) + I(educ * re74) + I(educ * re75),
+ match.out = rr1, nboots = 1000, data = lalonde)

This model adds second-order polynomials to the continuous variables we have: age, educ,re74 and re75. And it adds indicator variables for whether income in 1974 and 1975 were zero: u74, u75. Note that this pscore model does not do anything different with nodegr than the previous one we used.

こう書いてありますが,I(age^2),I(educ^2),I(re74 * re75)など二乗したものや掛け合わせたものをどうして投入するのですか?
matchさせた共変量にはない,u74,u75が急に出てくるのはどうしてですか?この内容が分からないので教えてください。

No.16423 Re: MatchBalanceに投入する共変量  【青木繁伸】 2012/02/13(Mon) 21:13

よりよいモデル構築のためでしょう。

No.16424 Re: MatchBalanceに投入する共変量  【sassa】 2012/02/14(Tue) 00:19

お返事ありがとうございます。
よりよいモデル構築のため というのは分かるのですが,具体的に自分のデータでMatchBalanceをするときに,どの共変量を2乗したり,掛け合わせたりするのか,どのように選択すべきかわからないのです。
re74 と I(re74^2)  のように,共変量そのものと,二乗したものを同時に加えるのも,よりよいモデルになるだろうと予想して投入しているはずです。そうでなければ,とても多い組み合わせができてしまうと思うのですが,如何でしょうか。
予想せずに適当に共変量を選択して二乗するなどして投入していいものではないと思うので,予想の仕方が一般的にあるのであれば,教えてください。

No.16425 Re: MatchBalanceに投入する共変量  【青木繁伸】 2012/02/14(Tue) 07:25

> 予想の仕方が一般的にあるのであれば,教えてください。

先行研究の知見などが元になるでしょう。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る