No.20193 モデルの当てはめの際の注意事項  【波音】 2013/09/03(Tue) 20:31

以下のような問題を考えたいとします。

「2012年3月の時点で,ある母集団Zから大きさ10の標本k1 を抽出した。この際,身長(Y)と体重(X)という2つの観測値(変数)を得ている。1年後の2013年3月の時点で,同様に母集団Z'から大きさ10の 標本k2を抽出した。しかし,(何らかの事情があったとして)身長(Y')は得られず,体重(X')のみ得られた。ここで標本k1からY = a + b*Xという回帰モデルを作成し,それを標本k2へ当てはめてY'を予測したい。」

ここで私が気になっているのは以下の2点ですが,これについてご意見を頂ければと思います。

1.ある予測モデルを作成する際に,変動(例えば時系列的な変動)が大きな変数や何らかの影響を受けやすい変数(例えば震災直後に「購買金額」といった変数は大きな影響をうけるであろう)は使うべきでない。

2.予測に重要なことは,説明変数と目的変数の関係が変わらないこと。ある変数の分布がモデル作成側のデータと予測側(当てはめる側)のデータで同じかどうかということは重要ではない(※1)。

※1
標本k1の体重Xと標本k2の体重X'の分布の形状は同じであっても,(実際には確認のしようがありませんが)cor(X, Y)とcor(X', Y')が同じとは限らない。モデル作成側では線形関係であったとしても,予測側では曲線関係が「真」かもしれない。

→XとX'の分布が同じことはどのくらい重要なことですか?
 これはある1つの変数の分布が大きく異なるということは,そもそも標本の抽出元である母集団の特徴自体が大きく変動したことを意味しているから,結局,目的変数と説明変数の関係が変わったであろうことを意味していますか?

No.20194 Re: モデルの当てはめの際の注意事項  【波音】 2013/09/03(Tue) 20:38

1点だけ上記について補足です。

母集団ZとZ'と書き分けているのは,例えば,母集団を「日本人の国籍を持つ男性」とした場合に,母集団の定義は同じであっても2012.3の時点と2013.3の時点ではその母集団に含まれる個体が変動するからです。

「個 体が変動」といっているのは,Aさんは2012.3時点ではいても,2013.3時点では死んでいる(個体そのものが消失する,あるいは出現する)という 意味と,Aさんの特徴(例えば体重)そのものが変動(70kg→73kgといったように)するという意味を含んでいます。

No.20201 Re: モデルの当てはめの際の注意事項  【韮澤】 2013/09/06(Fri) 09:13

私は品質管理に関わる職務がら,提起されている様な情報不足の予測線に基づいて企業としての行動を決定する必要が生じる事があります。
私の意見が少しでも心の支えになればと思い,意見します。

1.変数の選び方
例 題の話で言いますと,もともと「ZとZ'とで予測モデルが同じである」と言う事自体も不確実さのある仮定であり,かつ,与えられた情報の範囲では,この仮 定を検定する様な情報もありません。 従って,単純に言えば,変数の選択は統計学上で決定できる用件ではありませんから,対象分野における知見で決定するべきでしょう。
言われている様な予測モデルの変動を起こしやすい変数かどうかが別情報から統計的に決定できるほどの情報があるなら悩まないでしょうし,熟練した専門家の腕の見せ所と思って,使うかどうかを決めていくしかないでしょう。

2.変数の分布
例えば,予測モデルに最小二乗法を使ったなら,モデル上で必要な用件は,誤差Δyが正規分布している事であって,Xの分布形状はモデル上の必要性はないです。
また,誤差Δyが正規分布しているかを実際に検証する人(できる人)はいないのではないでしょうか。
もうひとつ思うのは,元々,情報が足りない悩みでしょうから,標本k2から母集団Z'の分布形状を検定できるなら,苦労しないと言った所では?
総論,「ZとZ'とで予測モデルが同じである」との仮定のリスクがいかほどかとの問題に埋もれる話に思います。

No.20233 Re: モデルの当てはめの際の注意事項  【波音】 2013/09/14(Sat) 19:46

ご回答ありがとうございます。
(お礼が遅くなり失礼しました)

統計学上の問題と固有科学の問題とはいつも話題に取り上げられることですが,やはり難しいですね。。。 やはり現場での知見もろもろ含めて判断しなければならないということですね。

変数の分布については,もう少し考えているところです。

● 「統計学関連なんでもあり」の過去ログ--- 046 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る