★ 複数の方法による予測値と実験値の相関について ★

843. 複数の方法による予測値と実験値の相関について Mori 2003/10/17 (金) 18:15
└844. Re: 複数の方法による予測値と実験値の相関について 青木繁伸 2003/10/17 (金) 18:39
 └845. 再:複数の方法による予測値と実験値の相関について Mori 2003/10/17 (金) 18:55
  └848. Re: 再:複数の方法による予測値と実験値の相関について 青木繁伸 2003/10/17 (金) 21:48
   └855. ありがとうございました Mori 2003/10/20 (月) 20:28


843. 複数の方法による予測値と実験値の相関について Mori  2003/10/17 (金) 18:15
回帰分析を行う時に,データ区分によって異なる説明変数を用いて求めた予測値と実験値の相関を,データ全体で評価する方法について質問です。
例えば,あるクラスの生徒の身長を予測する時に,女子は体重を,男子は足のサイズを説明変数として予測値を求め,クラス全体のデータで評価するというようなことです。
直線y=xに対する相関係数という表現が適切か分かりませんが,どのように考えたら/求めたらよいのでしょうか。
また,エクセルの近似曲線では,切片は指定できて傾きは指定できない設定となっていますが,この時のR^2値の意味もよく分かりません。
どうぞよろしくお願いします。

     [このページのトップへ]


844. Re: 複数の方法による予測値と実験値の相関について 青木繁伸  2003/10/17 (金) 18:39
> また,エクセルの近似曲線では,切片は指定できて傾きは指定できない設定となっていますが,この時のR^2値の意味もよく分かりません。

質問の意図がよくわからないのですが,原点を通る回帰分析の時に Excel が出力する R^2 はでたらめであることと,実際はどのように計算すべきかは,
http://aoki2.si.gunma-u.ac.jp/Hanasi/StatTalk/11.html
に,まとめてあります。

     [このページのトップへ]


845. 再:複数の方法による予測値と実験値の相関について Mori  2003/10/17 (金) 18:55
早速のご回答ありがとうございます。分かりにくい質問で失礼しました。
質問したかったのは,2つの変数YとX(予測値と実験値)が,どの程度対応しているかを評価したい場合に,直線y=xに対する相関係数というようなものが求められるのか,ということでした。
基本的な知識が欠落しているのかも知れませんが,よろしくお願いし致します。
ご指摘頂いたページは参照させて頂き,計算方法については理解したつもりです。

     [このページのトップへ]


848. Re: 再:複数の方法による予測値と実験値の相関について 青木繁伸  2003/10/17 (金) 21:48
> 直線y=xに対する相関係数というようなものが求められるのか,ということでした。


y=x というのは,x が実測値で,y が予測値ということを指しているのかと思いますが,そうでしょうか。

要するに,予測値と実測値がよく一致していると言うことを言いたいのかと思いますが。

そ のようなことを表すのが,重相関係数。一つの独立変数で従属変数を表す回帰式(単回帰式)の有用性を表す統計指標ですね。原点を通らない回帰式の場合に は,独立変数(一個)と従属変数の相関係数の二乗が,重相関係数 R2 になります。R2 が 1 ということは,相関係数 r も 1 ということです。

原点を通る回帰式というのは,特殊なものであって,件のページに示したような計算で R^2 を計算します。このときの R^2 は,相関係数 r の二乗ではないということです。

ま,それしか言えないのですが。

ちなみに,おっしゃるように,男女で予測式が違って,なおかつ全体で予測値と実測値の相関をみたい(つまり,予測の有効性を判断したい)というのは,私には心当たりがありません。

男女(サブグループごと)の評価を述べるだけでいいのではないですか?

> 基本的な知識が欠落しているのかも知れませんが,よろしくお願いし致します。
> ご指摘頂いたページは参照させて頂き,計算方法については理解したつもりです。

     [このページのトップへ]


855. ありがとうございました Mori  2003/10/20 (月) 20:28
説明不足の質問にコメントをいただき恐縮です。

> 要するに,予測値と実測値がよく一致していると言うことを言いたいのかと思いますが。

その通りです。
実際に私が取り組んでいる課題は,非線形関係にあると考えられる事象について,データ群をいくつかに区分し,それぞれについて線形重回帰をして近似的に予測式を構築するというものです。
そのため,データ区分の方法ごとに異なる回帰式から予測値が求まるため,全データでの実験値と予測値の一致を評価したいという動機がありました。

> 原点を通る回帰式というのは,特殊なものであって,件のページに示したような計算で R^2 を計算します。このときの R^2 は,相関係数 r の二乗ではないということです。

この方法で計算したR^2値が1に近く,かつ傾きaも1に近い方が,よい予測だという解釈はできるでしょうか。
あるいは,予測値と実験値の差(の絶対値)の和の大小で見るという,単純な比較で定性的に評価するということになるでしょうか。

ともかく,相関係数のような常識的な手法があるわけではないことが分かって一つ前へ進めます。
予測式については,理論的な評価も勿論必要になりますので,そちらから評価をする方法についても考えたいと思います。
本当にありがとうございました。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 026 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る