★ 近似直線について ★

 77 近似直線について  まりも  2000/03/02 (木) 17:47
  79 Re: 近似直線について  青木繁伸  2000/03/02 (木) 18:34
  78 Re: 近似直線について  ひの  2000/03/02 (木) 18:00
   80 Re^2: 近似直線について  まりも  2000/03/02 (木) 18:40
    81 Re^3: 近似直線について  青木繁伸  2000/03/02 (木) 18:51
     82 Re^4: 近似直線について  まりも  2000/03/02 (木) 19:12
      87 Re^5: 近似直線について  マンボウ  2000/03/02 (木) 22:52
      85 Re^5: 近似直線について  ひの  2000/03/02 (木) 22:02
      84 Re^5: 近似直線について  青木繁伸  2000/03/02 (木) 19:40
      83 Re^5: 近似直線について  青木繁伸  2000/03/02 (木) 19:30


77. 近似直線について  まりも  2000/03/02 (木) 17:47
あるデータ群(xi,yi)への近似直線を最小自乗法で求めようとしています。
ほとんどの場合,この方法で計算可能なのですが,
x=の式(たとえばx=100)に限りなく近づいたとき,係数値が正しく求まりません。このようなときどうすればよいでしょうか?

最小自乗法で求めた係数値を検定するなど参考書に書かれてありますが,よくわかりません。できれば,簡単に解説してほしいのですが・・・

よろしくおねがいします。

     [このページのトップへ]


79. Re: 近似直線について  青木繁伸  2000/03/02 (木) 18:34
> あるデータ群(xi,yi)への近似直線を最小自乗法で求めようとしています。
> ほとんどの場合,この方法で計算可能なのですが,x=の式(たとえばx=100)に限りなく近づいたとき,係数値が正しく求まりません。このようなときどうすればよいでしょうか?

傾きがほとんど無限大という場合のことでしょう?

このようなときに近似直線も何もあったものではなく,そのような状況を検出したときに x = a という解を出せばよいのでは。 a は xi の平均値。

     [このページのトップへ]


78. Re: 近似直線について  ひの  2000/03/02 (木) 18:00
> x=の式(たとえばx=100)に限りなく近づいたとき,係数値が正しく 求まりません。このようなときどうすればよいでしょうか?

正しく求まらないというのはどういう意味でしょうか?精度を上げたいということでしたら,データの精度と数をアップさせるしかないでしょう。

     [このページのトップへ]


80. Re^2: 近似直線について  まりも  2000/03/02 (木) 18:40
回答ありがとうございます。
データ的には,
  x          y
106.055723  132
106.139191  145
106.254579  158
106.398925  171
106.521505  184
106.640927  197
106.598814  210
106.759598  223
106.603175  236
このような感じで,エクセルなどを使って近似直線を求めると正しい近似直線にならないように見えます・・・

どうなんでしょうか・・・

     [このページのトップへ]


81. Re^3: 近似直線について  青木繁伸  2000/03/02 (木) 18:51
このデータ x= というようなことにはならないでしょう?
回帰直線の傾き = 136.275
回帰直線の切片 = -14321.3
ということで,
y= 136.275 X -14321.3
となるのに問題は見られないと思いますが?

散布図を描いて,ついでに求められた近似直線も描き込んでみてください。

     [このページのトップへ]


82. Re^4: 近似直線について  まりも  2000/03/02 (木) 19:12
すいません。最後にもう一度だけ・・・
データ量を少なくしていたので・・・
x        y
106.055723    132
106.139191    145
106.254579    158
106.398925    171
106.521505    184
106.640927    197
106.598814    210
106.759598    223
106.603175    236
106.572581    249
106.569106    262
106.640873    275
106.58998    288
106.525532    301
106.474596    314
106.554348    327
106.377399    340
106.285985    353
106.254386    366
106.243381    379
とすると
y = 31.293x - 3075.7となり,近似直線が,点列より傾いたものになります。
このような場合は,言われたようにxの平均を用いたほうがよいのでしょうか・・・

     [このページのトップへ]


87. Re^5: 近似直線について  マンボウ  2000/03/02 (木) 22:52
> すいません。最後にもう一度だけ・・・

というかなんというか,

XからYを予測するんでしょうね。
ほんとうにそれでいいのですか。
なんか,どっか食い違っているんじゃないかなあという恐れがある。

散布図描いてあんなふうになるのに,XからYを予測するなんて,ちょっと,変だと思うんですがね。

あ,XからYを予測するというのは,Y=aX+b みたいな直線回帰式を考えるということですよ(念のため)。

Xのとる値の範囲が非常に狭く,Yのとる値は比較的広い範囲の値をとると,そう言う理由だけによって X = constant みたいな予測式を考えたのでしょうか。

でも,X=constant という(予測式とも言えない)式では,「XからYを予測する」って本来の目的が全然無視されているじゃないですか。これはどちらかというと,Y からXを予測することを意味していて,ただし,Yの値によらず,いつでもXの値としてconstantという予測値を返すということですからね(だから,予測式と言えないと言ったわけです)。

なんか,対話がうまく噛み合っていないような感じ..

理解できたところ,できないところ,新たな疑問など,ちゃんと書いた方がいいですよ。のれんに腕押しと言う感じですからね。

     [このページのトップへ]


85. Re^5: 近似直線について  ひの  2000/03/02 (木) 22:02
データに直線を当てはめるべき理由がなんなのかは分かりませんが,散布図の形状から判断すると,x = ay^2 + by + c の放物線で近似した方が良いのではないでしょうか。

     [このページのトップへ]


84. Re^5: 近似直線について  青木繁伸  2000/03/02 (木) 19:40
> このような場合は,言われたようにxの平均を用いたほうがよいのでしょうか・・・

いや,単にそういうことではなく,あなたはこのデータ列に対してどのような近似モデルを考えているのですか?それによって解答は違いますよ。

あなたが最初いっていたのは x = a みたいな垂直線を考えていたように読めたから,ああいうコメントを付けたのです。
しかし,データを見るとそんなことはないので,x = a なんてモデルをこれ以上考えるのはナンセンスでしょう?

     [このページのトップへ]


83. Re^5: 近似直線について  青木繁伸  2000/03/02 (木) 19:30
このデータについても,散布図描いてみましたか?

直線で近似できるようには見えませんが。
下の URL をクリックしてみてください。
散布図
おまけに,このデータでは y = f(x) は二値関数,たとえばx = 106.3 のとき,y は150近辺と350近辺の値のどちらをとるといえばいいのですか?

ついでに,気になること
x の値域が非常に狭く,精度は非常に高い
(実際のデータがそうなんだといわれればそれまでですが)

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 007 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る