★ 平均値データに対する回帰直線 ★

 11 平均値データに対する回帰直線  mmm  2001/12/12 (水) 17:58
  12 Re: 平均値データに対する回帰直線  青木繁伸  2001/12/12 (水) 19:23
   19 Re^2: 平均値データに対する回帰直線  mmm  2001/12/14 (金) 15:55
    36 Re^3: 平均値データに対する回帰直線  sb812109  2001/12/16 (日) 19:15
     37 Re^4: 平均値データに対する回帰直線  青木繁伸  2001/12/16 (日) 20:53
      40 Re^5: 平均値データに対する回帰直線  sb812109  2001/12/16 (日) 23:48
       60 Re^6: 平均値データに対する回帰直線  mmm  2001/12/18 (火) 12:53
        61 Re^7: 平均値データに対する回帰直線  青木繁伸  2001/12/18 (火) 12:58
         67 Re^8: 平均値データに対する回帰直線  mmm  2001/12/19 (水) 16:13


11. 平均値データに対する回帰直線  mmm  2001/12/12 (水) 17:58
木材の比重と強さの関係を回帰したいのですが,データとしては各樹種の比重・強度の平均値および標準偏差しかありません。これらを散布図として強度-比重関係を作り(X:比重;Y:強度),回帰直線を求めたいのですが,この回帰直線は統計学的に意味を持ちうる(成立する)のでしょうか。各樹種の実験データはそれぞれ異なった分散を持っていることを懸念しております。
どなたか,なにかアドバイスをよろしくお願いします。

     [このページのトップへ]


12. Re: 平均値データに対する回帰直線  青木繁伸  2001/12/12 (水) 19:23
> 木材の比重と強さの関係を回帰したいのですが,データとしては各樹種の比重・強度の平均値および標準偏差しかありません。これらを散布図として強度-比重関係を作り(X:比重;Y:強度),回帰直線を求めたいのですが,この回帰直線は統計学的に意味を持ちうる(成立する)のでしょうか。各樹種の実験データはそれぞれ異なった分散を持っていることを懸念しております。

重み付きの重回帰分析では?
重みは,分散の逆数とか,標本サイズとか考えられると思います。(あ,標本サイズはなしですか)

     [このページのトップへ]


19. Re^2: 平均値データに対する回帰直線  mmm  2001/12/14 (金) 15:55
> 重み付きの重回帰分析では?
統計の方に疎いので見当違いな発言かもしれませんが,ご容赦ください。
実際に行いたいことは,『(1)林業試験場から報告されている国内主要樹種の(比重,強度)データから「国内産木材の(比重,強度)関係における回帰式」を求める。(2)この回帰式を用いてモンテカルロシミュレーションを行う。(3)その結果得られた,例えば5000個のデータを,日本産木材の基準データと考える。(4)その基準データに対し,ある木材の実験値(データにすると30個くらい)が強度的に強いか弱いかを判定する。』というものなのです。
そこで,ご相談しているところの問題が(1)で生じます。各樹種データが平均値でしかないので,そのデータに対する回帰式が信用できるものかどうか,ということなのです。「それらの平均値のもとである全実験値に対して回帰直線を引いた場合と,結果が異なるのではないか?」ということです。これを解決するのに,ご助言いただきました「重回帰分析」が有効なのでしょうか?

     [このページのトップへ]


36. Re^3: 平均値データに対する回帰直線  sb812109  2001/12/16 (日) 19:15
樹種毎に比重と強度の平均値と標準偏差が判っているのでしたら,その平均値と標準偏差からデータを生成したら如何でしょうか。

その際,日本全国に生育する樹種の割合を樹種毎のサンプル・サイズに反映させ日本産木材の基準データとする。そうすれば,平均値の回帰式を介することなく(3)に到達できます。

九州地区の樹種の割合をサンプル・サイズに反映させると比重・強度関係九州版となる(怪しい)。

     [このページのトップへ]


37. Re^4: 平均値データに対する回帰直線  青木繁伸  2001/12/16 (日) 20:53
> 樹種毎に比重と強度の平均値と標準偏差が判っているのでしたら,その平均値と標準偏差からデータを生成したら如何でしょうか。

可能でしょうが,簡単に生成できるのは多次元正規分布に従う場合でしょうが,現実のデータは多次元正規分布にしたがっていないので,実際のデータに近いものを生成するのはかなり難しいのではないでしょうか。

     [このページのトップへ]


40. Re^5: 平均値データに対する回帰直線  sb812109  2001/12/16 (日) 23:48
> ,,,現実のデータは多次元正規分布にしたがっていないので,,,

ご指摘の通りだと思います。

(対処法)非正規性パラメータとでも云ったものを導入し,このパラメータを変化させてシミュレーションを行う。

(結果)ある木材の強度は,基準データに較べて強い場合,弱い場合,ほぼ同じ場合があり,非正規性パラメータの値に依存する,,,。と云うのがオチでしょう。

正直なところ,私だったら,平均値の散布図を描き,回帰直線を引き,新たに得られた木材の実験値をプロットし,散布図をじっと見詰め何らかの知見を得る,と云う方法をとります。一番単純で,それなりに意味はあると思いますが如何でしょうか?

     [このページのトップへ]


60. Re^6: 平均値データに対する回帰直線  mmm  2001/12/18 (火) 12:53
> 正直なところ,私だったら,平均値の散布図を描き,回帰直線を引き,新たに得られた木材の実験値をプロットし,散布図をじっと見詰め何らかの知見を得る,と云う方法をとります。一番単純で,それなりに意味はあると思いますが如何でしょうか?

比重と強度の関係の概略を抑えるだけなら,何も問題はないのかもしれません。しかし,両者の関係が正の相関関係を持つことは,既に良く知られていることなのです。
今,求めたいのが回帰直線の係数だから問題になってくるのです。もともと個々のデータ(各樹種の平均値)が等分散をもっていないので,回帰分析の前提が成立していないという問題です。
アドバイスを頂いて,回帰分析の本を買い込んで少し勉強しました。要は不均一分散の修正として「加重最小二乗法」というのを使えば良いと言うことでしょうか?

     [このページのトップへ]


61. Re^7: 平均値データに対する回帰直線  青木繁伸  2001/12/18 (火) 12:58
> アドバイスを頂いて,回帰分析の本を買い込んで少し勉強しました。要は不均一分散の修正として「加重最小二乗法」というのを使えば良いと言うことでしょうか?

そういうことだと思いますよ。
最初にコメントした,重み付き重回帰分析と同じものです。

     [このページのトップへ]


67. Re^8: 平均値データに対する回帰直線  mmm  2001/12/19 (水) 16:13
早速,回帰分析をやりはじめました。今のところ,数式は誘導したつもりなのですが,いざ解いてみた場合には上手くいってません。もう少し,検討した方がいいようです。
現在考えているのは,強度データ(Y)の分散の逆数で重み付けをする方法なのですが,後続の処理でモンテカルロシミュレーションに回帰直線を使うステップがあるため,Yの分散をXの関数f(x)で表し,1/f(x)で重み付けすることにしました。
ところで,そのモンテカルロシミュレーションの際に,回帰に用いた分布のX平均とY標準偏差というのが必要なのですが,これは重み付けしたX平均,Y標準偏差になるのでしょうか?それとも,単なるX平均,Y標準偏差なのでしょうか?
回帰直線が平均値を通ることを考えると,重み付けされた方を採用しないと辻褄が合わないような気がするのですが・・・。
どうも,重み付け重回帰分析の意味合いがはっきりとは理解できていません。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 017 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る