No.02333 標準化された値でt検定?  【PONY】 2007/01/17(Wed) 10:30

とある会社における数十台の営業車で,エコ運転の実践により
平均燃費に統計的な有意差はあらわれるかをt検定したい場合,
データをどのように扱ってよいかで悩んでいます.

12月はエコ運転なし,1月はエコ運転を実践したとします.
たとえば12月の記録を3台分だけ示すと,

車両A 走行距離 400km 給油 100L 燃費4.0km/L
車両B 走行距離 500km 給油 150L 燃費3.3km/L
車両C 走行距離 600km 給油 200L 燃費3.0km/L
-----------------------------------------------
合計     1,500km ÷  450L  =3.3km/L…(1)

ですが,燃費を平均してしまうと(4.0+3.3+3.0)÷3=3.4km/L…(2)
のように,(1)合計による燃費と,(2)燃費の平均は値が異なります.

「正しい平均燃費」といえば,3.3km/Lの方だと思いますが,
サンプルが一つだとt検定できなくなると思うのですが.
(それ以前に何か大きな勘違いをしていそうな気もしますが・・・)

同じような事例で,
つくばエキスプレスが開通前(1990年)と開通後(2020年)で
沿線市町村の平均人口密度に有意な差があるか,みたいなのもあるかと思います.

結局,
・エコ運転は燃費向上に役立つ!
・つくばエキスプレス開通で人口密度が上がった!
と統計的観点から検証するのには,どうしたらよいのでしょうか?

No.02334 Re: 標準化された値でt検定?  【青木繁伸】 2007/01/17(Wed) 10:40

> 「正しい平均燃費」といえば,3.3km/Lの方だと思いますが

その通り。走行距離が違うので,重み付け平均値を求める必要があるのですね。

では正し検定方法はということになれば,車によって条件が異なるが,エコ運転の有無以外は同じということにすれば,燃費を対象にして,対応のある場合の平均値の差の検定をすると言うことになるのではないでしょうか?

> ・つくばエキスプレス開通で人口密度が上がった!

これは検定の対象にはならない。

No.02375 Re: 標準化された値でt検定?  【PONY】 2007/01/19(Fri) 22:45

青木先生

早速のお返事ありがとうございました.御礼遅くなって大変失礼しました.

> 走行距離が違うので,重み付け平均値を求める必要があるのですね

確かに,ほとんど走っていない車の燃費がいくら向上しても,全体の向上には貢献しませんね.

> 車によって条件が異なるが,エコ運転の有無以外は同じということにすれば,

はい,その前提で実証したいと思っています.

> 燃費を対象にして,対応のある場合の平均値の差の検定をすると言うことになる

すみません,ここでおっしゃる「対応のある場合の平均値」とはどういう概念でしょうか.同じ距離を走った車だけを集めるとか,そういう話でしょうか.

> これは検定の対象にはならない

失礼しました,燃費の例えばかりではわかりにくいかと思いましたが,めちゃくちゃでしたね.

No.02376 Re: 標準化された値でt検定?  【青木繁伸】 2007/01/19(Fri) 22:53

対応のあるt検定は
http://aoki2.si.gunma-u.ac.jp/lecture/Average/paired-t-test.html
を参照

対応のあるデータとは,同じ車について12月と1月の燃費データをそろえること
できれば,車が同じというだけではなく,ドライバーも同じでエコ運転するかしないか以外の運行状況も同程度だとよいのだが。
このように整理すれば,12月のデータと1月のデータの比較が,エコ運転するかどうかの比較になるのがわかるでしょう。

   12月  1月
A車 ○○  ○○
B車 ○○  ○○
C車 ○○  ○○
:

No.02413 [御礼]Re: 標準化された値でt検定?  【PONY】 2007/01/23(Tue) 09:32

青木先生

またまた御礼が遅れてすみません.

>できれば,車が同じというだけではなく,ドライバーも同じでエコ運転するかしないか以外の運行状況も同程度だとよい

厳密にはそうですが,極力アドバイスのように配慮して「対応のあるt検定」を試みたいと思います.

たびたびのご教示ありがとうございました.

● 「統計学関連なんでもあり」の過去ログ--- 040 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る