「統計学関連なんでもあり」の過去ログ---032

★ 平均の平均 ★

5593.　平均の平均　カト　2005/01/21 (金) 15:17
├5595.　Re: 平均の平均　Hi☆Rose　2005/01/22 (土) 12:47
└5594.　Re: 平均の平均　青木繁伸　2005/01/21 (金) 18:00
　└5596.　Re^2: 平均の平均　カト　2005/01/22 (土) 15:38
　　├5654.　Re^3: 平均の平均　太郎　2005/01/25 (火) 09:14
　　│└5662.　Re^4: 平均の平均　カト　2005/01/25 (火) 17:01
　　│　└5666.　Re^5: 平均の平均　TY　2005/01/25 (火) 19:47
　　└5642.　Re^3: 平均の平均　太郎　2005/01/24 (月) 18:01
　　　└5645.　Re^4: 平均の平均　カト　2005/01/24 (月) 20:37

5593.　平均の平均　カト　　2005/01/21 (金) 15:17

　ポット植物を使用し，各処理区における病害の違いを病気を起こした葉の面積で比較しています。装置の限界があるため反復をあまり多くできず，4処理区あった場合は9植物体位を使っています。しかし，処理区内における値のバラツキが大きく，分散分析をクリアしなかったり，各処理区の標準偏差が大きく有意差を示しません。
（具体的には，
A＝280　96　112　282　49　121　85　364　43　
B＝88　39　28　75　46　59　45　49　40　
C＝104　113　66　165　296　17　86　101　
D＝114　53　113　187　144　77　327　74　151という具合です。）
　そこで，これらの値を底2のlogに変換して統計処理を行ったら処理AとB間には有意差が出ました。しかし，先生からは桁が2個や3個違うわけでもないのにlogで処理するのはおかしいと言われました。
　先輩たちは，9植物体あった場合はそれを処理を行う前に3グループに分け，そのグループを反復と呼び，1反復に3植物体あるとしてこの植物体からの平均値を反復の値とし，処理区の平均と標準偏差をとっているようです（n＝3）。
　その時，平均値は結局同じ値なのですが標準偏差はn＝9でとるよりはるかに小さくなり，処理区間で有意さが出るようになります。しかし，このとき各反復内での植物体のばらつきは全く無視されているため，自分もこの方法で結果を出していいのか疑問があります。
　反復＝3，1反復＝3植物体　というように表記しておけばこのようなやり方でも有意差があると言っていいのでしょうか？統計には素人なため分かりません。誰かアドバイスをいただけるとありがたいです。

　　　　　[このページのトップへ]

5595.　Re: 平均の平均　Hi☆Rose　　2005/01/22 (土) 12:47

> 　先輩たちは，9植物体あった場合はそれを処理を行う前に3グループに分け，そのグループを反復と呼び，1反復に3植物体あるとしてこの植物体からの平均値を反復の値とし，処理区の平均と標準偏差をとっているようです（n＝3）。
先輩方のやっておられるのは例えば時期をずらしてそれぞれの時期で3株づつとか青木先生のおっしゃったように3株が同じ鉢に植えてあったとかの時ではないでしょうか。もしくは統計的にはおかしいが，その分野では通例，用いられている可能性もないことはないと思いますが，，，こういうことは各分野にあることだと思います。まぁ今回の場合はあまりにも無茶だと思いますが。。。例えば極端な話，あらかじめグループ内の平均を求めておいて，できるだけその平均からの分散が小さくなるようなグループ分けをすることも可能なわけですから，，，
　ちなみにクラスカル・ウォリス検定とはhttp://aoki2.si.gunma-u.ac.jp/lecture/Average/kwtest.html

　　　　　[このページのトップへ]

5594.　Re: 平均の平均　青木繁伸　　2005/01/21 (金) 18:00

> 先生からは桁が2個や3個違うわけでもないのにlogで処理するのはおかしいと言われました。

対数変換は「オーダーが2，3違うときにやるもの」ではありません。
理論的根拠を伴わない変数変換はやるべきではない。

> 　先輩たちは，9植物体あった場合はそれを処理を行う前に3グループに分け，そのグループを反復と呼び，1反復に3植物体あるとしてこの植物体からの平均値を反復の値とし，処理区の平均と標準偏差をとっているようです（n＝3）。

そのようなやり方も明らかにおかしい。例えば同じ植木鉢に3株植わっているからということならそのようなやり方もあるのかもしれないが，データを得た後で適当に二つずつまとめたり三つをまとめたりでは恣意的以外の何物でもない。

データを採って，検定して，必ず有意にならないといけないというものではない。
実験の弱点は素直に考察すればいいだけでしょう。

なお，挙げられたデータで，C群のみ8個のデータですが，それで正しいとして，クラスカル・ウォリス検定すると
Statistics(Chi-sq. value) d.f. 　　　　　 P value
11.597461552 3.000000000 　　 0.008897337
で有意になっているんですが？？それではだめなんですか。

　　　　　[このページのトップへ]

5596.　Re^2: 平均の平均　カト　　2005/01/22 (土) 15:38

> 例えば同じ植木鉢に3株植わっているからということならそのようなやり方もあるのかもしれないが，

　ここでのやり方は上記のようなやり方でも，Hi Roseさんの言われるような時期をずらしてやっているというようなものではなく，ただ単に標準偏差を小さくすることを目的としてやっているようです。
　
　
> クラスカル・ウォリス検定すると
> Statistics(Chi-sq. value) d.f. 　　　　　 P value
> 11.597461552 3.000000000 　　 0.008897337
> で有意になっているんですが？？それではだめなんですか。
　
　等分散性が破棄されたときや，水準間でサンプルのばらつきが大きい時には，クラスカル・ウォリス検定を行えばいいということは知りませんでしたので今後参考にさせて頂きます。
　また，Hi Roseさんの言われるようにこの分野ではよく行われていることかも知れないので調べてみたいと思います。
　
　お二人ともありがとうございました。

　　　　　[このページのトップへ]

5654.　Re^3: 平均の平均　太郎　　2005/01/25 (火) 09:14

>言われるようにこの分野ではよく行われていることかも知れない
　この部分は，青木先生の以下のコメントにもあるように間違いであることは明らかです。
　私がいいたいのは，そのようなことがこの分野でよく行われているとしたらとんでもないことであるわけですが，そんなことはありえないということです。変な指摘をまにうけないようにしましょう。
　
>そのようなやり方も明らかにおかしい。例えば同じ植木鉢に3株植わっているからということならそのようなやり方もあるのかもしれないが，データを得た後で適当に二つずつまとめたり三つをまとめたりでは恣意的以外の何物でもない。

　　　　　[このページのトップへ]

5662.　Re^4: 平均の平均　カト　　2005/01/25 (火) 17:01

　何度もご返事ありがとうございます。
　
>データを得た後で適当に二つずつまとめたり三つをまとめたりでは恣意的以外の何物でもない。
　
　ただ今回この掲示板に質問させていただいたのは私が既に行った結果に手を加えるためではなく，私のバラツキが激しい結果に対してこのグループ分けするやり方を今後はやって行った方良いというアドバイスを研究室の人から受けたけれども，果たしてこのやり方は認められるのかと言う疑問があった為，自分がこの方法を使う前にこの疑問をクリアにしたかった為です。
　今回皆さんから言われたように統計的には明らかにおかしく，また，植物を扱う分野の通例でもないと指摘をうけましたので，どうしておかしいか（何故このポット試験に完全無作為化法を適用してはいけないのか？など）について納得いく説明ができるかどうか分りませんが，先生をはじめ研究室のメンバーにこのグループ分けするやり方は統計学的に認められないと言う事を伝えたいと思います。

　　　　　[このページのトップへ]

5666.　Re^5: 平均の平均　TY　　2005/01/25 (火) 19:47

横レスですが，

> 　何故このポット試験に完全無作為化法を適用してはいけないのか？

処理について完全に無作為化されているとみなすならば，完全無作為化法の適用と言って良いのではないでしょうか。

> 完全無作為化法でランダムにブロックを選んだとし，処理前に分けた植物はそのランダムに選ばれたそれぞれのブロック内にあったものとして

「ブロックを結果を見てから作る」解析をされたならば，それは，幻のブロック効果を生み出すだけなので，ナンセンスだと思います。
事前にブロックが存在していたならば，ブロックをモデルに入れても良いと思います。

実験の構造がどのようになっているか考察・議論することから始めてはいかがでしょうか。

　　　　　[このページのトップへ]

5642.　Re^3: 平均の平均　太郎　　2005/01/24 (月) 18:01

>この分野ではよく行われていることかも知れないので調べてみたいと思います。
　
　私はその分野に近い分野（主として植物実験）の者ですが，そのようなことがよく行われているということはないと思います。少なくとも聞いたことがありません。

　ただし，乱塊法実験などの場合で，草丈や茎径などについて各ブロック内にある数株の平均値をブロックの代表値として用いるということはあります。

　それと，各処理のデータを等分散化するために変数変換を行うという行為については下記などを参考に行えば問題ないと思います。

　http://www2.kobe-u.ac.jp/~inaba/sqc/pdf/l200051.pdf

　　　　　[このページのトップへ]

5645.　Re^4: 平均の平均　カト　　2005/01/24 (月) 20:37

> 　ただし，乱塊法実験などの場合で，草丈や茎径などについて各ブロック内にある数株の平均値をブロックの代表値として用いるということはあります。

　研究室の助手の先生にこの実験方法について聞いたところ，「この実験法は人工気象器内で育った植物は，圃場で言うと均一な地力の圃場で育ったことになるために，完全無作為化法でランダムにブロックを選んだとし，処理前に分けた植物はそのランダムに選ばれたそれぞれのブロック内にあったものとして行ったいる。」ということでした。そのため，グループ内の植物の平均がそれぞれのブロック内の平均に値し，そして，その平均を取ることで全体の平均としているということです。
　
　ここで問題なのが，ポット試験と圃場試験を同じ扱いにしていいのかということです。確かに母集団全体の測定ができない場合は，測定値から群平均をだし，その郡平均を平均して母平均としています。
　もしかして，統計の一番基本の事なのかもしれませんが，森林の木を測定するような母集団中の個体数が把握できない，または母集団全体の測定が不可能な場合と，ポットやシャーレなどを使って行う個体数がはじめから限られている場合での統計の扱いの違いについてどなたかアドバイスをいただけるとありがたいです。よろしくお願いします。

　

　　　　　[このページのトップへ]