No.16544 0を含むデータの対数変換  【abc】 2012/02/29(Wed) 04:12

再度失礼します。

私が扱っているデータは0を多く含んでいます。データを解析する際に以下のような処理を行っているのですが,統計的に正しいでしょうか?また,どのようなメリットやデメリットが生じると思いますか?

A, Bというデータ群があります。これらのデータ群は0の値を多く持っています(0以外は正数をもちます)。これらを対数変換します。そのためには0の値が邪 魔なので全てのデータに1を加えます。その後に,データを対数変換します(データの分布が正規分布になっているというわけではありません)。そして, boxplotなどを作成しデータ群AとBを比較しています。

以上の処理です。私の研究分野の論文でもおそらくは同じ処理をしていると思うのですが,その有効性を理解せずただ真似をしていました。私が思うにboxplot解析においては0以外のデータの分布が寄るので見やすくなっているのだと思いますが。

コメントをどうぞよろしくお願い致します。

No.16545 Re: 0を含むデータの対数変換  【青木繁伸】 2012/02/29(Wed) 09:40

別に正規分布にするために変換する訳ではないというけれど,
Box-Cox 変換
http://aoki2.si.gunma-u.ac.jp/R/Box-Cox-transformation.html
あたりも検討してみるとか...

No.16546 Re: 0を含むデータの対数変換  【abc】 2012/02/29(Wed) 15:18

返信ありがとうございます。

Box-Cox変換,試してみたいと思います。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る