例えば,ある生産ラインにおいて,毎日の不良率のデータがある。これを例えば1ヶ月の平均不良率とその標準偏差として求めたいということですか?

不良率は二項分布に従うので,毎日の不良率を角変換してから平均値と標準偏差を求めるという,あなたの考え方は正しいとも言えるしある場合は不適切です。

あなたの問題と似ているものとして,対数正規分布に従うデータの平均値と標準偏差を求めるということがあります。その手順は,まず対数正規分布のデータの対数をとって平均値(これは算術平均値これを m とする)と標準偏差(sとする)を求める。次に,m を逆対数変換すると幾何平均(g とする)になります。しかし,同時に標準偏差を逆対数変換したものを w としましょう。さて,標準偏差の利用目的はいろいろありますが,データの大部分が存在する区間の目安を与えるという場合を考えてみましょう。しかし,例えば,データの95%が存在するだろう範囲を g±1.96w のようには決められないです。その範囲は,m と s を使って,m±1.96s を求め得られた数値を逆変換します。つまり exp(m±1.96s) なので exp(m) *exp(1.96s) と exp(m)/exp(1.96s)となるわけです。

以上のことを考え合わすと,あなたの考え方の最初の方は正しいです。しかし,そのようにして求めた平均値は,もとの母不良率と同じ単位ではない。元に戻さないといけない。つまり,求めた平均値の逆角変換をして,不良率の単位に戻さないといけない。しかし,平均値を逆角変換するのには意味がありますが,標準偏差を逆変換するのは意味がない。というか,平均値±標準偏差というような標記・考え方にはなじまない。逆角変換というのもめんどくさい。

> 変数変換しなくても、平均、標準偏差を計算できるのでしょうか?

角変換しなくてはならないというのは,比率データの分散分析(要するに平均値の差の検定)をするときに,例えば,ある薬を投与した場合としない場合に母犬の産んだ仔犬の先天奇形発生率などは二項分布に従いますが,その分散は発生率に従属なので,分散分析の前提を満たさなくなってします。そこで,角変換すれば,その前提が満たされるようになると言うことです。

もし,分散分析などやるつもりはない,単に平均値と標準偏差を知りたいというなら,角変換など不要です。むしろ,そのまま平均値と標準偏差を計算した結果の方が利用しやすいでしょう。