★ Excel の分析ツール ★

 189 Excel の分析ツール  青木繁伸  2002/12/13 (金) 13:06
  229 Re: Excel の分析ツール  韮澤  2002/12/16 (月) 14:25
   231 Re^2: Excel の分析ツール  青木繁伸  2002/12/16 (月) 16:04
    261 Re^3: Excel の分析ツール  韮澤  2002/12/19 (木) 12:21
     262 Re^4: Excel の分析ツール  青木繁伸  2002/12/19 (木) 13:08


189. Excel の分析ツール  青木繁伸  2002/12/13 (金) 13:06
掲示板でも Web ページでも,Excel において,原点を通る直線回帰のときの分散分析表や R^2 が間違っていることは指摘済みですが,そこから容易に類推できることではあるものの,定数項を含まない(原点を通る)重回帰分析の場合の分散分析表や R^2 も間違えていることを,改めて確認しました。全く怖いことだ。

     [このページのトップへ]


229. Re: Excel の分析ツール  韮澤  2002/12/16 (月) 14:25
EXCELの関数異常について,便乗して報告しておきます。
confidenceという平均値の区間推定を一発で返すという便利な関数があるのですが,帰ってくる答えが変です。Helpを見る限り計算式は,t分布を使った普通の式なのですが,答えは不一致になります。EXCELのt分布自体が精度が悪いという問題もありますが,それとは,また別の問題ですし,σの計算にnを使うかn-1を使うかという様な小さな誤差でもありません。
これを見つけてからは,高級な関数は使わず,自力で低レベルの関数の組合せる様に心がけています。

     [このページのトップへ]


231. Re^2: Excel の分析ツール  青木繁伸  2002/12/16 (月) 16:04
http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/part5.html#confidence
に書いてあるように,「母分散が既知の場合における,母平均値の信頼区間の幅の 1/2 を返します」。MS Excel Help の応用例を見れば,この説明は間違っていません。
ただし,問題は,統計学を少しでも知っている人が confidence という関数を見たら,信頼限界値を直接返してくれると思うわけです。help なんか,見ない。そもそも,help なんか見なくても,期待されている結果を返すべきなんですが。

Excel が悪いというのは,実装面で精度に問題がある場合と,ユーザインターフェースで行き違いがある場合との両方があることです。
confidence が返す値を何にするかという,設計を間違えているわけです。
そもそも,Excel の関数は一価関数であるのでやむを得ないともいえますが。

     [このページのトップへ]


261. Re^3: Excel の分析ツール  韮澤  2002/12/19 (木) 12:21
> http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/part5.html#confidence
> に書いてあるように,「母分散が既知の場合における,母平均値の信頼区間の幅の 1/2 を返します」。MS Excel Help の応用例を見れば,この説明は間違っていません。
> ただし,問題は,統計学を少しでも知っている人が confidence という関数を見たら,信頼限界値を直接返してくれると思うわけです。

ご指摘ありがとうございました。
MicrosoftのHELPをよ〜く読むと,確かに母分散がわかっている場合の正規分布を使った計算を説明していますね。しかし,使用例を見ると
「郊外に住む会社員 50 人を標本として,通勤時間を調査したところ,片道の平均時間が 30 分で,母集団の標準偏差は 2.5 になりました。」
この例で,母分散が既知であると,言えるのでしょうか? 困ったものです。

     [このページのトップへ]


262. Re^4: Excel の分析ツール  青木繁伸  2002/12/19 (木) 13:08
「母集団の標準偏差は 2.5 になりました」はまずいですね。

バージョン不明の confidence 関数の HELP

CONFIDENCE(alpha,standard_dev,size)

Returns the confidence interval for a population mean. The confidence interval is a range on either side of a sample mean. For example, if you order a product through the
mail, you can determine, with a particular level of confidence, the earliest and latest dates the product should arrive.

Alpha is the significance level used to compute the confidence level. The confidence level equals 100(1 - alpha)%.

Standard_dev is the population standard deviation for the data range, and is assumed to be known.

Size is the sample size.

Example

For an example of this function, see CONFIDENCE in the Microsoft Excel Function Reference.

See Also

Help

ZTEST Returns the two-tailed P-value of a z test.

List of Statistical Functions

英語の段階で既におかしな説明になっている。
さらに,それを和訳するときに間違いが入り込んでいる。

     [このページのトップへ]


● 「統計学関連なんでもあり」の過去ログ--- 022 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る