例題:
「表 1 のように,4 群のサンプル数,平均値,標準偏差(不偏分散の平方根)が計算されている。これから,全体の(4 群をこみにした)平均値,標準偏差を求めなさい。」
都道府県数 | 平均値 | 標準偏差 | |
---|---|---|---|
第1群 | 8 | 135.83 | 19.59 |
第2群 | 11 | 160.49 | 12.28 |
第3群 | 22 | 178.35 | 15.01 |
第4群 | 6 | 188.06 | 9.81 |
計算手順:
\[ \bar{X}_i = \frac{\displaystyle\sum_{j=1}^{n_i} X_{ij}}{n_i} \] \[ U_i = \frac{\displaystyle\sum_{j=1}^{n_i} \left (X_{ij}-\bar{X}_i \right )^2}{n_i-1} \]
\[ n_t = \sum_{i=1}^k n_i \] 例題では,$n_t = 8 + 11 + 22 + 6 = 47$
\[ \bar{X}_t = \frac{\displaystyle\sum_{i=1}^k n_i\ \bar{X}_i}{n_t} \] 例題では,$\bar{X}_t= \displaystyle\frac{8\cdot135.83 + 11\cdot160.49 + 22\cdot178.35 + 6\cdot188.06}{47} ≒ 168.17212$
\[ U_t = \frac{\displaystyle\sum_{i=1}^k \left (n_i-1 \right )\ U_i + \displaystyle\sum_{i=1}^k n_i\left (\bar{X}_i-\bar{X}_t \right )^2}{n_t-1} \] 表 1 には標準偏差が与えられていることに注意して,例題では $U_{t} = \displaystyle\frac{ 7\cdot19.59^{2} + 10\cdot12.28^{2} + 21\cdot15.01^{2} + 5\cdot9.81^{2} + 8\cdot( 135.83 - 168.17212)^{2} + 11\cdot( 160.49 - 168.17212)^{2} + 22\cdot( 178.35 - 168.17212)^{2} + 6\cdot( 188.06 - 168.17212)^{2}}{46} = 501.657385$
よって,全群をこみにしたときの標準偏差は 501.657385 の平方根をとって 22.3977094 である。
R による計算例
> n <- c(8, 11, 22, 6) > M <- c(135.83, 160.49, 178.35, 188.06) > SD <- c(19.59, 12.28, 15.01, 9.81) > $U$ <- SD^2 > nt <- sum(n) > Mt <- sum(n*M)/nt > Ut <- (sum((n-1)*U)+sum(n*(M-Mt)^2))/(nt-1) > SDt <- sqrt(Ut) > cat(nt, Mt, Ut, SDt, sep=", ") 47, 168.1721, 501.6574, 22.39771 関数にすると > func <- function(n, M, U) + { + nt <- sum(n) + Mt <- sum(n*M)/nt + Ut <- (sum((n-1)*U)+sum(n*(M-Mt)^2))/(nt-1) + SDt <- sqrt(Ut) + cat(nt, Mt, Ut, SDt, sep=", ") + } > n <- c(8, 11, 22, 6) > M <- c(135.83, 160.49, 178.35, 188.06) > SD <- c(19.59, 12.28, 15.01, 9.81) > func(n, M, SD^2) 47, 168.1721, 501.6574, 22.39771
演習問題:
応用問題: