平均、分散、不偏分散

(2, 3, 6, 7, 10) の平均と分散

5つのデータ(2, 3, 6, 7, 10)の平均値や分散について解説します。

$x_i ( i=1, 2, 3, 4, 5 )$

$x_i =\{2, 3, 6, 7, 10\} $

R
x <- c(2, 3, 6, 7, 10)
View(x)

平均

$\overline{x_i}=\dfrac{\sum_{i=1}^{n}(x_i)}{n}$

R
sum(x) / length(x)
R
#Rの関数
mean(x)

二乗平均

$\dfrac{\sum_{i=1}^{n}(x_i^2)}{n}$

R
mean(x^2) 

分散

$\dfrac{\sum_{i=1}^{n}(x_i-\overline{x_i})^2}{n}$

$\dfrac{\sum_{i=1}^{n}x_i^2}{n}-\overline{x_i}^2$

R
sum((x - mean(x))^2) / length(x)
sum(x^2) / length(x) - (mean(x))^2

不偏分散

R
var(x)

注意)Rの関数varは不偏分散なので、標本分散を求める場合は以下のようになります

R
var(x)*(length(x)-1)/length(x)

標準偏差

$\sqrt{x_iの分散}$

R
sqrt((1/length(x))*sum((x-mean(x))^2))
sqrt(sum(x^2) / length(x) - (mean(x))^2)

注意)Rの関数 sd は不偏標準偏差なので、標準偏差を求めるためには以下のようになります

R
sd(x)*sqrt((length(x)-1)/length(x))

色々な平均値

算術平均(相加平均):最も一般的な平均で、すべての数値の合計をその数の個数で割ることで計算されます。
幾何平均:数値の積の n 乗根です。R言語で幾何平均を計算する際には、自然対数の算術平均を求め、その平均の指数を取ることで幾何平均を求めます。正の数値に適用され、比率や成長率を表すデータに適しています。
調和平均:逆数の算術平均の逆数として計算されます。速度や比率の平均を求めるのに適しています。
加重平均:各データ点に重み(重要度や頻度など)をつけて平均を取ります。
刈り込み平均:極端な値を両端から除外してから平均を計算します。

R
#算術平均
mean(x)
#幾何平均
exp(mean(log(x)))
#調和平均
length(x) / sum(1/x)
#加重平均, 重みw <- c(1, 2, 3, 2, 1)の場合
w <- c(1, 2, 3, 2, 1)
weighted.mean(x, w)
#刈り込み平均, trimは両端からそれぞれ刈り取る割合(0~1)
mean(x, trim = 0.2)

コメント欄 『間違い』や『分かりにくい部分』などのご意見もお寄せください

タイトルとURLをコピーしました