中心極限定理

・母集団の分布がどのような分布であっても、無作為抽出した標本における和の分布は、標本の大きさnが大きいときに正規分布に収束する


   = 母集団の分布がどのような分布であっても、無作為抽出した標本における標本平均の分布は、標本の大きさnが大きいときに正規分布に収束する。

表の確率1/3のコインでの実験

このコインを数千回投げる実験です

投げる枚数を徐々にふやして表が出る枚数の平均値を求めます

でも実際に投げるのは大変なので、2項分布を利用して数千回投げた場合の表の出る確率を求めます

実験1) 1枚のコインを数千回投げた場合に表が0枚, 1枚となる確率

x<-c()
s<-0
q<-1
for(i in s:q)x <-c (x, i)  #空のベクトルx()にiをくっつける ベクトルX=c(0, 1)の完成

# x
# 0 1

確率 1313 に従う二項分布より確率を求める

n<-1  #コインを1枚投げた場合
p<-1/3 # 表の出る確率
x1 <- choose(1, x)*(p^x)*(1 - p)^(n - x)  #表が0枚, 1枚となる確率
#累積確率
cumsum(x1)
#グラフを描く
barplot(x1, space=c(0.5), names.arg=c("0枚", "1枚"))

実験2) 2枚のコインを数千回投げた場合に表が0枚, 1枚, 2枚 となる確率

x <- c()
s <- 0
q <- 2
for(i in s:q)x <- c(x, i)  
x2 <- choose(2, x)*(p^x)*(1 - p)^(n - x)
cumsum(x2)
barplot(x2,space=c(0.5),names.arg=c("0枚", "1枚","2枚"))
#二項分布を示している

実験3) 5枚のコインを数千回投げた場合に表が0・・・5枚 となる確率

x <- c()
s <- 0
q <- 5
for(i in s:q)x <- c(x, i)  
x3 <- choose(5, x)*(p^x)*(1 - p)^(n - x)
cumsum(x3)
barplot(x3,space=c(0.5),names.arg=c("0枚", "1枚","2枚","3枚","4枚","5枚"))

実験4) 10枚のコインを数千回投げた場合に表が0・・・10枚 となる確率

x <- c()
s <- 0
q <- 10
for(i in s:q)x <- c(x, i)  
x4 <- choose(10, x)*(p^x)*(1 - p)^(n - x)
cumsum(x4)
barplot(x4, space=c(0.5), names.arg=c(0:10))
#「表が出る枚数の平均値」が正規分布に10/3 の付近に収束していることが理解できる

実験5) 100枚のコインを数千回投げた場合に表が0・・・100枚 となる確率

x <- c()
s <- 0
q <- 100
for(i in s:q)x <- c(x, i)  
x5 <- choose(100, x)*(p^x)*(1 - p)^(n - x)
cumsum(x5)
barplot(x5, space=c(0.5), names.arg=c(0: 100))
#「表が出る枚数の平均値」が100/3に収束して、正規分布を示している。

実験で描いたグラフ

par(mfrow = c(2,3))
barplot(x1, space=c(0.5), names.arg = c("0枚", "1枚"), main="実験1")
barplot(x2, space=c(0.5), names.arg = c("0枚", "1枚","2枚") , main="実験2")
barplot(x3, space=c(0.5), names.arg = c("0枚", "1枚","2枚","3枚","4枚","5枚"), main="実験3")
barplot(x4, space=c(0.5), names.arg = c(0:10), main="実験4")
barplot(x5, space=c(0.5), names.arg = c(0:100), main="実験5")
par(mfrow = c(1, 1))
f:id:yoshida931:20220323234951p:plain

参考) 西内 啓; 統計学が最強の学問である[実践編]

コメント

タイトルとURLをコピーしました