平均値の信頼区間(母分散が既知の場合の母平均の区間推定)

母分散が既知の場合・・・統計学の教科書によく出てくる表現だと思います。でも、母分散がすでに分かっているリハビリテーション研究は非現実的であり得ません。

\(\bar{X}\): 標本の平均(いわゆるデータの平均値)

\(\mu\): 母集団の平均値(この信頼区間を推定する)

\(\sigma^2\): 母集団の分散(この母分散が既知)

標本 \(x_1, \cdots , x_n\) が、それぞれ同じ正規分布 \(N(\mu,\, \sigma^2)\) から独立に抽出されたことを前提として(i.i.d.)、その標本を 確率変数 \(X1, \cdots , X_n\) とします

この場合、以下のことが成り立ちます

期待値:\(E(\bar{X})=E(\dfrac{1}{n} \Sigma (X_k))=\dfrac{n\mu}{n}=\mu\)\(\qquad(k=1,2, \cdots,n)\)

分散:\(V(\bar{X})=V(\dfrac{1}{n} \Sigma (X_k))=\dfrac{1}{n^2}V(\Sigma (X_k))=\dfrac{n\sigma^2}{n^2}=\dfrac{\sigma^2}{n}\)\(\qquad(k=1,2, \cdots,n)\)

したがって、\(\bar{X} \sim N(\mu. \, \dfrac{\sigma^2}{n})\) となる

標本平均\(\bar{X}\)を標準化した値 \(Z\)

\(Z=\dfrac{\bar{X}-\mu}{\sqrt{\dfrac{\sigma^2}{n}}} \, \, \sim N(0, \, 1) \)

ここで重要なことは・・・

  • 母集団の平均値\(\mu\)は未知
  • 母集団の分散\(\sigma^2\)は既知

ここで私が作った架空の例題を提示します。ありえない例題ですがご了承ください。

例題(脳血管障害患者を対象とした回復期病棟入棟時FIM得点調査に関する例題)
地域A内からランダムに30名の入棟時FIM得点を調べた結果、平均が76点であった。地域AのFIM得点の分散が20と仮定した場合の95%信頼区間を推定してみましょう。

\(n=30\)

\(\sigma^2=20\)

\(\bar{X}=76\)

\(Z\)(≒1.96)は標準正規分布の確立密度関数から求めるのですが、Rを使えば qnorm(0.025, lower.tail=F) で簡単に求めることができます

これらの値を標準正規分布の式にあてはめることで信頼区間が算出できます

\(\mu=\bar{X} \pm Z\sqrt{\dfrac{\sigma^2}{n}}\)

z <- qnorm(0.025, lower.tail=F)
76 + c(-1, 1)*z*sqrt(sqrt(20/30))

95%信頼区間は74~78となりました

地域Aで同じ調査を繰り返して実施した場合、100回中95回(信頼度95%)はFIM得点が74~78点の範囲に含まれることが推定されました

コメント欄 『間違い』や『分かりにくい部分』などのご意見もお寄せください

タイトルとURLをコピーしました