検定ですのでサンプルサイズが変われば結果は変わります
5人中4人が転倒する確率は $P(X=4) + P(X=5)$ を求めることになります
dbinom(
x=4, size=5, prob=0.253) +
dbinom(
x=5, size=5, prob=0.253
)
Rの関数を使用します
pbinom(
3, size=5, prob=0.253,
lower.tail=F
)
やっぱり有意水準のみで検討することはよくありませんね。サンプルサイズや95%信頼区間などを考慮して結果をみんなで議論しましょう。
下側検定
ここからは例題が変わります。今度は私が想定した「10名中1名が転倒経験のあるT町」について考えます。実存しない架空の例題です。
例題 2 「85歳以上」では25.3%と4人に1人の割合で転倒することが報告されています(内閣府)。この確率25.3%を転倒が起こる確率、つまり目的としている結果が起こる確率 pとして進めます。T町に在住する85歳以上の高齢者から無作為に選んだ10名に調査した結果、1名が転倒経験ありという結果だった。T町の転倒割合は、全国割合(25.3%)より小さいと言えるか、有意水準5%で検証せよ。 ・帰無仮説:T町の転倒割合は、全国割合(25.3%)に等しい ・対立仮説:T町の転倒割合は、全国割合(25.3%)より小さい
ある比率より小さいことを実証した場合には、下側検定を実施します(ここ重要)
もうお分かりかと思いますが、以下の青色部分の検定になります
検定をしなくても確率関数のグラフからP値は0.2より大きくなることがわかります
つまりT町の転倒割合は、全国割合(25.3%)より小さいとは言えません
Rを使って求めてみます
binom.test(
x=1, n=10, p=0.253,
alternative="less"
)
下側検定なので alternative = “less”
P値=0.237で、やはり有意な結果は得られませんでした
P値
上述した検定結果のP値のみを算出する場合
pbinom(
q=1, size=10, prob=0.253,
lower.tail=T
)
転倒割合は10%のままで、サンプルサイズと転倒回数を増やしてみましょう
これは少し多めにしないとp値は小さくならないでしょう…n=40、転倒4回くらいでどうでしょうか
t <- 0:40
p <- dbinom(
x=t, size=40, prob=0.253
)
barplot(
p~t, pch=16, xlab="", ylab=""
)
これはp<0.05になっているのではないでしょうか
pbinom(
q=4, size=40, prob=0.253,
lower.tail=TRUE
)
有意になりました
サンプルサイズを増やすことが重要なのはよく分かるのですが、忙しいリハ業務のなかでサンプルサイズは簡単に増やせませんよね・・・?。だから、サンプルサイズの小さい研究では、95%信頼区間がより重要になります。
両側検定
95%信頼区間の前に両側検定について架空の例題で説明しておきます。
Rでは両側検定がデフォルト設定になっています
つまり、何も指定しなければ両側検定になります(alternative = “two.sided” )
例題 3 U町に在住する85歳以上の高齢者から無作為に20名抽出して調査した結果、7名が転倒経験ありという結果だった。T町の転倒割合は、全国割合(25.3%)とは異なることを証明したい。 ・帰無仮説 T町の転倒割合は、全国割合(25.3%)に等しい ・対立仮説 T町の転倒割合は、全国割合(25.3%)とは異なる
Rでやってみましょう
まず、確率分布のグラフを描いておきます
t <- 0:20
p <- dbinom(
x=t, size=20, prob=0.253
)
barplot(
p~t, pch=16, xlab="", ylab=""
)
二項検定を行います
alternative = “two.sided” はデフォルトなので書く必要はありませんが、間違うこともありますので、丁寧に記載しておきましょう
binom.test(
x=8, n=20, p=0.253,
alternative="two.sided"
)
P=0.1943で帰無仮説は棄却できません
したがって全国平均とは有意に異なることが言えませんでした
このP値の求め方を勉強しましょう
両側検定のP値を求めるための3つの方法
その1
P値の2倍(上側検定または下側検定の小さい方のp値を使用する)
pbinom(
q=7, size=20, prob=0.253,
lower.tail=FALSE
)*2
$q=7$となるので注意してください
lower.tail = FALSEなのでq ≦ 7を含まない、つまりq ≧8となります (離散型)
その2
|期待値ー観測された割合|以上となる確率の合計
期待値:\(np = 20*0.253 = 5.06\)
\((|k – 5.06|) ≧ (|8-5.06|) =2.94 \)となる\(P(k)\)
\(k = 8, 9, …, 20\)
\(k = 2, 1, 0\)
pbinom(
q=7, size=20, prob=0.253,
lower.tail=FALSE) +
pbinom(
q=2, size=20, prob=0.253,
lower.tail=TRUE
)
lower.tail = TRUEの場合、なのでq≦3を含む、つまりq≦3となります
コメント欄 『間違い』や『分かりにくい部分』などのご意見もお寄せください