対応のあるt検定

両側検定

対立仮説1(\(\mu \neq 0 \))を有意水準5%で検定してみましょう

自由度9のt分布

R
#グラフ
x <- seq(-5, 5, length=100)
plot(
    x, dt(x, 9), type = "l",
    xlim=c(-5, 5), ylim=c(0, 0.4),
    xlab="", ylab="", xaxt="n"
)

t <- mean(sa)/sqrt(var(sa)/length(sa))
lines(c(t, t), c(-1.5, dt(t, 9)))
axis(side=1, at=t)

有意水準5%なので右側の面積 $<0.025$ であれば両側検定で帰無仮説が棄却できます.右側の面積が $<0.025$ の部分を青色で塗りつぶしてみましょう.

R
#グラフ
x <- seq(-5, 5, length=100)
plot(
    x, dt(x, 9), type = "l",
    xlim=c(-5, 5), ylim=c(0, 0.4),
    xlab="", ylab="", xaxt="n"
)

q = qt(0.025, 9, lower.tail=F)
p <- seq(q, 5, length=100)
y <- dt(p, 9)
polygon(c(p,rev(p)), c(rep(0,length(p)), rev(y)), col="#72C6EF")

t <- mean(sa)/sqrt(var(sa)/length(sa))
lines(c(t, t), c(-1.5, dt(t, 9)))
axis(side=1, at=t)

2.21は棄却域には入っていないようなので、p値は0.05より少し大きい値となっていることが予想できます

Rの関数で確認してみましょう

R
#再掲
t.test(sa)

t値は2.21でp値は0.055です.p>0.05で有意差なし・・・という結果になりました.

p値

上記の検定は両側検定でした.したがって求めたp値は両側の裾の面積になります.

R
x <- seq(-5, 5, length=100)
plot(
    x, dt(x, 9), type = "l",
    xlim=c(-5, 5), ylim=c(0, 0.4),
    xlab="", ylab="", xaxt="n"
)

t <- mean(sa)/sqrt(var(sa)/length(sa))
p <- seq(t, 5, length=100)
y <- dt(p, 9)
polygon(c(p,rev(p)), c(rep(0,length(p)), rev(y)), col="yellow")

p2 <- seq(-t, -5, length=100)
y <- dt(p2, 9)
polygon(c(p2,rev(p2)), c(rep(0,length(p2)), rev(y)), col="yellow")

axis(side=1, at=c(-t, t)

両側検定の場合は、正確には以下のように描かなければなりません.両側の黄色い部分の合計面積が0.05となります.

R
#グラフ
x <- seq(-5, 5, length=100)
plot(
    x, dt(x, 9), type = "l",
    xlim=c(-5, 5), ylim=c(0, 0.4),
    xlab="", ylab="", xaxt="n"
)

q = qt(0.025, 9, lower.tail=F)
p <- seq(q, 5, length=100)
y <- dt(p, 9)
polygon(c(p,rev(p)), c(rep(0,length(p)), rev(y)), col="#72C6EF")

q = qt(0.025, 9, lower.tail=F)
p2 <- seq(-q, -5, length=100)
y <- dt(p2, 9)
polygon(c(p2,rev(p2)), c(rep(0,length(p2)), rev(y)), col="#72C6EF")

lines(c(t, t), c(-1.5, dt(t, 9)))
lines(c(-t, -t), c(-1.5, dt(-t, 9)))
axis(side=1, at=c(-t, t))

上側検定

post > pre を有意水準5%で証明してみます
対立仮説2:(post – pre)の平均 > 0
t値は両側検定で求めた値と同じです

R
#再掲
t <- mean(sa)/sqrt(var(sa)/length(sa))
print(t)

これは一側の検定ですの、下のグラフの緑色部分のみがp値として算出されます.つまり両側検定のときの半分のp値になります.

R
#グラフ
x <- seq(-5, 5, length=100)
plot(
    x, dt(x, 9), type = "l",
    xlim=c(-5, 5), ylim=c(0, 0.4),
    xlab="", ylab="", xaxt="n"
)

t <- mean(sa)/sqrt(var(sa)/length(sa))
p <- seq(t, 5, length=100)
y <- dt(p, 9)
polygon(c(p,rev(p)), c(rep(0,length(p)), rev(y)), col="yellow")

lines(c(t, t), c(-1.5, dt(t, 9)))
axis(side=1, at=t)

有意差検定を行う場合は、このように統計量とp値との関係性をイメージしながら検証されることをお勧めします.その場合、Rは最適なツールになります.同じ有意水準5%でも片側検定だと有意な結果になりました.「統計のマジック・・・」という人もいるかもしれませんが、別にトリックではないので、解析結果を見誤ったりしないように注意が必要ですね.

コメント欄 『間違い』や『分かりにくい部分』などのご意見もお寄せください

タイトルとURLをコピーしました