多重比較
Rを使用した多重比較の方法のみを掲載する
Dunnet法
Dunnett法は、基準群と他群との比較に特化した多重比較法である。すなわち、比較対象は A vs Control、B vs Control、C vs Control のように、すべて基準群との組み合わせに限定される。この方法では、A vs B のような不要な群間比較は行わないため、検定数を抑えることができ、効率的に多重比較の問題に対処できるという特徴がある。
age65–70をコントロール群として、他の群と比較検定する。ageは因子型変数。
ano <- aov(cop ~ age, data = data)
summary(multcomp::glht(ano, linfct=mcp(age = "Dunnett"))) Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Dunnett Contrasts
Fit: aov(formula = cop ~ age, data = data)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
70–75 - 65–70 == 0 83.90 44.08 1.903 0.12
75–80 - 65–70 == 0 234.00 44.08 5.309 2.62e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Adjusted p values reported -- single-step method)
本結果は、Dunnett法による多重比較の結果を示したものである。ここでは、コントロール群である「65–70」を基準として、他の年齢群との平均値の差を検定している。まず、「70–75 – 65–70」の比較においては、推定値は83.90であり、70–75群の平均値は65–70群より高い傾向にあることが示されている。しかし、調整後のp値は0.12であり、有意水準5%では有意差は認められない。一方、「75–80 – 65–70」の比較においては、推定値は234.00であり、75–80群の平均値は65–70群より大きく高い。この差に対するp値は2.62×10⁻⁵であり、有意水準5%で統計的に有意である。したがって、75–80群は65–70群と比較して有意に高い値を示すと結論づけられる。なお、ここで示されているp値は「single-step法」による多重比較補正後の値であり、複数の比較に伴う第I種過誤の増加が適切に制御されている。以上より、年齢群のうち75–80は65–70と有意に異なるが、70–75と65–70の間には有意差は認められないことが示された。
75-80群をコントロールに置きたいときは、75-80群をreference level に設定する
data$age <- relevel(data$age, ref="75–80")
ano <- aov(cop ~ age, data = data)
summary(multcomp::glht(ano, linfct=mcp(age = "Dunnett"))) Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Dunnett Contrasts
Fit: aov(formula = cop ~ age, data = data)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
65–70 - 75–80 == 0 -234.00 44.08 -5.309 2.62e-05 ***
70–75 - 75–80 == 0 -150.10 44.08 -3.405 0.00399 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Adjusted p values reported -- single-step method)
65–70 vs 75–80 と 70–75 vs 75–80 に有意差が認められた
Tukey‒Kramer法
Tukey法は、すべての群の組み合わせを比較する全対比較(pairwise comparison)に基づく方法であり、どの群間に差があるかを事前に特定しない場合に適した手法である。例えば、3群の場合は A vs B、A vs C、B vs C のすべての組み合わせについて検定が行われる。この方法では、多重比較に伴う第1種過誤の増大を防ぐため、複数の検定の中で少なくとも1つ誤って有意と判定してしまう確率(家族誤差率;family-wise error rate, FWER)を、あらかじめ定めた有意水準で制御するよう設計されている。
TukeyHSD(aov(cop ~ age, data = data)) Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = cop ~ age, data = data)
$age
diff lwr upr p adj
65–70-75–80 -234.0 -343.28516 -124.71484 0.0000386
70–75-75–80 -150.1 -259.38516 -40.81484 0.0057131
70–75-65–70 83.9 -25.38516 193.18516 0.1570739
65-70 vs 75-80, 70-75 vs 75-80 に有意差が認めれた
Bonferroni法
Bonferroni法は、多重比較における最も基本的で汎用的な補正法の一つである。各検定における有意水準を比較の数で割る(あるいはp値に比較数を掛ける)ことで、第1種過誤の増大を抑制する方法である。特定の比較対象に制限はなく、任意の群間比較に適用可能であるが、その分補正は保守的となり、検出力が低下しやすいという特徴がある。
pairwise.t.test(data$cop, data$age, p.adj = "bonf") Pairwise comparisons using t tests with pooled SD
data: data$cop and data$age
75–80 65–70
65–70 4e-05 -
70–75 0.0062 0.2031
P value adjustment method: bonferroni
同じく65-70 vs 75-80、70-75 vs 75-80 に有意差が認められた
Tukey–Kramer法とBonferroni法の違い
| 項目 | Tukey–Kramer法 | Bonferroni法 |
|---|---|---|
| 主な用途 | 全群のペア比較 | 任意のペア比較 |
| 前提 | 分散分析後の多重比較 | より一般的(t検定など) |
| 方法 | 分布に基づいて調整(q分布) | 有意水準を割るだけ |
| 保守性 | 中等度(検出力が高い) | 高い(検出力が低い) |
Bonferroni法は、比較する組み合わせを研究者が任意に選択できる汎用的な多重比較法である。各検定の有意水準を比較回数で割った値(α/m)に設定することで、複数の検定全体における第1種の過誤(家族内誤差率)を制御する、シンプルで広く用いられる方法である。この特性により第1種の過誤を厳しく抑制できる一方で、検出力が低下し、有意差が出にくくなる傾向がある。
一方、Tukey–Kramer法は、すべての群間のペア比較を同時に行うことを前提として設計された手法である。標本平均間の最大差に関する分布(スチューデント化された範囲分布)に基づいて多重比較を行うことで、FWERを制御しつつ、Bonferroni法と比較して検出力が高くなるように設計されている。
したがって、Tukey–Kramer法は分散分析(ANOVA)後のポストホック検定として全群の比較を行う場合に適しており、Bonferroni法は多重t検定を含む任意の複数比較に柔軟に適用できる方法である。
