ダミー変数（makedummiesの使い方）

データの準備と要約

データセット cross3 をdatに格納します（ファイルの読み込み）

パッケージ makedummies のインストール（パッケージのインストールについて）

library(makedummies)

library(makedummies)

datの先頭6行表示

head(dat)

head(dat)

変数をファクターに変更して要約を見てみます

dat$治療 <- factor(dat$治療)
dat$結果<- factor(dat$結果)
summary(dat)

dat$治療 <- factor(dat$治療)
dat$結果<- factor(dat$結果)
summary(dat)

str(dat)

str(dat)

先に記載されている方が基準となりますので、“治療あり“と”改善“が基準となります

分割表にした場合に、”治療あり”かつ”改善”の数が左上に表示されます

tab1 <- xtabs(~dat$治療+dat$結果)
print(tab1)

tab1 <- xtabs(~dat$治療+dat$結果)
print(tab1)

dat2 <- makedummies::makedummies(dat, basal_level = TRUE)
#　:: の前にパッケージの名称を記載してます
head(dat2)

dat2 <- makedummies::makedummies(dat, basal_level = TRUE)
#　:: の前にパッケージの名称を記載してます
head(dat2)

列名を変更します

colnames(dat2) <- c("治療あり",  "未治療", " 改善", " 著変なし")
head(dat2)

colnames(dat2) <- c("治療あり",  "未治療", " 改善", " 著変なし")
head(dat2)

1列目と3列目を使用した場合の分割表を作成

行＝治療あり（0=未治療、1=治療あり）、列＝改善（0＝著変なし、1=改善）

tab2 <- xtabs(~ dat2[, 1] + dat2[, 3])
print(tab2)

tab2 <- xtabs(~ dat2[, 1] + dat2[, 3])
print(tab2)

0, 1 の２値の場合 0 が基準となります

したがって、”未治療” かつ “著変なし” が左上に記載されます

２列目と４列目を使用した場合、行＝未治療（0=治療あり、1=未治療）、列＝著変なし（0＝改善、1=著変なし）となります

tab3 <- xtabs(~ dat2[, 2] + dat2[, 4])
print(tab3)

tab3 <- xtabs(~ dat2[, 2] + dat2[, 4])
print(tab3)

0, 1 の２値の場合 0 が基準となります

今度は”治療あり” かつ “改善” が左上に記載されます

tab3 と tab3 は全く同じ分割表です

分割表は混乱しやすいので注意が必要です。特にダミー変数を扱う場合はゴチャゴチャになるので、何が基準になっているのかを必ず確認しておいてください。

上記ことをしっかり理解したうえで、makedummiesを使用します

#重要なので再掲
print(tab1)

#重要なので再掲
print(tab1)

makedummiesのデフォルトでダミー変数を作った場合、上記と同じ分割表になります

dat3 <- makedummies(dat)
head(dat3)

dat3 <- makedummies(dat)
head(dat3)

tab4 <- xtabs(~ dat3[, 1] + dat3[, 2])
print(tab4)

tab4 <- xtabs(~ dat3[, 1] + dat3[, 2])
print(tab4)

基準は、治療あり=0、改善=0 となっていることに注意してください