ロジスティック回帰(2)

ロジスティック回帰 (1)の続きです。例題はロジスティック回帰 (1)と同じですが、データセットの構造が異なります。例題の内容や結果については色々とご意見があると思いますが、統計学の練習のためのサンプルですのでご了承ください。

例題
リハビリを受けている入院中の患者に対してリハビリに関する満足度調査を実施した。1週間に割り当てられた単位数をもとにランダムにインタビューした。「満足」と回答する割合と1週間のリハビリ単位数には関係があるのでしょうか？

データの準備と要約
- 集計データ
- 個別データ
ロジスティック回帰
- 集計データを使用したロジスティック回帰
- 個別データを使用したロジスティック回帰

データの準備と要約

データセット log01 と log02 をダウンロードします（ファイルの読み込み方）

集計データ

log01 ダウンロード

dat1 <- read.csv("log01.csv", header=T, fileEncoding = "UTF-8")

Copy

dat1 <- read.csv("log01.csv", header=T, fileEncoding = "UTF-8")

dat1の確認

View(dat1)

Copy

View(dat1)

単位数＝1週間のリハ単位数
患者数＝各単位数に該当する患者数
満足＝「満足」と回答した患者数

個別データ

log02 ダウンロード

dat2 <- read.csv("log02.csv", header=T, fileEncoding = "UTF-8")

Copy

dat2 <- read.csv("log02.csv", header=T, fileEncoding = "UTF-8")

dat2の確認

dim(dat2)

Copy

dim(dat2)

> dim(dat2)
[1] 100   2

100人分あるので20人分のみを表示してみます

#20行のみ表示
View(dat2[0:20,])

Copy

#20行のみ表示
View(dat2[0:20,])

ロジスティック回帰

それぞれのセットでロジスティック回帰を実行してみます

目的変数の設定が異なるので注意してください

集計データを使用したロジスティック回帰

fit1 <- glm(
    cbind(満足, 患者数-満足) ~ 単位数, 
    family=binomial, 
    data=dat1
)
summary(fit1)

Copy

fit1 <- glm(
    cbind(満足, 患者数-満足) ~ 単位数, 
    family=binomial, 
    data=dat1
)
summary(fit1)

Call:
glm(formula = cbind(満足, 患者数 - 満足) ~ 単位数, 
    family = binomial, data = dat1)

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept) -3.62166    0.75949  -4.769 1.86e-06 ***
単位数       0.11850    0.02367   5.007 5.54e-07 ***
---
Signif. codes:  
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43.6268  on 8  degrees of freedom
Residual deviance:  6.3246  on 7  degrees of freedom
AIC: 30.394

Number of Fisher Scoring iterations: 4

個別データを使用したロジスティック回帰

fit2 <- glm(
    cbind(満足, 1-満足) ~ 単位数, 
    family=binomial, 
    data=dat2
)
summary(fit2)

Copy

fit2 <- glm(
    cbind(満足, 1-満足) ~ 単位数, 
    family=binomial, 
    data=dat2
)
summary(fit2)

Call:
glm(formula = cbind(満足, 1 - 満足) ~ 単位数, family = binomial, 
    data = dat2)

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept) -3.62166    0.75949  -4.769 1.86e-06 ***
単位数       0.11850    0.02367   5.007 5.54e-07 ***
---
Signif. codes:  
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 138.59  on 99  degrees of freedom
Residual deviance: 101.29  on 98  degrees of freedom
AIC: 105.29

Number of Fisher Scoring iterations: 4