名義尺度のベクトル
Rでは、名義尺度および順序尺度はファクター型に指定する必要がある。ただし、文字が入力されているベクトルは自動的にファクター型として扱われる。数値が入力されている順序尺度(ステージやレベルなど)は、明示的にファクター型へ変換する必要がある。なお、間隔尺度および比例尺度については、特に指定する必要はない。
名義尺度はファクター型(カテゴリカルデータ、カテゴリ変数)として扱う。順序尺度もファクター型(カテゴリカルデータ、カテゴリ変数)として扱うが、この場合は levels 引数によって順序を指定する必要がある。間隔尺度および比例尺度は、通常の数値ベクトル(連続変数)として扱う。
テキストデータは「”」で囲んで記述する必要がある。「“」ではない点に注意する。
day <- c("月曜日", "火曜日", "水曜日", "木曜日", "金曜日", "土曜日")
print(day)> day <- c("月曜日", "火曜日", "水曜日", "木曜日", "金曜日", "土曜日")
> print(day)
[1] "月曜日" "火曜日" "水曜日" "木曜日" "金曜日" "土曜日"
データフレーム
エクセルで作成するような一覧表は「データフレーム」と呼ばれる。これまでに扱ってきた変数をまとめて一覧表にする。まず、データフレームに名前を付ける必要があり、ここでは「data」とする。
例)日常の臨床記録で見かける1週間のデータを統計学的に考える。以下のようなサンプル(架空データ)を用いる。患者Aの収縮期血圧について、1週間(月曜日~土曜日)においてPT前後に血圧を測定した結果である。
月曜日, AM, 屋外歩行の前後で測定
火曜日, PM, 屋内歩行の前後で測定
水曜日, AM, 屋内歩行の前後で測定
木曜日, AM, 屋内歩行の前後で測定
金曜日, PM, 屋外歩行の前後で測定
土曜日, PM, 屋内歩行の前後で測定
ベクトルからデータフレームを作る

pre <- c(112, 138, 124, 120, 136, 142)
post <- c(138, 139, 136, 130, 143, 140)
day <- c("月曜日", "火曜日", "水曜日", "木曜日", "金曜日", "土曜日")
time <- c("AM", "PM", "AM", "AM", "PM", "PM")
place <- c("屋外", "室内", "室内", "室内", "屋外", "室内")
data <- data.frame(pre, post, day, time, place)
print(data)> print(data)
pre post day time place
1 112 138 月曜日 AM 屋外
2 138 139 火曜日 PM 室内
3 124 136 水曜日 AM 室内
4 120 130 木曜日 AM 室内
5 136 143 金曜日 PM 屋外
6 142 140 土曜日 PM 室内
エクセルのような表で確認したい場合は、View関数を使用します。
View(data)
csvファイルとして保存したい場合は、以下のようなコードを用いることで、作業フォルダにファイルが保存される。
write.csv(data, file="data.csv", fileEncoding="UTF-8")データフレームから変数preと変数postだけを抜き出したデータフレーム(pre_post)を作成。
pre_post <- data[ ,c("pre", "post")]
print(pre_post)> print(pre_post)
pre post
1 112 138
2 138 139
3 124 136
4 120 130
5 136 143
6 142 140
データフレームからベクトルからを抜き出す($)

pre_2 <- data$pre
print(pre_2)
mean(pre_2)
sd(pre_2)> print(pre_2)
[1] 112 138 124 120 136 142
> mean(pre_2)
[1] 128.6667
> sd(pre_2)
[1] 11.77568
