Rのためのデータハンドリング

1ページ 2ページ 3ページ

名義尺度のベクトル

Rでは、名義尺度と順序尺度をファクター型に指定しなければなりません。ただし、文字が入力されているベクトルは、自動的にファクター型となります。数値が入力されている順序尺度(ステージやレベルなど)は、ファクター型に変更しなければなりません。間隔尺度と比例尺度は特に指定する必要はありません。

名義尺度はファクター型(カテゴリカルデータ、カテゴリ変数)として扱います。順序尺度もファクター型(カテゴリカルデータ、カテゴリ変数)として扱います(ただし、levels 引数で順序を指定します)。間隔尺度比例尺度は、通常の数値ベクトル(連続変数)として扱います。

テキストデータは、「”」で囲みます。「“」ではありません。

R
day <- c("月曜日", "火曜日", "水曜日", "木曜日", "金曜日", "土曜日")
print(day)

データフレーム

エクセルで作成するような一覧表を「データフレーム」と呼びます。これまでの変数をまとめて一覧表にします。データフレームに名前をつけます。ここでは、dataという名前にします。

例)日常の臨床記録で見かける1週間のデータを統計学的に考えてみます。
以下のようなサンプルを使用します(架空のデータです)。患者Aさんの収縮期血圧を考えます。1週間(月曜日~土曜日)PT前後に血圧を測定したときの結果です。

月曜日, AM, 屋外歩行の前後で測定
火曜日, PM, 屋内歩行の前後で測定
水曜日, AM, 屋内歩行の前後で測定
木曜日, AM, 屋内歩行の前後で測定
金曜日, PM, 屋外歩行の前後で測定
土曜日, PM, 屋内歩行の前後で測定

ベクトルからデータフレームを作る
R
pre <- c(112, 138, 124, 120, 136, 142)
post <- c(138, 139, 136, 130, 143, 140)
day <- c("月曜日", "火曜日", "水曜日", "木曜日", "金曜日", "土曜日")
time <- c("AM", "PM", "AM", "AM", "PM", "PM")
place <- c("屋外", "室内", "室内", "室内", "屋外", "室内")
data <- data.frame(pre, post, day, time, place)
print(data)

エクセルのような表で確認したい場合は、View関数を使用します。

R
View(data)

データフレームから変数preと変数postだけを抜き出したデータフレーム(pre_post)を作成。

R
pre_post <- data[ ,c("pre", "post")]
print(pre_post)
データフレームからベクトルからを抜き出す($
R
pre_2 <- data$pre
print(pre_2)
mean(pre_2)
sd(pre_2)

コメント欄 『間違い』や『分かりにくい部分』などのご意見もお寄せください

タイトルとURLをコピーしました