Rの基本操作

1ページ 2ページ 3ページ

名義尺度のベクトル

Rでは、名義尺度および順序尺度はファクター型に指定する必要がある。ただし、文字が入力されているベクトルは自動的にファクター型として扱われる。数値が入力されている順序尺度(ステージやレベルなど)は、明示的にファクター型へ変換する必要がある。なお、間隔尺度および比例尺度については、特に指定する必要はない。

名義尺度はファクター型(カテゴリカルデータ、カテゴリ変数)として扱う。順序尺度もファクター型(カテゴリカルデータ、カテゴリ変数)として扱うが、この場合は levels 引数によって順序を指定する必要がある。間隔尺度および比例尺度は、通常の数値ベクトル(連続変数)として扱う。

テキストデータは「”」で囲んで記述する必要がある。「“」ではない点に注意する。

R
day <- c("月曜日", "火曜日", "水曜日", "木曜日", "金曜日", "土曜日")
print(day)
> day <- c("月曜日", "火曜日", "水曜日", "木曜日", "金曜日", "土曜日")
> print(day)
[1] "月曜日" "火曜日" "水曜日" "木曜日" "金曜日" "土曜日"

データフレーム

エクセルで作成するような一覧表は「データフレーム」と呼ばれる。これまでに扱ってきた変数をまとめて一覧表にする。まず、データフレームに名前を付ける必要があり、ここでは「data」とする。

)日常の臨床記録で見かける1週間のデータを統計学的に考える。以下のようなサンプル(架空データ)を用いる。患者Aの収縮期血圧について、1週間(月曜日~土曜日)においてPT前後に血圧を測定した結果である。

月曜日, AM, 屋外歩行の前後で測定
火曜日, PM, 屋内歩行の前後で測定
水曜日, AM, 屋内歩行の前後で測定
木曜日, AM, 屋内歩行の前後で測定
金曜日, PM, 屋外歩行の前後で測定
土曜日, PM, 屋内歩行の前後で測定

ベクトルからデータフレームを作る
R
pre <- c(112, 138, 124, 120, 136, 142)
post <- c(138, 139, 136, 130, 143, 140)
day <- c("月曜日", "火曜日", "水曜日", "木曜日", "金曜日", "土曜日")
time <- c("AM", "PM", "AM", "AM", "PM", "PM")
place <- c("屋外", "室内", "室内", "室内", "屋外", "室内")
data <- data.frame(pre, post, day, time, place)
print(data)
> print(data)
  pre post    day time place
1 112  138 月曜日   AM  屋外
2 138  139 火曜日   PM  室内
3 124  136 水曜日   AM  室内
4 120  130 木曜日   AM  室内
5 136  143 金曜日   PM  屋外
6 142  140 土曜日   PM  室内

エクセルのような表で確認したい場合は、View関数を使用します。

R
View(data)

csvファイルとして保存したい場合は、以下のようなコードを用いることで、作業フォルダにファイルが保存される。

R
write.csv(data, file="data.csv", fileEncoding="UTF-8")

データフレームから変数preと変数postだけを抜き出したデータフレーム(pre_post)を作成。

R
pre_post <- data[ ,c("pre", "post")]
print(pre_post)
> print(pre_post)
  pre post
1 112  138
2 138  139
3 124  136
4 120  130
5 136  143
6 142  140
データフレームからベクトルからを抜き出す($
R
pre_2 <- data$pre
print(pre_2)
mean(pre_2)
sd(pre_2)
> print(pre_2)
[1] 112 138 124 120 136 142
> mean(pre_2)
[1] 128.6667
> sd(pre_2)
[1] 11.77568
タイトルとURLをコピーしました