Rのためのデータハンドリング

1ページ 2ページ 3ページ

記述統計

要約

数値ベクトルの場合は、summary関数で要約。平均値、中央値、最大値、最小値、四分位点を求めることができる。

R
summary(pre_post)

結果をワードやパワポにコピペする場合は、フォントで調整が必要になります。色々なフォントで試してみてください。

名義変数のみ抜き出したデータフレームの作成。

R
meigi <- data[ ,c("day", "time", "place")]
print(meigi)

名義変数の場合は、lapply関数で要約しておくと便利です。それぞれのデータに該当するサイズを求めることができる。

R
summary_meigi <- lapply(meigi, table)
print(summary_meigi)

注意)データに日本語があると、ズレが生じます。

分割表(クロス表)

変数timeと変数placeは2値変数なので、分割表を作成することがでます。

R
table_data <- table(data$time, data$place)
print(table_data)
R
table_data <- table(data$time, data$place)
View(as.data.frame.matrix(table_matrix))

分割表ができたら、そのまま検定も可能です

R
fisher.test(table_data)
層別解析

AM, PMのpre, postの平均値、標準偏差

R
# AMとPMごとにpreの平均値を計算
pre_means <- tapply(data$pre, data$time, mean)
# AMとPMごとにpostの平均値を計算
post_means <- tapply(data$post, data$time, mean)
# 結果の表示
print(round(pre_means, 1))
print(round(post_means, 1))

平均値と標準偏差を同時に求めたい場合

R
# 平均値と標準偏差を計算する関数を定義
calculate_stats <- function(x) {
  c(mean = round(mean(x),1), sd = round(sd(x),1))
}
# AMとPMごとにpreの平均値と標準偏差を計算
pre_stats <- tapply(data$pre, data$time, calculate_stats)
# AMとPMごとにpostの平均値と標準偏差を計算
post_stats <- tapply(data$post, data$time, calculate_stats)
# 結果の表示
print("Pre statistics:")
print(pre_stats)
print("Post statistics:")
print(post_stats)

コメント欄 『間違い』や『分かりにくい部分』などのご意見もお寄せください

タイトルとURLをコピーしました