R言語による医療データ分析

R言語によるデータ分析のオンラインコースを中心に、さまざまなデータ分析について記載してあります。

024-026 関数(S2)

まとめ一覧

関数の利用

  • 今回、使う関数は、sum(), summary(), unique()です。
  • sum は足すという意味の英単語です。
  • summary はサマリーです。集計したり集約したりする関数です。
  • unique は、ベクトルのなかから「ユニーク」なものを取り出します

まずは、データフレームを作りましょう。

vec_id <- c(1:7)
vec_namae <- c("A","B","C","D","E","F","G")
vec_by <- c(1987, 1930, 1940, 1972, 1954, 1987, 1930)
vec_gender <- c("男","女","男","男","男","女","男")
vec_admission <- c("2018-1-23", "2018-1-27", "2018-2-4","2018-3-2","2018-3-10","2018-3-12","2018-3-15")
vec_discharge <- c("2018-1-30", "2018-2-1", "2018-2-9","2018-3-3","2018-3-13","2018-3-13","2018-4-1")
vec_is_dead <- c(0,0,0,0,0,1,0)

hyou <- data.frame(
  id = vec_id,
  name = vec_namae,
  seinen = vec_by,
  seibetu = vec_gender,
  admission_date = vec_admission,
  discharge_date= vec_discharge,
  is_dead = vec_is_dead
)

#ここで、hyouは、データフレームです。
summary(hyou)

#このように、データの要約をsummary()関数はしてくれます。
#ベクトルをsummary()したらどうでしょうか?
summary(hyou$id)

#次は、sum()です。
sum(c(1,2,3,4,5))

sum(2,3,4)

#sumは、中に入れたものを足してくれる関数です。
sum("1","2") #エラー!
sum(1,2,3,4,5,6,NA) #?なんかおかしい

?sum

#英語ですが、がんばって下さい。Argumentsのところに、na.rmとありますね?これがオプションです。
#na.rmは、NAが含まれるときの挙動を制御します。Usageのところで、na.rm=FALSEとなっているため、
#デフォルトがFALSEになっていることがわかります。NAをremoveするのが、FALSEなので、NAがあっても、
#なにもしないということになります。

1 + NA

sum(1,2,3,4,5,NA,na.rm = FALSE)
sum(1,2,3,4,5,NA,na.rm = TRUE)

#このように、オプションは?<関数名>で、
# Helpファイルをみることができます(英語ですが・・・)


nanikanosuuji <- c(1,2,3,1,4,5,6,3,4,5,6,7,
                   8,7,6,5,4,4,3,4,5,6)

nanikanosuuji

unique(nanikanosuuji)

セクション2のまとめ

  • R studio の基本的な使い方
  • プロジェクト
  • コメント
  • 数値型、文字型
  • 変数
  • ベクトル
  • データフレーム
  • パッケージ
  • 関数

について説明しました。

プログラミング言語の基礎としては、抜けているところも多々あると思います。意図的に基礎のセクションで紹介していません本コースの目的は、あくまで医療職/非エンジニアが、Rでデータ分析を行うためのとっかかりとして、基本的な部分の習得を目的としています。

このセクションでは、次のセクション以降、最低限知っておかないといけない知識だけを盛り込みました。

今後も、必要に応じて基本的な部分の説明を行います「必要と思ったとき」に勉強するのが一番学習効率がよいと考えるからです。

それでは、ご一緒に、楽しくて、奥深い、Rでのデータ分析の世界に足を踏み入れましょう!!

まとめ一覧