024-026 関数(S2)
関数の利用
- 今回、使う関数は、sum(), summary(), unique()です。
- sum は足すという意味の英単語です。
- summary はサマリーです。集計したり集約したりする関数です。
- unique は、ベクトルのなかから「ユニーク」なものを取り出します
まずは、データフレームを作りましょう。
vec_id <- c(1:7) vec_namae <- c("A","B","C","D","E","F","G") vec_by <- c(1987, 1930, 1940, 1972, 1954, 1987, 1930) vec_gender <- c("男","女","男","男","男","女","男") vec_admission <- c("2018-1-23", "2018-1-27", "2018-2-4","2018-3-2","2018-3-10","2018-3-12","2018-3-15") vec_discharge <- c("2018-1-30", "2018-2-1", "2018-2-9","2018-3-3","2018-3-13","2018-3-13","2018-4-1") vec_is_dead <- c(0,0,0,0,0,1,0) hyou <- data.frame( id = vec_id, name = vec_namae, seinen = vec_by, seibetu = vec_gender, admission_date = vec_admission, discharge_date= vec_discharge, is_dead = vec_is_dead ) #ここで、hyouは、データフレームです。 summary(hyou) #このように、データの要約をsummary()関数はしてくれます。 #ベクトルをsummary()したらどうでしょうか? summary(hyou$id) #次は、sum()です。 sum(c(1,2,3,4,5)) sum(2,3,4) #sumは、中に入れたものを足してくれる関数です。 sum("1","2") #エラー! sum(1,2,3,4,5,6,NA) #?なんかおかしい ?sum #英語ですが、がんばって下さい。Argumentsのところに、na.rmとありますね?これがオプションです。 #na.rmは、NAが含まれるときの挙動を制御します。Usageのところで、na.rm=FALSEとなっているため、 #デフォルトがFALSEになっていることがわかります。NAをremoveするのが、FALSEなので、NAがあっても、 #なにもしないということになります。 1 + NA sum(1,2,3,4,5,NA,na.rm = FALSE) sum(1,2,3,4,5,NA,na.rm = TRUE) #このように、オプションは?<関数名>で、 # Helpファイルをみることができます(英語ですが・・・) nanikanosuuji <- c(1,2,3,1,4,5,6,3,4,5,6,7, 8,7,6,5,4,4,3,4,5,6) nanikanosuuji unique(nanikanosuuji)
セクション2のまとめ
- R studio の基本的な使い方
- プロジェクト
- コメント
- 数値型、文字型
- 変数
- ベクトル
- データフレーム
- パッケージ
- 関数
について説明しました。
プログラミング言語の基礎としては、抜けているところも多々あると思います。意図的に基礎のセクションで紹介していません本コースの目的は、あくまで医療職/非エンジニアが、Rでデータ分析を行うためのとっかかりとして、基本的な部分の習得を目的としています。
このセクションでは、次のセクション以降、最低限知っておかないといけない知識だけを盛り込みました。
今後も、必要に応じて基本的な部分の説明を行います「必要と思ったとき」に勉強するのが一番学習効率がよいと考えるからです。
それでは、ご一緒に、楽しくて、奥深い、Rでのデータ分析の世界に足を踏み入れましょう!!