R言語による医療データ分析

R言語によるデータ分析のオンラインコースを中心に、さまざまなデータ分析について記載してあります。

044-049 ggplotでの基本的なグラフの作成と演習

まとめ一覧

ggplotで基本的なグラフを描画する!

library(ggplot2)

#これで、
diamonds
economics
msleep

#等のデータセットが利用できるようになっていると思うので、これらを利用します。
  • diamonds:50000個のダイヤモンドのデータ
    • price -> 値段(ドル)
    • carat -> 重さ
    • cut -> カットの質(カテゴリカル変数)
    • color -> ダイヤの色(カテゴリカル変数、Jが最低、Dが最高)
    • clarity -> ダイヤの透明度(悪い:I1 SI2 SI1 VS2 VS1 VVS2 VVS1 IF 最高。カテゴリカル変数)
    • x, y, z -> 長さ、幅、深さをミリメートル単位

他のデータセットも、helpの検索を利用すれば詳しい内容を知ることができます。

?economics
  • 例題:ダイヤモンドの長さ(x)と幅(y)の関係を散布図で描画してください。
ggplot(data = diamonds) +
  geom_point(mapping=aes(x=x, y=y))
  • Q1: ダイヤモンドの重さと値段の関係を、散布図で描画してください。
ggplot(data = diamonds) + 
  geom_point(mapping = aes(x = carat, y = price))
  • Q2: ダイヤモンドの色と値段の関係を、箱ひげ図で描画してください。
ggplot(data =diamonds) +
  geom_boxplot(mapping = aes(x = color, y = price))
  • Q3: ダイヤモンドの透明度と色の関係を、何らかの形で描画してください
gdia <- ggplot(data = diamonds)

gdia + geom_count(aes(clarity, color))
gdia + geom_jitter(aes(clarity, color))
  • Q4: ダイヤモンドの値段の分布をヒストグラムにして描画してください
gdia + geom_histogram(aes(price))

ggplot(data = diamonds) + 
  geom_histogram(mapping = aes(x = price))
  • Q5: ダイヤモンドのカットの質が分類毎に、このデータセットに何件ずつあるのかを描画してください。
gdia + geom_bar(aes(cut))
summary(diamonds$cut)
  • Q6: この問題には、economicsデータを利用します。米国の失業者数の推移を何らかの形で描画してください。

  • economics:米国の経済データ

    • date -> 日付
    • unemploy -> 失業者数(千人単位)
    • pop -> 人口(千人単位)
economics
geco <- ggplot(economics) 
  
geco + geom_line(aes(date, unemploy))
geco + geom_point(aes(date, unemploy))

まとめ一覧