044-049 ggplotでの基本的なグラフの作成と演習
ggplotで基本的なグラフを描画する!
library(ggplot2) #これで、 diamonds economics msleep #等のデータセットが利用できるようになっていると思うので、これらを利用します。
- diamonds:50000個のダイヤモンドのデータ
- price -> 値段(ドル)
- carat -> 重さ
- cut -> カットの質(カテゴリカル変数)
- color -> ダイヤの色(カテゴリカル変数、Jが最低、Dが最高)
- clarity -> ダイヤの透明度(悪い:I1 SI2 SI1 VS2 VS1 VVS2 VVS1 IF 最高。カテゴリカル変数)
- x, y, z -> 長さ、幅、深さをミリメートル単位
他のデータセットも、helpの検索を利用すれば詳しい内容を知ることができます。
?economics
- 例題:ダイヤモンドの長さ(x)と幅(y)の関係を散布図で描画してください。
ggplot(data = diamonds) + geom_point(mapping=aes(x=x, y=y))
- Q1: ダイヤモンドの重さと値段の関係を、散布図で描画してください。
ggplot(data = diamonds) + geom_point(mapping = aes(x = carat, y = price))
- Q2: ダイヤモンドの色と値段の関係を、箱ひげ図で描画してください。
ggplot(data =diamonds) + geom_boxplot(mapping = aes(x = color, y = price))
- Q3: ダイヤモンドの透明度と色の関係を、何らかの形で描画してください
gdia <- ggplot(data = diamonds) gdia + geom_count(aes(clarity, color)) gdia + geom_jitter(aes(clarity, color))
- Q4: ダイヤモンドの値段の分布をヒストグラムにして描画してください
gdia + geom_histogram(aes(price)) ggplot(data = diamonds) + geom_histogram(mapping = aes(x = price))
- Q5: ダイヤモンドのカットの質が分類毎に、このデータセットに何件ずつあるのかを描画してください。
gdia + geom_bar(aes(cut)) summary(diamonds$cut)
Q6: この問題には、economicsデータを利用します。米国の失業者数の推移を何らかの形で描画してください。
economics:米国の経済データ
- date -> 日付
- unemploy -> 失業者数(千人単位)
- pop -> 人口(千人単位)
economics geco <- ggplot(economics) geco + geom_line(aes(date, unemploy)) geco + geom_point(aes(date, unemploy))