001 コースの全体像(S1)
なぜR言語か?
R言語は統計処理や計算に強みをもつプログラミング言語です。 一般的に販売されている統計ソフトに比べると
メリット
- 無料である(ため、どのような職場や環境でもアクセスすることができる)
- 豊富な統計パッケージ
- 豊富なデータ分析用パッケージ
- 常に世界中のユーザーによる更新が行われている
デメリット
- 学習コストが大きい
という性質があります。
実際、私はある程度R言語に習熟できたことから、いろいろな状況で気軽にデータ分析ができるようになりました。R言語に習熟していなければ、新しい環境に移る度に、その環境にある統計ソフトを新たに学びなおすか、統計ソフトを購入してもらうように交渉をしなければいけなかったかもしれません。
本コースの全体像
いわゆるPDCAサイクルで考えるとこのようなイメージになります。
本コースでは、
図にある、インポート、データクリーニング、可視化をメインに解説を行います。 この部分が、データ分析で一番手間がかかる部分になります。 一般的には、ほかの統計ソフトで分析する前に、エクセル等を利用して加工されている方も多いと思いますが、 Rを習得すると、データの加工から、レポート作成(報告)まで、同じツールを利用して利用できるようになるため これもメリットかもしれません。
統計については、より専門的な内容で専門家が解説した書籍等が多数あるため、本コースはあくまでデータをR言語を利用して取り扱うことができるようになることを目指して解説していきます。