こんにちは!
データサイエンティストのウマたん(@statistics1012)です
データ分析の言語として非常に人気なRやPython。
そんなRやPythonなどのプログラミング言語学習には様々なサービスが存在しますが、書籍も非常にオススメな学習手段です。
そこでこの記事では、そんなRとPythonを勉強する上でおすすめな本をご紹介したいと思います。
本で勉強した後は、Nishikaなどのデータ分析コンペで手を動かしながら実践してみることをオススメします!
気になるところへ読み飛ばす
目次
Rのおすすめ本
Rは変数宣言などをする必要がなく、コーディングもシンプルなため、実は非常にとっつきやすい言語なんです。
世界中の頭の良い人がたくさんのライブラリーを作ってくれているので、そのライブラリーを呼び出すだけで複雑な手法を使うことができます。
高精度が期待されるランダムフォレストやサポートベクターマシンでさえ複雑なアルゴリズムなのにもかかわらず、わずか数行で記述することができます。
また、グラフィック描画にも優れており、ggplotというグラフィック描画ライブラリーを使うと非常に見やすいきれいなグラフを作ることができます。
それでは、そんなポテンシャルの高いRを勉強する上でおすすめする本を見ていきましょう!
現場ですぐ使える時系列データ分析
(2024/11/20 19:00:46時点 Amazon調べ-詳細)
時系列分析とついているので時系列に関する解析がメインですが、「現場で使える」とついているように統計学を専門にしていない現場の人でもとりあえず解析できるような内容になっているため、Rの使い方を最初に勉強する本としては非常におすすめです。
Rでやさしい統計学
統計学の基本的な検定・推定からはじまり包括的に伝統的な統計学に関して勉強できます。基本統計量など基本的な計算からRの勉強が始まるので、Rを触るのは初めてだというような人におすすめです。
いわゆるビッグデータ解析とかデータマイニング・機械学習、ディープラーニングなんていうところは出てきませんが、全てのデータ解析の基礎となる統計学の考え方が勉強できます。
データ解析のためのモデリング入門
(2024/11/21 09:09:23時点 Amazon調べ-詳細)
名著中の名著!内容的には中級者向けですが、統計学を勉強する上で絶対に外せない本です。
RとWinbugsを使ったモデリングを勉強することができます。
ちなみに統計モデリングを行うならWinbugsよりもStanという言語の方がおすすめなので次で紹介する本も並行して読んでみると良いと思います。
あまり、Rの勉強にクリティカルに役立つというわけではないかもしれませんが、この本を通して線形モデルからベイズモデルまでの流れを勉強することで必ず力がつくと思います。
StanとRでベイズ統計モデリング
(2024/11/20 18:28:55時点 Amazon調べ-詳細)
こちらの本はベイズ統計モデリングを勉強するための本なのでRを勉強するのには特化していません。
しかし、ベイズ統計学をRとStanを用いて非常に分かりやすく学べるので、ある程度Rもつかいこなせるようになり、統計学に関しても理解してきた段階で取り組んでみると良いでしょう!
ちなみにStanを勉強できるオススメ本は以下にまとめています!
データマイニング入門
機械学習の各手法をRを用いて実装できる良本です。
学部3年生の時に一番初期に手を付け、非常に勉強になったのを覚えています。
ストーリー形式で進んでいくので分かりやすくさくさく読めます。
機械学習手法のアルゴリズムに関しては理解に苦しむところもでてくると思うので全部理解しようとするのではなく、Rで手を動かして実践していきましょう!
データサイエンティスト養成読本
(2024/11/20 23:05:30時点 Amazon調べ-詳細)
データサイエンティスト周りのお話から詳しい手法の説明までが載っています。
これもデータマイニング入門と同様に詳しいアルゴリズムを完全に理解しようとするのではなく、Rを用いて手を動かして学んでいきましょう!
データサイエンティストに関しては以下の記事にまとめています!
ちなみに手前味噌ですが、データサイエンティストのお仕事をイメージしてもらうための書籍を僕自身が書いているので、是非のぞいてみください!
ストーリー形式で分かりやすく書いていますので、ぜひ最初に目を通していただけるとイメージが湧くと思います。
価格は300円ちょっとですし、Kindle unlimitedであれば無料で読めるのでぜひチェックしてみてくださいね!
RstudioではじめるRプログラミング入門
統計学に関することは一旦おいておいてプログラミング言語としてのRを学びたいという方におすすめの本です。
この本は、「統計の知識がなくてもRを純粋にプログラミング言語として学ぼう」ということをコンセプトにして作られたらしく、データ解析というよりプログラミングよりのRのポテンシャルを引き出してくれる本です!
RはRtipsというサイトが非常にまとまっていて分かりやすいです。
本を読みながら分からないところはRtipsで逆引きして勉強すると理解が深まると思います。
Pythonのおすすめ本
Pythonは今世界で最もホットな言語といわれています。
スタンフォード大学の学生が学ぶ言語は圧倒的にPythonが一番です。
また、エンジニアの言語別収入もPythonが常に上位です。
なぜそこまでPythonが人気なのか。それはその汎用性にあります。
Pythonはデータ解析と開発の2面性を持っているためPythonを勉強することでサービスの開発とデータ解析ができるようになります。
ちなみにRはデータ解析に特化しており開発には向いておりません。
また、PythonもRと同様にライブラリーが充実しているため、簡単に複雑な手法を使うことができます。
Pythonは世界中で盛り上がっている言語なので、ディープラーニングやテキストマイニングなどのホットな手法がいち早くライブラリーに落とされるので簡単に使うことができます。
【入門】Pythonを覚えてエリートリーマンへ!落ちこぼれリーマンの逆転劇
(2024/11/21 09:18:45時点 Amazon調べ-詳細)
手前味噌ですが、そもそもPythonで何ができるのか分からない!という方向けにこの書籍を書きました。
Pythonで出来ることについては以下の書籍で小説形式でまとめていますのでよければ見てみてください!
価格は300円ちょっとですし、Kindle unlimitedであれば無料で読めるのでぜひチェックしてみてくださいね!
Pythonスタートブック
Pythonを本当に簡単に教えてくれる良本!Pythonを全く勉強したことのない人はこちらをおすすめします!
Kaggleで勝つデータ分析の技術
Pythonの勉強と言うよりも、Kaggleに特化した書籍になってます。
Kaggleとは、世界の最強データサイエンティストが集まるデータ解析コンペティションのことで、与えられたデータを様々な角度から分析してアウトプットの精度を競います。
このKaggleでは、与えられたデータからどのように有用な特徴量(変数)を生み出し、いかに適切な分析手法を用いるかが肝になります。
ある程度Pythonが書けるようになった後に挑戦すると良いでしょう!
この本はPythonを使ったデータ分析能力をグゥーっと押し上げる上で非常にオススメです!
Kaggleに関しては以下の記事でまとめていますのでこちらもあわせてチェックしてみてください!
Pythonのおすすめ本は以下の記事でより詳しく解説しています!
ちなみにPythonに関しては以下の記事でPython勉強のロードマップと作成したWebアプリケーションを公開しているのでよければご覧ください!
RとPythonを本以外で勉強する方法
最後にRとPythonを本以外で勉強する方法についても簡単に見ていきましょう!
PyQ
Pythonに関しては「PyQ」というPythonに特化したプログラミングサービスを利用することをオススメします。
公式サイト:https://pyq.jp
PyQが用意した実行インターフェイスで勉強できるので開発環境の整備で挫折することはありません。
PyQについては以下の記事で詳しくまとめています!
Udemy
また、UdemyはRにもPythonにもオススメ!
公式サイト:https://www.udemy.com/
Udemyは世界最大のオンライン学習プラットフォームなんです!
・世界最大のオンライン学習プラットフォーム
・日本事業ではベネッセがパートナーになっている
・15万種類ものコース
・約3億人のユーザー登録
※2020年3月時点
手前味噌ですが、Pythonが学べるコースは以下2つ僕自身が講師を務めるものがオススメです!
ただ、UdemyもPyQも書籍も受動的な姿勢ではモチベが続かず継続しません。
スタビジアカデミー(スタアカ)
公式サイト:https://toukei-lab.com/achademy/
【価格】 | ライトプラン:1280円/月 プレミアムプラン:149,800円 |
---|---|
【オススメ度】 | |
【サポート体制】 | |
【受講形式】 | オンライン形式 |
【Pythonの学習範囲】 | データサイエンスを網羅的に学ぶ 実践的なビジネスフレームワークを学ぶ 実際に実データを使った様々なワークを行う |
データサイエンティストとしての自分の経験をふまえてエッセンスを詰め込んだのがこちらのスタビジアカデミー、略して「スタアカ」!!
当メディアが運営するスクールです。
がっつりPythonを使ったデータ分析について学びたいならスタアカがオススメです!
24時間以内の質問対応と現役データサイエンティストによる複数回のメンタリングを実施します!
カリキュラム自体は、他のスクールと比較して圧倒的に良い自信があるのでぜひ受講してみてください!
他のスクールのカリキュラムはPythonでの機械学習実装だけに焦点が当たっているものが多く、実務に即した内容になっていないものが多いです。
そんな課題感に対して、実務で使うことの多いSQLや機械学習のビジネス導入プロセスの理解などもあわせて学べるボリューム満点のコースになっています!
ウォルマートのデータを使って商品の予測分析をしたり、実務で使うことの多いGoogleプロダクトのBigQueryを使って投球分析をしたり、データサイエンティストに必要なビジネス・マーケティングの基礎を学んでマーケティングプランを作ってもらったりする盛りだくさんの内容になってます!
・BigQuery上でSQL、Google Colab上でPythonを使い野球の投球分析
・世界最大手小売企業のウォルマートの実データを用いた需要予測
・ビジネス・マーケティングの基礎を学んで実際の企業を題材にしたマーケティングプランの策定
Pythonが学べるプログラミングスクールは他にもいくつかあります。
以下にPythonが学べるスクールに関して詳しくまとめていますのでこちらもあわせてチェックしてみてください!
データ分析コンペ
ある程度基礎が出来てきたらデータ分析コンペに挑戦してみることをおすすめします。
データ分析コンペとしてはKaggleが圧倒的に有名ですが、世界中の猛者がしのぎを削っているのでなかなか入賞が難しいです。
一方で、国産コンペのNishikaなどはそれほど規模も大きくなく入賞しやすいのでまず最初に取り組んでみることをオススメします。
以下のような扱いやすいデータが公開されているのでオススメです!
・テーブルデータ: 【トレーニングコンペ】中古マンション価格予測
・画像データ:【トレーニングコンペ】絵巻物・絵本の画像分類
・テキストデータ:【トレーニングコンペ】文学:芥川龍之介
R/Pythonのオススメ本 まとめ
本記事では様々なおすすめ本を紹介してきましたが、これらの本を全て1からやろうとするのではなく自分に合った本・勉強法を選んでください!
また、内容もすべて1ページから進めようとするのでなく取り組みやすそうなところから取り組んでもらえれば幸いです。
統計学・機械学習のオススメ書籍に関しては以下の記事で取り上げていますのであわせてご覧ください!