おすすめ書籍

厳選10冊!データ解析(R・Python)の勉強におすすめな本

こんにちは!

統計学を勉強する学生やデータ解析を行う方々が良く使う言語は何でしょうか。

RかPythonあたりが多いと思います。

これらの言語、比較的簡単と言われていますが、それでも独学でマスターするのはなかなか苦労すると思います。

C++とかJavaとかは勉強するWebサイト(ドットインストールとか)がたくさんあるんですが、RとPythonはなかなかまとまったコンテンツを提供してくれているところがありません!

そこでこの記事では、少しでもそのお手伝いができるようにRとPythonを勉強する上でおすすめな本をご紹介したいと思います。

R

Rは変数宣言などをする必要がなく、コーディングもシンプルなため、実は非常にとっつきやすい言語なんです。

世界中の頭の良い人がたくさんのライブラリーを作ってくれているので、そのライブラリーを呼び出すだけで、複雑な手法を使うことができます。高精度が期待されるランダムフォレストやサポートベクターマシンでさえ複雑なアルゴリズムなのにもかかわらず、わずか数行で記述することができます。

また、グラフィック描画にも優れており、ggplotというグラフィック描画ライブラリーを使うと非常に見やすいきれいなグラフを作ることができます。それでは、そんなポテンシャルの高いRを勉強する上でおすすめする本を見ていきましょう!

・現場ですぐ使える時系列データ分析

時系列分析とついているので時系列に関する解析がメインですが、「現場で使える」とついているように統計学を専門にしていない現場の人でもとりあえず解析できるような内容になっているため、Rの使い方を最初に勉強する本としては非常におすすめです。

・Rでやさしい統計学

統計学の基本的な検定・推定からはじまり包括的に伝統的な統計学に関して勉強できます。基本統計量など基本的な計算からRの勉強が始まるので、Rを触るのは初めてだというような人におすすめです。いわゆるビッグデータ解析とかデータマイニング・機械学習、ディープラーニングなんていうところは出てきませんが、全てのデータ解析の基礎となる統計学の考え方が勉強できます。

・データ解析のためのモデリング入門

名著中の名著!内容的には中級者向けですが、統計学を勉強する上で絶対に外せない本です。

RとWinbugsを使ったモデリングを勉強することができます。ちなみに統計モデリングを行うならWinbugsよりもStanという言語の方がおすすめなので次で紹介する本も並行して読んでみると良いと思います。

あまり、Rの勉強にクリティカルに役立つというわけではないかもしれませんが、この本を通して線形モデルからベイズモデルまでの流れを勉強することで必ず力がつくと思います。

StanとRでベイズ統計モデリング

こちらの本はベイズ統計モデリングを勉強するための本なのでRを勉強するのには特化していません。しかし、ベイズ統計学をRとStanを用いて非常に分かりやすく学べるので、ある程度Rもつかいこなせるようになり、統計学に関しても理解してきた段階で取り組んでみると良いでしょう!

・データマイニング入門

機械学習の各手法をRを用いて実装できる良本です。学部3年生の時に一番初期に手を付け、非常に勉強になったのを覚えています。ストーリー形式で進んでいくので分かりやすくさくさく読めます。機械学習手法のアルゴリズムに関しては理解に苦しむところもでてくると思うので全部理解しようとするのではなく、Rで手を動かして実践していきましょう!

・データサイエンティスト養成読本

データサイエンティスト周りのお話から詳しい手法の説明までが載っています。これもデータマイニング入門と同様に詳しいアルゴリズムを完全に理解しようとするのではなく、Rを用いて手を動かして学んでいきましょう!

・RstudioではじめるRプログラミング入門

統計学に関することは一旦おいておいてプログラミング言語としてのRを学びたいという方におすすめの本です。

この本は、「統計の知識がなくてもRを純粋にプログラミング言語として学ぼう」ということをコンセプトにして作られたらしく、データ解析というよりプログラミングよりのRのポテンシャルを引き出してくれる本です!

RはRtipsというサイトが非常にまとまっていて分かりやすいです。本を読みながら分からないところはRtipsで逆引きして勉強すると理解が深まると思います。Rtips逆引き辞典という本も出ていますが、Webサイトで十分でしょう。

Python

Pythonは今世界で最もホットな言語といわれています。スタンフォード大学の学生が学ぶ言語は圧倒的にPythonが一番です。また、エンジニアの言語別収入もPythonが一番です。なぜそこまでPythonが人気なのか。それはその汎用性にあります。Pythonはデータ解析と開発の2面性を持っているためPythonを勉強することでサービスの開発とデータ解析ができるようになります。ちなみにRはデータ解析に特化しており開発には向いておりません。

また、PythonもRと同様にライブラリーが充実しているため、簡単に複雑な手法を使うことができます。Pythonは世界中で盛り上がっている言語なので、ディープラーニングやテキストマイニングなどのホットな手法がいち早くライブラリーに落とされるので簡単に使うことができます。

ただ、Pythonはまだまだ日本語の充実したサイトが少ないので勉強する上での障壁が高いと思っています。事実私自身もPythonの勉強は始めてから数か月しか経っておらずまだまだ分からないことばかりです。ここでは、とっかりりに役立った本を紹介します。逐次更新していきたいと思ってます。

・Pythonスタートブック

Pythonを本当に簡単に教えてくれる良本!Pythonを全く勉強したことのない人はこちらをおすすめします!

・みんなのPython

Pythonスタートブックよりは難易度が上がるのでPythonスタートブックを読んである程度Pythonに慣れた後に読んで欲しい本。

Pythonを勉強する上での開発環境の整えから簡単な記述方法までは「ドットインストール」で無料で学べるのでそちらを参照すると良いと思います。

まとめ

様々なおすすめ本を紹介してきましたが、これらの本を全て1からやろうとするのではなく、自分に合った本を選んでください!また、内容もすべて1ページから進めようとするのでなく、取り組みやすそうなところから取り組んでもらえれば幸いです。

統計学全般のオススメ書籍に関しては以下の記事で取り上げていますので合わせてご覧ください!

あわせて読みたい
厳選30冊!統計学を勉強する上でおすすめな本こんにちは!統計学専攻の大学院生、ウマとシンエーです。 今では統計学を楽しんでいる私たちですが、昔はσとかμとかギリシャ文字を見る...