こんにちは!元統計学専攻の大学院生、ウマ(@statistics1012)とシンエーです。
今ではデジタルマーケティング関連のお仕事をしています。
今では統計学を楽しんでいる私たちですが、昔はσとかμとかギリシャ文字を見るたびに胃がキリキリしていました笑
せっかく統計学を勉強しようとしても、最初に難書・悪書に出会ってしまうと、どうしても統計学に対して堅苦しくて難しいというような印象を持ってしまいます。
そこで、私たちの経験からこの本だったら絶対におすすめできる間違いないという本をいくつかご紹介します!!統計学を勉強する上での一助になればと思います。
ちなみに統計学と一言で言っても範囲が広すぎるので分野別に分けてご紹介します。
分野は明確に分けるのが難しいところもありますが以下のように分けました。
・伝統的な統計学
・ベイズ統計学
・多変量解析法
・機械学習
・時系列分析
・異常検知
・欠測データ解析
・タグチメソッド(品質工学)
・数学
・R・Python
・ビジネス
→こちらでは統計に関わるビジネスの本を紹介していますが、一般的なマーケティング・ビジネスの本に関しては「厳選20冊!マーケティングを学ぶ上でおすすめな本」
をご覧ください!
伝統的な統計学
確率のお話から記述統計、検定・推定について学んでいきます。全ての統計学に関連する解析法の土台となる考え方を学んでいきます。
完全独習 統計学入門
非常にやさしく分かりやすく、統計学に関して教えてくれます。統計学を勉強する上での初歩の初歩として非常に有用な良本です。
入門統計解析法
少し、話は高度になり数式なども出てきますが、基本的に高校レベルの数学ができれば問題なく理解できるレベルです。完全独習 統計学入門で統計学のイメージをつかんだとはこちらの本で理論の理解を深めましょう。入門レベルから中級レベルまでの橋渡しとして有用な本です。
統計学入門(基礎統計学)
東大出版から出ている名著です。赤本と呼ばれ慣れ親しまれています。レベル的には中級者~上級者で、1冊持っておくと、なにかと便利な1冊です!
伝統的な統計学の他のおすすめ本が知りたい方は以下の記事をご覧ください。

ベイズ統計学
ベイズ統計学は最近になって脚光を浴びている分野です。実世界のさまざまなところに応用されています。応用範囲が広いので様々なところに出てきますが理解が難しいところもあるので慎重に周りの人間と一緒に読み進めていくと良いと思います。
完全独習 ベイズ統計学入門
ベイズ統計学のイメージをつかむために非常に有用な本です。もしベイズ統計学を勉強しようとしているけどどの本で勉強したら良いかわからないなら迷わずこちらの本を取って下さい!
道具としてのベイズ統計学
完全独習 ベイズ統計学入門で簡単なイメージをつかんだ後はこちらの道具としてのベイズ統計学を読んで実際にペンを動かして自分で計算してみましょう。具体的な例もとにベイズ推定からMCMCまでの計算をすることができます。イメージをつかんだあとにそのままプログラミング言語を使った解析に行くのではなくここで手をつかって計算しておくことは非常に重要なステップです。
データ解析のための統計モデリング入門
ベイズ統計学を勉強する上では絶対名前ががあがる名著です。線形モデリングからベイズにおけるモデリングまで理解が進みます。伝統的な統計学とベイズ統計学を関連付けながら包括的に理解することができるでしょう。ある程度ベイズを理解した上で読むと良いでしょう。レベル的には中級者くらいでしょうか。
StanとRでベイズ統計モデリング
2016年10月に出版した割と新しめな本です!今までベイズモデリングを行う言語の分かりやすい書籍がなかったので非常に参考になります!ベイズ統計学をRとStanを用いて非常に分かりやすく学べるので、ある程度Rもつかいこなせるようになり、ベイズ統計学に関しても理解してきた段階で取り組んでみると良いでしょう!Stanは内部でMCMCを行うためデータセットによってはモデル構築に非常に時間がかかります。気長に待ちましょう。
他のベイズ統計学に関するおすすめ本は以下の記事に取り上げているのでそちらもご覧ください!

多変量解析
伝統的な統計学から一歩踏み出して回帰分析を始めとした多変量解析手法を学びます。
マンガで分かる統計学 回帰分析編
マンガで分かるシリーズはどれも分かりやすいですがこれも外していません。回帰分析に関して分かりやすくイメージをつかむために読んでおくと良いでしょう。
多変量解析法入門
多変量解析に関してはこちらの1冊で基本的にカバーできると思います。機械学習や時系列分析なども厳密には多変量解析ですが、ここではそれらを勉強する上での基礎となる回帰のお話から主成分分析などの話が丁寧に分かりやすく載っています。単回帰、重回帰、判別分析、主成分分析のところは丁寧に読み込んでおくと良いでしょう。
多変量解析における他のおすすめ本に関しては以下の記事をご覧ください!

機械学習
AIなどの根幹を担う機械学習手法群。数式からアルゴリズムを理解するのは難しいところもあるのでまずは図などからイメージを掴みましょう。
データマイニング入門
機械学習の各手法をRを用いて実装できる良本です。学部3年生の時に一番初期に手を付け、非常に勉強になったのを覚えています。ストーリー形式で進んでいくので分かりやすくさくさく読めます。図なども多いですが数式も登場します。機械学習手法のアルゴリズムに関しては理解に苦しむところもでてくると思うので全部理解しようとするのではなく、Rで手を動かして実践しイメージをつかみましょう。
はじめてのパターン認識
機械学習手法と言えばこの本です。ほぼすべての主要機械学習手法に関して網羅していますが、思ったより難しいです。はじめてのと付いていますが、概念的な説明よりも数式展開で話が進んでいくので、ある程度理解している人でないと読破するのは難しい印象です。ただ名著であることは間違いないので周りの人たちと一緒に読み進めていくのが理想です。私たちの研究室でも輪読に用いてみんなで理解を進めていきました。
機械学習における他のおすすめ本に関しては以下の記事をご覧ください!

時系列分析
実際の現場でよく使われる時系列分析。多変量解析の1分野として考えられがちですが、知らないと解釈を間違う多くの制約があるので時系列分析を行う人は必ず勉強しておいてください。
現場で使える時系列データ分析
理論よりもビジネス・実践ベースな本です。実際のデータからRを用いて解析をしてそこから時系列分析を学びます。時系列分析を最初から理論で理解しようとすると頓挫するので(体験談)、最初はイメージしやすいここらへんの書籍から入ると理解が進むと思います。
経済・ファイナンスデータの計量時系列分析
時系列分析というと必ず名前があがる名著。この著者である沖本さんはハミルトン本という最難関の時系列洋書を和訳している方です。時系列に関するエッセンスがまとまっていて絶対に外せない良書ですが、終始理論ベースで話が進んでいくのでとっかかりとしては良くありません。まずは先ほど挙げた「現場で使える時系列データ分析」などでイメージをつかむと良いでしょう。
時系列分析における他のおすすめ本に関しては以下の記事をご覧ください!

異常検知
異常検知は機械学習手法の1種として考えられるし時系列分析とも密接に関わってくるので、異常検知だけを専門にまとめている書籍はあまりありませんがここで紹介する井手さんの本は数少ない名著です!
入門機械学習による異常検知ーRによる実践ガイド
1変数の異常検知から多変数の異常検知まで包括的にまとめてあります。マハラノビス距離を用いた一般的な異常検知からベイズ理論を用いたものまで様々な異常検知手法が体系だって載っています。これだけ読めば異常検知に関しては十分だといえるほどのクオリティです。
異常検知と変化検知(機械学習プロフェッショナルシリーズ)
さきほど挙げた井手さんの本の続編という立ち位置です。こちらも良書ですが、前編と被っているところも多く、2冊買う必要もないかなと思います。方向統計学や最近の手法まで取り上げているので前編で物足りない人は読んでみても良いかもしれません。
異常検知における他のおすすめ本に関しては以下の記事をご覧ください!

欠測データ解析
実際に実データを解析してみようとするとデータに欠測(欠損)があるなんてことは当たり前です。欠測データ解析を学ぶと前処理としてどうやって欠測値を処理すれば良いかを知ることができます!
ここで紹介する本は分かりやすく、初学者でもイメージを掴んでもらえると思います!
欠測データ処理: Rによる単一代入法と多重代入法
欠測データの扱いの中でも代入法、特に多重代入法のやり方が詳しく分かりやすく書かれています!
Rのコードも載っていてパッケージの使い方をよく知ることが出来ます!
欠測データの統計解析 (統計解析スタンダード)
先ほどの本ではあまり触れられていない尤度に基づく解析方法や反復測定データの解析方法なども説明してあります。欠測データの扱いを全体的に紹介しています。
タグチメソッド(品質工学)
聞きなれない方も多いかもしれませんが、世界中の生産現場を支える手法、それがタグチメソッドなのです!
機械学習が苦手とするサンプルが少ないような状況でも高精度を発揮する手法などが目玉です。
タグチメソッド入門
非常に簡単にタグチメソッドについて述べられています。
分量も少なくスラスラ読めると思うので初めてタグチメソッドを勉強するという方はまず読んでみると良いと思います。
入門タグチメソッド
先程の「タグチメソッド入門」じゃ物足りないよという人にはこちらの本をおすすめします。
タグチメソッドの背後にあるアルゴリズムや式構造を理解することができると思います。
数学
統計学を勉強する上でやっぱり大事になってくるのは数学です。特に線形代数の理解が必要です。理論の理解を深める上では微分積分はそれほど重要ではありません。ある方程式を偏微分すればこんな値が出てきそうだよねくらいの理解があれば十分だと思っています。それ以上に圧倒的に重要なのが線形代数。行列を用いた理解・固有値などの話が分からないと機械学習手法を始めとする複雑な手法を理解するのは難しいでしょう。
キーポイント線形代数
薄い書籍で、線形代数を理解する上で重要なポイントだけが載っています。例題を進めながら理解していくと良いでしょう。
統計学のための数学入門30講
統計学に必要な数学の知識を30個のパートに分けて解説してくれます。非常に分かりやすく、表現も平易なので最後まで読み切ることができるでしょう。
これなら分かる最適化数学
あまり他のWebサイトなどで紹介されているのは見ませんが圧倒的におすすめの名著です!
数学をベースにして最適化手法について学んでいくのですが、それが実は様々な手法と関連しているということが分かってくると面白い。それほど読みやすい本ではないのでじっくり腰を据えて読むか輪読などで回りの学生と読むと良いと思います。これを1冊しっかり理解すると統計学をまた違った視点から見ることができるようになると思います!
数学における他のおすすめ本に関しては以下の記事をご覧ください!

R・Python
理論を一通り勉強しても解析ができないと意味がないですよね。データ解析に良く用いられる言語であるRとPythonのおすすめ本をご紹介します!
Rでやさしい統計学
Rを用いて伝統的な統計学の初歩のところから勉強することができます。伝統的な統計学の章挙げた本と併用して読み進めていくと良いでしょう。
データサイエンティスト養成読本
データサイエンティスト周りのお話から詳しい手法の説明までが載っています。詳しいアルゴリズムを完全に理解しようとするのではなく、Rを用いて手を動かして学んでいきましょう!
Pythonスタートブック
Pythonを勉強する上で一番はじめに読むべき非常にやさしくわかりやすい良書です。
ちなみにR・Pythonに関してもっと詳しくおすすめな本を知りたい方は以下の記事をご覧ください。

ビジネス
アカデミックな読み物ではなく、ビジネス色が強い読み物をご紹介します。
統計学を勉強することでどんな便利なことがあるのか!どのようにビジネスに活きるのか!
具体的にイメージを持ってから勉強に取り組むとより深い理解も得られるしモチベーションも高くなると思います。是非一読してみてください!
統計学は最強の学問であるシリーズ
統計学の重要性を世の中に広めた有名な本!
統計学をビジネスに活かしたいけど、何から勉強したらいいのかよく分からないという方には是非読んでいただきたい本です。
ビジネス編は統計学よりもビジネス色がかなり強く数式などもほとんど出てこないので一番はじめに読むと良いでしょう。ビジネス編→普通のやつ→実践編という順番で読むと良いと思います。
ビッグデータの正体
なぜ今ビッグデータが騒がれているのか。
ビッグデータの強さを世にしらしめたGoogleの例などが載っています。
読み物として純粋に面白いので是非読んでみてください!
データの見えざる手
データから人間の行動をすべて解明する衝撃的な内容です。
話の中で出てくるU分布などの例が統計の知識と紐づいて面白いです。
新しい視点で物事が見れるようになるので、是非読んで欲しいです!
より詳しいビッグデータ・AIに関連するおすすめ書籍は以下の記事をご覧ください!

まとめ
いかがだったでしょうか。初学者向けから上級者向けまでさまざまな書籍をご紹介してきました。
データ解析のためのモデリング入門、はじめてのパターン認識、入門機械学習による異常検知、最適化数学あたりは少し難しいですが、絶対に役に立つ本なので周りの人たちと取り組むことをおすすめします!