おすすめ書籍

厳選32冊!統計学を勉強する上でおすすめな本

書籍
ウマたん
ウマたん
当サイト【スタビジ】の本記事では、統計学のおすすめ書籍を分野別に徹底的にまとめていきます!統計学は難しいイメージがあるかもしれませんが学び方を間違えなければ大丈夫。悪書に当たると一気に挫折してしまうので気を付けてください。ここで紹介する書籍はどれも良本なので安心してくださいね!

こんにちは!

消費財メーカーのデータサイエンティスト、ウマたん(@statistics1012)です。

今では統計学を楽しんでいますが、昔はσとかμとかギリシャ文字を見るたびに胃がキリキリしていました笑

せっかく統計学を勉強しようとしても、最初に難書・悪書に出会ってしまうと、どうしても統計学に対して堅苦しくて難しいというような印象を持ってしまいます。

ロボたん
ロボたん
分かる分かる!堅苦しい本が多いからねー
ウマたん
ウマたん
「はじめて」とか「入門」とか書いてある初心者泣かせの本が多いからなー!

そこで、私たちの経験からこの本だったら絶対におすすめできる間違いないという本をいくつかご紹介します!!

統計学を勉強する上での一助になればと思います。

ちなみに統計学と一言で言っても範囲が広すぎる(広義のデータサイエンスとして定義しています)ので分野別に分けてご紹介します。

分野は明確に分けるのが難しいところもありますが以下のように分けました。

・伝統的な統計学
・ベイズ統計学
・多変量解析法
・機械学習
・時系列分析
・異常検知
・欠測データ解析
・タグチメソッド(品質工学)
・数学
・R・Python
・ビジネス
・AI/ディープラーニング

ウマたん
ウマたん
統計学のオススメ本をジャンル別に見ていこうー!

目次

伝統的な統計学

確率のお話から記述統計、検定・推定について学んでいきます。

全ての統計学に関連する解析法の土台となる考え方を学んでいきます。

完全独習 統計学入門

非常にやさしく分かりやすく、統計学に関して教えてくれます。

統計学を勉強する上での初歩の初歩として非常に有用な良本です。

入門統計解析法

少し、話は高度になり数式なども出てきますが、基本的に高校レベルの数学ができれば問題なく理解できるレベルです。

「完全独習 統計学入門」で統計学のイメージをつかんだとはこちらの本で理論の理解を深めましょう。入門レベルから中級レベルまでの橋渡しとして有用な本です。

統計学入門(基礎統計学)

東大出版から出ている名著です。赤本と呼ばれ慣れ親しまれています。

レベル的には中級者~上級者で、1冊持っておくと、なにかと便利な1冊です!

伝統的な統計学の他のおすすめ本が知りたい方は以下の記事をご覧ください。

ベイズ統計学

ベイズ統計学は最近になって脚光を浴びている分野です。

実世界のさまざまなところに応用されています。

応用範囲が広いので様々なところに出てきますが理解が難しいところもあるので慎重に周りの人間と一緒に読み進めていくと良いと思います。

完全独習 ベイズ統計学入門

ベイズ統計学のイメージをつかむために非常に有用な本です。

もしベイズ統計学を勉強しようとしているけどどの本で勉強したら良いかわからないなら迷わずこちらの本を取って下さい!

道具としてのベイズ統計学

「完全独習 ベイズ統計学入門」で簡単なイメージをつかんだ後はこちらの道具としてのベイズ統計学を読んで実際にペンを動かして自分で計算してみましょう。

具体的な例もとにベイズ推定からMCMCまでの計算をすることができます。

イメージをつかんだあとにそのままプログラミング言語を使った解析に行くのではなくここで手をつかって計算しておくことは非常に重要なステップです。

データ解析のための統計モデリング入門

ベイズ統計学を勉強する上では絶対名前ががあがる名著です。

線形モデリングからベイズにおけるモデリングまで理解が進みます。

伝統的な統計学とベイズ統計学を関連付けながら包括的に理解することができるでしょう。

ある程度ベイズを理解した上で読むと良いでしょう。

レベル的には中級者くらい。

StanとRでベイズ統計モデリング

Stanを学べるおすすめの本!

今までベイズモデリングを行う言語の分かりやすい書籍がなかったので非常に参考になります!

ベイズ統計学をRとStanを用いて非常に分かりやすく学べるので、ある程度Rもつかいこなせるようになり、ベイズ統計学に関しても理解してきた段階で取り組んでみると良いでしょう!

Stanは内部でMCMCを行うためデータセットによってはモデル構築に非常に時間がかかります。気長に待ちましょう。

他のベイズ統計学に関するおすすめ本は以下の記事に取り上げているのでそちらもご覧ください!

ベイズを書籍で学ぶのが不安という方にはUdemyの以下の講座が非常におすすめ!

Udemy コース PythonとStan

Python×Stanを学べる教材はなかなか世の中に出回っていないので非常に貴重ですよー!

多変量解析

伝統的な統計学から一歩踏み出して回帰分析を始めとした多変量解析手法を学びます。

マンガで分かる統計学 回帰分析編

マンガで分かるシリーズはどれも分かりやすいですがこれも外していません。

回帰分析に関して分かりやすくイメージをつかむために読んでおくと良いでしょう。

多変量解析法入門

多変量解析に関してはこちらの1冊で基本的にカバーできます。

機械学習時系列分析なども厳密には多変量解析ですが、ここではそれらを勉強する上での基礎となる回帰のお話から主成分分析などの話が丁寧に分かりやすく載っています。

単回帰、重回帰、判別分析、主成分分析のところは丁寧に読み込んでおくと良いでしょう。

多変量解析における他のおすすめ本に関しては以下の記事をご覧ください!

機械学習

AIなどの根幹を担う機械学習手法群。

数式からアルゴリズムを理解するのは難しいところもあるのでまずは図などからイメージを掴みましょう。

機械学習とはそもそも?という記事を以下にまとめていますので、こちらも参考にしてみてください!

データマイニング入門

機械学習の各手法をRを用いて実装できる良本です。

学部3年生の時に一番初期に手を付け、非常に勉強になったのを覚えています。

ストーリー形式で進んでいくので分かりやすくさくさく読めます

図なども多いですが数式も登場します。

機械学習手法のアルゴリズムに関しては理解に苦しむところもでてくると思うので全部理解しようとするのではなく、RもしくはPythonで手を動かして実践しイメージをつかみましょう。

はじめてのパターン認識

機械学習手法と言えばこの本です。

ほぼすべての主要機械学習手法に関して網羅していますが、思ったより難しいです。

はじめてのと付いていますが、概念的な説明よりも数式展開で話が進んでいくので、ある程度理解している人でないと読破するのは難しい印象です。

ただ名著であることは間違いないので周りの人たちと一緒に読み進めていくのが理想です。大学院時代に研究室の仲間と輪読で理解を進めていったのが懐かしいです。

機械学習における他のおすすめ本に関しては以下の記事をご覧ください!

機械学習のアルゴリズムを理解するには微積や線形代数に理解が必要になります。

なかなか書籍で学ぶのは難しいのですが、以下のUdemy講座なら分かりやすく学べるのでおすすめです!

時系列分析

実際の現場でよく使われる時系列分析

多変量解析の1分野として考えられがちですが、知らないと解釈を間違う多くの制約があるので時系列分析を行う人は必ず勉強しておいてください。

現場で使える時系列データ分析

理論よりもビジネス・実践ベースな本です。

実際のデータからRを用いて解析をしてそこから時系列分析を学びます。

時系列分析を最初から理論で理解しようとすると頓挫するので(体験談)、最初はイメージしやすいここらへんの書籍から入ると理解が進むと思います。

経済・ファイナンスデータの計量時系列分析

時系列分析というと必ず名前があがる名著。

この著者である沖本さんはハミルトン本という最難関の時系列洋書を和訳している方です。

時系列に関するエッセンスがまとまっていて絶対に外せない良書ですが、終始理論ベースで話が進んでいくのでとっかかりとしては良くありません。

まずは先ほど挙げた「現場で使える時系列データ分析」などでイメージをつかむと良いでしょう。

時系列分析における他のおすすめ本に関しては以下の記事をご覧ください!

異常検知

異常検知は機械学習手法の1種として考えられるし時系列分析とも密接に関わってくるので、異常検知だけを専門にまとめている書籍はあまりありませんがここで紹介する井手さんの本は数少ない名著です!

入門機械学習による異常検知ーRによる実践ガイド

1変数の異常検知から多変数の異常検知まで包括的にまとめてあります。

マハラノビス距離を用いた一般的な異常検知からベイズ理論を用いたものまで様々な異常検知手法が体系だって載っています。

これだけ読めば異常検知に関しては十分だといえるほどのクオリティです。

異常検知と変化検知(機械学習プロフェッショナルシリーズ)

さきほど挙げた井手さんの本の続編という立ち位置です。

こちらも良書ですが、前編と被っているところも多く、2冊買う必要もないかなと思います。

方向統計学や最近の手法まで取り上げているので前編で物足りない人は読んでみても良いかもしれません。

異常検知における他のおすすめ本に関しては以下の記事をご覧ください!

欠測データ解析

実際に実データを解析してみようとするとデータに欠測(欠損)があるなんてことは当たり前です。

欠測データ解析を学ぶと前処理としてどうやって欠測値を処理すれば良いかを知ることができます!

ここで紹介する本は分かりやすく、初学者でもイメージを掴んでもらえると思います!

欠測データ処理: Rによる単一代入法と多重代入法

欠測データの扱いの中でも代入法、特に多重代入法のやり方が詳しく分かりやすく書かれています!

Rのコードも載っていてパッケージの使い方をよく知ることが出来ます!

欠測データの統計解析 (統計解析スタンダード)

先ほどの本ではあまり触れられていない尤度に基づく解析方法や反復測定データの解析方法なども説明してあります。

欠測データの扱いを全体的に紹介しています。

タグチメソッド(品質工学)

聞きなれない方も多いかもしれませんが、世界中の生産現場を支える手法、それがタグチメソッドなのです!

機械学習が苦手とするサンプルが少ないような状況でも高精度を発揮する手法などが目玉です。

タグチメソッド入門

非常に簡単にタグチメソッドについて述べられています。

分量も少なくスラスラ読めると思うので初めてタグチメソッドを勉強するという方はまず読んでみると良いと思います。

入門タグチメソッド

先程の「タグチメソッド入門」じゃ物足りないよという人にはこちらの本をおすすめします。

タグチメソッドの背後にあるアルゴリズムや式構造を理解することができると思います。

統計学における数学

統計学を勉強する上でやっぱり大事になってくるのは数学です。

特に線形代数の理解が必要です。

理論の理解を深める上では微分積分はそれほど重要ではありません。

ある方程式を偏微分すればこんな値が出てきそうだよねくらいの理解があれば十分だと思っています。

それ以上に圧倒的に重要なのが線形代数。

行列を用いた理解・固有値などの話が分からないと機械学習手法を始めとする複雑な手法を理解するのは難しいでしょう。

キーポイント線形代数

薄い書籍で、線形代数を理解する上で重要なポイントだけが載っています。

例題を進めながら理解していくと良いでしょう。

統計学のための数学入門30講

統計学に必要な数学の知識を30個のパートに分けて解説してくれます。

非常に分かりやすく、表現も平易なので最後まで読み切ることができるでしょう。

これなら分かる最適化数学

あまり他のWebサイトなどで紹介されているのは見ませんが圧倒的におすすめの名著です!

数学をベースにして最適化手法について学んでいくのですが、それが実は様々な手法と関連しているということが分かってくると面白い。

それほど読みやすい本ではないのでじっくり腰を据えて読むか輪読などで回りの学生と読むと良いと思います。

これを1冊しっかり理解すると統計学をまた違った視点から見ることができるようになると思います!

統計学を勉強する上での数学における他のおすすめ本は以下の記事をご覧ください!

先ほども紹介しましたが、以下のUdemy講座は微積や線形代数と統計学と絡めながら学ぶのに最適です!

データ解析言語R・Python

理論を一通り勉強しても解析ができないと意味がないですよね。

データ解析に良く用いられる言語であるRとPythonのおすすめ本をご紹介します!

Rでやさしい統計学

Rを用いて伝統的な統計学の初歩のところから勉強することができます。

伝統的な統計学の章挙げた本と併用して読み進めていくと良いでしょう。

データサイエンティスト養成読本

データサイエンティスト周りのお話から詳しい手法の説明までが載っています。

詳しいアルゴリズムを完全に理解しようとするのではなく、Rを用いて手を動かして学んでいきましょう!

Pythonスタートブック

Pythonを勉強する上で一番はじめに読むべき非常にやさしくわかりやすい良書です。

ちなみにR・Pythonに関してもっと詳しくおすすめな本を知りたい方は以下の記事をご覧ください。

もし書籍でプログラミングを勉強するのはちょっと難しそう・・・という方はぜひUdemyPyQなどのオンライン学習サービスを試してみてください!

実際に自分で試してみてオススメできるサービスです!

統計を使ったビジネス

アカデミックな読み物ではなく、ビジネス色が強い読み物をご紹介します。

統計学を勉強することでどんな便利なことがあるのか!どのようにビジネスに活きるのか!

具体的にイメージを持ってから勉強に取り組むとより深い理解も得られるしモチベーションも高くなると思います。

是非一読してみてください!

俺たちひよっこデータサイエンティストが世界を変える

created by Rinker
¥322
(2020/08/09 11:11:28時点 Amazon調べ-詳細)

手前味噌で恐縮なのですが、僕自身が「俺たちひよっこデータサイエンティストが世界を変える」という書籍を出版しています。

具体的なデータサイエンティストの仕事について分かりやすく書いている本がなかったので自分で執筆しました!

ストーリー形式で分かりやすく書いていますので、ぜひ最初に目を通していただけるとイメージが湧くと思います。

価格は300円ちょっとですし、Kindle unlimitedであれば無料で読めるのでぜひチェックしてみてくださいね!

統計学は最強の学問であるシリーズ

統計学の重要性を世の中に広めた有名な本!

統計学をビジネスに活かしたいけど、何から勉強したらいいのかよく分からないという方には是非読んでいただきたい本です。

ビジネス編は統計学よりもビジネス色がかなり強く数式などもほとんど出てこないので一番はじめに読むと良いでしょう。

ビジネス編→普通のやつ→実践編という順番で読むと良いと思います。

ビッグデータの正体

なぜ今ビッグデータが騒がれているのか。

ビッグデータの強さを世にしらしめたGoogleの例などが載っています。

読み物として純粋に面白いので是非読んでみてください!

データの見えざる手

データから人間の行動をすべて解明する衝撃的な内容です。

話の中で出てくるU分布などの例が統計の知識と紐づいて面白いです。

新しい視点で物事が見れるようになるので、是非読んで欲しいです!

より詳しいビッグデータAIに関連するビジネスサイドから見たおすすめ書籍は以下の記事をご覧ください!

AI・ディープラーニング

今流行りのAIディープラーニングについてまとめた書籍を紹介します!

ビジネス色の強い書籍と理論よりの書籍がありますので両者とも紹介していきましょう!

人工知能は人間を超えるか ディープラーニングの先にあるもの

日本のディープラーニングと言えばこの人!東大の松尾教授。

松尾教授が独自の視点で人工知能が人類を超えるシンギュラリティに言及しています。

ディープラーニングの台頭でどのようなことができるようになったのかを概念的に知るには非常にオススメの1冊です!

ゼロから作るDeep Leaning

ゼロから作るDeep Leaningはディープラーニングを勉強する上で必読中の必読の書籍!

ブラックボックスで語られがちなディープラーニングの中身を基礎的なところから紐解きます。

非常に読みやすく、少し数学や統計の知識があれば容易に読み進められるでしょう!

Pythonの実装例も詳しく教えてくれるので手を動かしながら学べます。

AIに関してはこちらの記事

より理論的なディープラーニングに関しては以下の記事をご覧ください!

本だと続かないな・・という人にオススメのサービス

PC

統計学から機械学習・ディープラーニングの理論を深めるには書籍は非常にオススメですが、なかなか書籍だと取っつきにくいのも事実。

またPythonやRなどのプログラミング実装に関して言うと、書籍で学ぶよりもオンラインサービスやプログラミングスクールで勉強した方が効率が良いんです!

ここでは、本だと続かないな・・・という人にオススメのサービスを紹介していきます!

動画で学びたいならUdemy!

Udemy
【価格】1000円~(コース売り切り型)
【オススメ度】

Udemyは様々な専門知識が学べるプラットフォーム!

統計やデータサイエンスに特化したプラットフォームではありませんが、統計学関連の講座だけで300近くあります!

Udemyでは、好きな講座を売り切り価格で購入することができるので、自分のレベルに合った講座だけをつまみ食いして勉強することが可能です!

また講座別の評価も明記してあるので、選びやすいです!

Udemyには他にもたくさんのコースがあります。

統計学の実装に必要なPythonコースを20個以上受講してそれぞれをレビューしているのでよければチェックしてみてください!

\30日間返金無料/

集中的に勉強するならテックアカデミー!

テックアカデミートップページ
【価格】139,000~
【オススメ度】

テックアカデミーは、オンライン学習ですが現役エンジニアのパーソナルメンターがつくので分からないところも解消しやすく完全独学で進めるよりは圧倒的に進みが早いです。

価格は3か月で239,000円!

テックアカデミー 価格表

ただテックアカデミーは教材のクオリティが低く書籍と比べると・・・

メンターのレベルは非常に高いので自分のやる気さえあれば教材の範囲を超えた内容をガツガツ学ぶことが可能!

僕自身3か月のコースを1か月で終わらせて応用をガツガツ学んでました。

どちらにせよやる気があって良い意味でメンターを使い倒せる自信があるのであればテックアカデミーは非常にオススメです!

※メンターは変更を願い出れば変えられます。

コースは以下の4つがありますが、

・Pythonコース
・はじめてのAIコース
・AIコース
・データサイエンスコース

AIコースかデータサイエンスコースがオススメです!

画像認識などAIの活用まで踏み込みたいならAIコース、機械学習などを使った予測やデータ分析を深めたいならデータサイエンスコースでしょう!

統計の理論を学ぶ目的の講座はありません、基本は手を動かしながら実践を学んでいくイメージです。

以下の記事で実際の体験談を記事にしています。

【体験談】テックアカデミー評判は?3か月本気受講してみたので徹底レビュー!当ブログ【スタビジ】では、様々なプログラミングスクールの中からテックアカデミーのメリット・デメリット・評判について3か月の体験談をもとに赤裸々にレビューしていきます。...

統計学を勉強するのにオススメのサービスは以下の記事で詳しくまとめていますので是非チェックしてみてください!

まとめ

この記事では、初学者向けから上級者向けまでさまざまな書籍をご紹介してきました。

データ解析のためのモデリング入門はじめてのパターン認識入門機械学習による異常検知最適化数学ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装あたりは少し難しい部分もありますが、絶対に役に立つ本なので周りの人たちと取り組むことをおすすめします!

理論を深く学ぶのに本は非常にオススメですが、全体感を学んだりPython実装まわりを勉強するのには最後に紹介したサービスを検討してみると良いでしょう!

また入門者向けの統計学の勉強範囲や勉強方法について以下の記事でまとめていますので合わせてチェックしてみてください!

統計学の本だと進めづらいという人は、ぜひ講座もチェックしてみてください!

ウマたん
ウマたん
一緒に統計学・データサイエンスを勉強していこう!

Pythonを初学者が最短で習得する勉強法

Pythonを使うと様々なことができます。しかしどんなことをやりたいかという明確な目的がないと勉強は捗りません。

Pythonを習得するためのロードマップをまとめましたのでぜひチェックしてみてくださいね!