こんにちは!
データサイエンティストのウマたん(@statistics1012)です。
様々なデータの予測を行う上で非常に有用な手法である「機械学習」。
ただ機械学習は範囲が広く、勉強する足掛かりが掴みにくいのも確かです。
そこで、この記事では機械学習を勉強する上でおすすめな本をご紹介します!
この記事を読めば機械学習を理解するためにどのようなことを学んでいけばよいのか、そしてどんな本を選べばよいのかが分かりますよ!
目次
機械学習ってなに?
最近何かと話題の機械学習とはなんでしょうか?簡単に見ていきましょう!
以下の動画でも分かりやすく解説してますよー!
機械学習とは、英語に直してマシーンラーニングとも言いますよね。
機械学習の計算ロジックは、基本的に人間の思考プロセスと同じです。
人間はある一定の失敗を経験するとその失敗をしなくなりますよね?そう、それを機械が行うのを機械学習と呼ぶのです。
ある一定のデータを与えるとそのデータからパターンを見出し、さらに新たなデータが与えられたとき、それをパターンにあてはめて解釈します。
多変量解析との違いは多変量解析がデータの解釈に用いられるのに対し、機械学習はデータの予測に主に用いられます。
また、機械学習についてはこちらに詳しくまとめていますので良ければご覧ください!
機械学習のイメージを学ぶのにオススメな本
そんな機械学習ですが、理論的なところを詳しく説明する書籍に最初から挑戦すると心が折れてしまいます。
数式展開は一度置いておいてイメージをつかみやすい書籍から挑戦しましょう!
そして機械学習は理論を学ぶと同時に実装にはプログラミングの知識が必要。
機械学習に強いプログラミング言語であるPythonの勉強も同時にしていきましょう!
順番に見ていきましょう!
データマイニング入門
機械学習の各手法をRを用いて実装できる良本です。
学部3年生の時に一番初期に手を付け、非常に勉強になったのを覚えています。
ストーリー形式で進んでいくので分かりやすくさくさく読めます。
図なども多いですが数式も登場します。
機械学習手法のアルゴリズムに関しては理解に苦しむところもでてくると思うので全部理解しようとするのではなく、Rで手を動かして実践しイメージをつかみましょう。
データサイエンティスト養成読本
(2024/10/29 15:42:29時点 Amazon調べ-詳細)
データサイエンティストを目指す人向けに機械学習の手法の説明から、実データのRやPythonでの実行まで網羅しています。
理論的な数式展開はそれほど多くないのでこれから紹介する書籍よりは読みやすいでしょう。
データサイエンティストに関しては以下の記事にまとめています!
データ分析のための数理モデリング入門
(2024/10/30 08:28:11時点 Amazon調べ-詳細)
数理モデリングから、機械学習の理論、ベイズまわりなど非常に広範に網羅しているこの書籍。
堅苦しい説明は出来るだけ省かれていて、図で説明してくれるので非常に分かりやすいです。
数式も登場しますが、概念的に理解しやすいように説明してくれます。
統計学、機械学習の世界を網羅的に知る上で非常に役立つ本に仕上がっています。
ぜひ参考にしてみてください!
俺たちひよっこデータサイエンティストが世界を変える
手前味噌で恐縮なのですが、僕自身が「俺たちひよっこデータサイエンティストが世界を変える」という書籍を出版しています。
具体的なデータサイエンティストの仕事について分かりやすく書いている本がなかったので自分で執筆しました!
まずこれを読んでいただければ、機械学習をどのように実務に利用していくのかのイメージが湧くと思います。
ストーリー形式で分かりやすく書いていますので、ぜひ最初に目を通していただけるとイメージが湧くと思います。
価格は300円ちょっとですし、Kindle unlimitedであれば無料で読めるのでぜひチェックしてみてくださいね!
機械学習の理論をがっつり学ぶのにオススメな本
機械学習のアルゴリズムは非常に複雑。
それらを全て理解しておく必要はありませんが、知っているのと知らないのでは実際に使う時の結果の解釈が全く違います。
難しいけど理論をがっつり学べる本を紹介していきます!
はじめてのパターン認識
機械学習手法と言えばこの本です。
ほぼすべての主要機械学習手法に関して網羅していますが、思ったより難しいです。
はじめてのと付いていますが、概念的な説明よりも数式展開で話が進んでいくので、ある程度理解している人でないと読破するのは難しい印象です。
ただ名著であることは間違いないので周りの人たちと一緒に読み進めていくのが理想です。
当時、私たちの研究室でも輪読に用いてみんなで理解を進めていきました。
最適化数学
機械学習を学ぶ上で最適化の考え方は非常に重要です。
数学チックな内容で主題を機械学習に置いているわけではありませんが、機械学習の様々な手法と関係してくる内容です。
こちらも少し難解な内容が混ざっているので誰かと読むと良いですねー。
しっかり読み込むと機械学習への理解が深まります。はじパタに登場した手法と関連付けて読むとよいでしょう!
PRML上・下
(2024/10/29 17:04:02時点 Amazon調べ-詳細)
この本の原著がPattern Recognition and Machine Learningなので通称PRMLと呼ばれています。
ベイズ統計学を勉強する上でのおすすめ本にもご紹介しましたが、ベイズ理論を軸にして機械学習など様々な手法を詳細に教えてくれる名著です。
正直内容は難解で完全に上級者向けです。僕自身も読もうと思って完全には読んでないです。
ただ、分からないことがあったときに他の書籍では載っていないようなこともこの書籍には載っていたりするので1冊持っていると良いと思います。
機械学習の理論を学ぶ上ではベイズ理論も同時に学んでおくと良いです。
ベイズ理論に関しては以下の記事をご覧ください!
ディープラーニングを勉強するのにオススメな本
機械学習手法の中でも、現在非常に注目されているのがディープラーニング!
そんなディープラーニングを勉強するのにオススメな書籍を紹介しておきましょう!
ゼロから作るディープラーニング
(2024/10/30 01:34:47時点 Amazon調べ-詳細)
あまりにも有名なので、様々な人が紹介していますが、やっぱり名著!
これを読んでディープラーニングという得体の知れないモノに対して愛着がわくようになりました笑
概念・理論に関してはこの本さえ読んでおけばよいかなという感じです。
この本でメインで取り上げられているCNN(畳み込みニューラルネットワーク)については以下の記事で紹介しPythonで実装もしています。
ゼロから作るディープラーニング②
CNN(畳み込みニューラルネットワーク)では、時系列データを上手く解析することができません。
そんな欠点を改良したのがRNN(リカレントニューラルネットワーク)。
RNNでは同一の中間層を用いて再帰的にインプットが行われます。
再帰的という部分がReccurentと言われるゆえんです。
時系列データが扱えるようになると自然言語処理に応用できるんです。
RNNは音声認識や自動翻訳などに実際に使われているんですよー!
RNNについては以下の記事で詳しくまとめています!
ここでは、理論中心のディープラーニング本を紹介しましたが、ディープラーニングを使ってどのようなことができるのか・将来性・ビジネスへの導入など、全体感含め理解しておくことが大事です。
以下の記事でディープラーニングのおすすめ本をまとめていますのでチェックしてみてください。
機械学習を実装するR・Pythonを実行するのに必要な本
機械学習を実装するのにはプログラミング言語の学習が必須です。
RとPythonそれぞれを勉強できる本をこちらで紹介していきます!
Rによるやさしい統計学
統計学の比較的簡単な部分から実装できるので、Rの基礎を学ぶならこの本がオススメです。
正直Rtipsなどのネットのリファレンスを見れば学べることがほとんどだったりするのでそれで充分かも!
Pythonスタートブック
Pythonの基礎のキから学べる本。
最初の入りとしてはオススメ!
他にもこちらにまとめていますのでよければご覧ください!
Kaggleで勝つデータ分析の技術
Pythonの勉強と言うよりも、Kaggleに特化した書籍になってます。
Kaggleとは、世界の最強データサイエンティストが集まるデータ解析コンペティションのことで、与えられたデータを様々な角度から分析してアウトプットの精度を競います。
このKaggleでは、与えられたデータからどのように有用な特徴量(変数)を生み出し、いかに適切な分析手法を用いるかが肝になります。
ある程度Pythonが書けるようになった後に挑戦すると良いでしょう!
機械学習の実装を実務レベルまで落とし込む上で非常に有用です。
この本はPythonを使ったデータ分析能力をグゥーっと押し上げる上で非常にオススメです!
Kaggleに関しては以下の記事でまとめていますのでこちらもあわせてチェックしてみてください!
仕事で機械学習を活かすために読んでほしい本
機械学習の理論が分かって実装できるようになったとしても仕事で活かしていくには多くのハードルがあります。
それを乗り越えて、本当に価値あるビジネスインパクトを出すためにも読んでほしい書籍を紹介します。
仕事ではじめる機械学習
機械学習を学んで実際にビジネスシーンではなかなか上手くいかないことが多いです。
そんな時にオススメなのがこの「仕事ではじめる機械学習」!
この本は、ビジネス観点から機械学習について教えてくれる良書です。
個人的には機械学習の書籍なのに、
「機械学習を使わないで解決できる方法を考えよう!」
と書いてある点が非常に好感を持てます。
そう、機械学習はあくまで手段であり目的ではないんです。
機械学習を導入することが目的になってしまうプロジェクトは失敗しやすいです。
・何のために機械学習を導入するのか
・機械学習を導入しないで解決できる方法はないのか
について考えておきましょう!
会社を変える分析の力
著者は大阪ガスにて10年以上データ分析業務に従事してこられた河本さん。
事業会社のインハウスデータ分析屋さんとしての経験をもとにデータ分析を使ってどのように既存ビジネスに変革を起こしていくかということが語られています。
このように社内を駆け回ってデータ分析から価値を生み続けている方のお話は説得力があります。
専門的なデータの話はされていませんが、データ分析をビジネスに活かすために必要なことについて徹底的に語られている非常にオススメな書籍です。
機械学習の本と一緒に並行して欲しいカリキュラム
機械学習の本は、いきなり読むには難解で挫折してしまう可能性が高いです。
そこで、ぜひ当メディアが運営する以下のオンラインサービスと組みあわせて読み進めることをオススメします!
スタビジアカデミー(スタアカ)
公式サイト:https://toukei-lab.com/achademy/
【価格】 | ライトプラン:1280円/月 プレミアムプラン:149,800円 |
---|---|
【オススメ度】 | |
【サポート体制】 | |
【受講形式】 | オンライン形式 |
【Pythonの学習範囲】 | データサイエンスを網羅的に学ぶ 実践的なビジネスフレームワークを学ぶ 実際に実データを使った様々なワークを行う |
手前味噌ですが、、、データサイエンティストとしての自分の経験をふまえてエッセンスを詰め込んだのがこちらのスタビジアカデミー、略して「スタアカ」!!
当メディアが運営するスクールです。
24時間以内の質問対応と現役データサイエンティストによる複数回のメンタリングを実施します!
カリキュラム自体は、他のスクールと比較して圧倒的に良い自信があるのでぜひ受講してみてください!
他のスクールのカリキュラムはPythonでの機械学習実装だけに焦点が当たっているものが多く、実務に即した内容になっていないものが多いです。
そんな課題感に対して、実務で使うことの多いSQLや機械学習のビジネス導入プロセスの理解などもあわせて学べるボリューム満点のコースになっています!
ウォルマートのデータを使って商品の予測分析をしたり、実務で使うことの多いGoogleプロダクトのBigQueryを使って投球分析をしたり、データサイエンティストに必要なビジネス・マーケティングの基礎を学んでマーケティングプランを作ってもらったりする盛りだくさんの内容になってます!
・BigQuery上でSQL、Google Colab上でPythonを使い野球の投球分析
・世界最大手小売企業のウォルマートの実データを用いた需要予測
・ビジネス・マーケティングの基礎を学んで実際の企業を題材にしたマーケティングプランの策定
ご受講お待ちしております!
ちなみに機械学習やデータサイエンスが学べるプログラミングスクールは他にたくさんあります。
以下の記事でまとめているので是非チェックしてみてくださいね!
機械学習理論の深い理解には書籍は有用なので、ぜひ並行して取り組んでみることをオススメします!
機械学習のオススメ本 まとめ
機械学習を学ぶ上でオススメの書籍をまとめてきました!
機械学習の勉強法は以下の記事でまとめているのでこちらも興味があればご覧ください!
またデータサイエンス全般のオススメ書籍に関しては以下の記事で取り上げていますのであわせてご覧ください!