おすすめ書籍

データサイエンティストが選ぶデータサイエンスを学ぶ上でオススメな本・教材20選!

デーサイエンス本
ウマたん
ウマたん
当サイト【スタビジ】の本記事では、データサイエンスを学ぶ上でオススメできる本を厳選して紹介していきます。ここではデータサイエンティストになるために習得するスキルをデータサイエンスと称しております。いくつかの観点に切り分けて見ていきます。

こんにちは!データサイエンティストのウマたん(@statistics1012)です。

わりとマーケティングサイドの仕事もガッツリやっているんですが、大学院時代は統計学を専攻していて最近は業務がマーケティングよりもデータサイエンスにかなり寄ってきてます。

そんな僕がデータサイエンスを学ぶ上でのオススメ本や教材を紹介していきたいと思います!

ここでオススメした書籍で学びながらも並行して手を動かすためにデータ分析コンペNishikaKaggleを利用することをオススメします。

ウマたん
ウマたん
データサイエンスを挫折せず続けやすい本・教材を紹介していくよ!

目次

そもそもデータサイエンスって何?

stories pc

そもそもデータサイエンスって何なのかについて考えていきましょう。

以下の動画でも解説しています!

一時、データサイエンティストという職業が「21世紀最もセクシーな職業」なんてもてはやされてからデータサイエンスという言葉も聞かれるようになってきました。

Googleトレンドを見てみると、データサイエンスとデータサイエンティストの需要が右肩上がりで上がってきていることが分かります。

一方、ビッグデータは一時の流行りは落ち着いてきているみたい。

そんなデータサイエンスですが、主に3つのスキルに分かれます。

※データサイエンティストのスキルをここではデータサイエンスと定義します。2番目の統計学の部分だけをデータサイエンスとくくる場合もあります。

一つ目がエンジニアリング・ITスキル

こちらはデータの抽出・加工、分析、データ連携、データベース構築などのスキル。SQL・R・Pythonなどのスキルセットが望ましいと思ってください。

二つ目が統計学や機械学習の理論のスキル

こちらは、実際にエンジニアリングした結果を正しく統計的に解釈することができるか。データに惑わされない勘所を押さえておくべきです。

検定を行った時のよくある勘違いや・偽相関時系列データの見せかけの相関などエンジニアリングして出力した結果に対して解釈を間違えると大変なことになるパターンもあります。

三つ目がマーケティング・ビジネスのスキル

そして最後にマーケティング・ビジネス視点の能力。これがないと、分析をして結果解釈までして果たしてその後どうするかまで導き出せません。

この能力がないと、無用の長物になってしまうことが多いです。

データを解析してそこから洞察を抽出し実際にビジネスインパクトにつなげる業務を一気通貫で行うのがデータサイエンティストという職業なのです!

とは言っても、これを一人で全部完璧に行うのは厳しいのでチームで疑似データサイエンティストを作っているパターンも多いです。

データサイエンティストに関して詳しくは以下の記事をご覧ください!

【入門者向け】データサイエンティストに必要なスキルと独学勉強ロードマップ!当サイト【スタビジ】の本記事では、データサイエンティストに求められるスキルとそれを身に付けるための勉強法について徹底的にまとめていきます!入門者でも、しっかりデータサイエンティストについて理解しある程度独学で駆け出しの状態までいけることを目指します。...

データサイエンスを勉強するのにオススメな本・教材20選!

studies book

それでは、早速データサイエンスを勉強するのにオススメな本や教材を見ていきましょう!

エンジニアリング・ITスキルを勉強するのにオススメな本・教材6選!

まずは、先ほどの必要な1つ目のスキル、エンジニアリングスキル

とりあえずPython(もしくはR)・SQLが書ければそれほど困らずやりたいことを実現できます。

エンジニアリング領域は本だけでなく動画教材も合わせて見ながら学習することをオススメします!

Pythonスタートブック

created by Rinker
¥2,750
(2021/10/24 22:34:06時点 Amazon調べ-詳細)

他のプログラミング言語を触ったことある人には少し退屈な内容かもしれませんが、かなり初歩的なところからPythonについて学ぶことが可能です。

Pythonについて本で学ぶのはこれくらいで、それ以外はWebサービスとかプログラミングスクールで実際に手を動かして覚えたほうが良いと思います。

以下の記事で、自分なりにPythonを勉強するのにオススメな方法についてまとめているのでそちらも参考にしてみてください!

Python 勉強
【Python独学勉強法】初心者が3か月で習得できるロードマップ!当サイト【スタビジ】の本記事では、過去僕自身がPythonを独学を駆使しながら習得した経験をもとにPythonを効率よく勉強する方法を具体的なコード付き実装例と合わせてまとめていきます。Pythonはできることが幅広いので自分のやりたいことを明確にして勉強法を選ぶことが大事です。...

Kaggleで勝つデータ分析の技術

created by Rinker
¥3,428
(2021/10/24 22:52:56時点 Amazon調べ-詳細)

超絶売れている名著!

データの前処理、特徴量作成、モデリング、評価などを学ぶのに非常にオススメな書籍なんです!!

Kaggleというのは世界的に有名なデータ分析コンペで世界中のデータ分析の猛者が日々しのぎをけずっています。

コンペとはいっても参加するのには複雑な手続きなどはいらず誰でも簡単に参加できるので、初心者の方がデータ分析のスキルを身に着けていくのにうってつけの場です。

そんなKaggleには称号というものがあり、コンペで優秀な成績をおさめると一定の基準でグランドマスターやマスターなどの称号が与えられます。

それらの称号を得ている人たちが共著で執筆したのが、この「Kaggleで勝つデータ分析の技術」なんです。

ただ注意しておいて欲しいのがこの書籍はあくまでKaggleコンペでのデータ分析に特化しているということ。

コンペではある程度整形されたデータが提供され、分析課題も決まっています。

実務のデータ分析では、そもそも課題の洗い出しからデータ分析に値する課題設定と目的の明確化、そしてデータ取得、現場への導入など前処理・モデリング・モデル評価以外の工程もたくさんあるんです。

そこをしっかり理解した上で読みましょう!

この書籍の章立ては以下のようになっています。

第1章:分析コンペとは
第2章:タスクと評価指標
第3章:特徴量の作成
第4章:モデルの作成
第5章:モデルの評価
第6章:モデルのチューニング
第7章:アンサンブル

ぜひこの書籍を読んでKaggleに挑戦してみましょう!

【初心者向けKaggle入門】Kaggleサブミットの前準備と勉強法!当サイト【スタビジ】の本記事では、Kaggleについて解説していきKaggleに挑戦するまでにどのようなことを勉強しておいたらよいのか丁寧に解説していきます。ある程度データサイエンスの土台が出来た後はKaggleに挑戦し、世界各国の猛者と凌ぎを削りましょう!...

【初学者向け】データ分析コンペで楽しみながら学べるPython×データ分析講座

Udemy-course
【オススメ度】
【講師】僕!
【時間】4時間
【レベル】初級~中級

手前味噌ですが、僕自身がデータ分析関連のUdemyコースを公開しています!!

僕自身がUdemyの色んなコースを受けてみた中で、他のコースにはないこんなコースあったらいいなみたいなコースを作ってみました。

このコースは、なかなか勉強する時間がないという方に向けてコンパクトに分かりやすく必要最低限の時間で重要なエッセンスを学び取れるように作成しています。

アニメーションを使った概要編ハンズオン形式で進む実践編に分かれており、概要編ではYoutubeの内容をより体系的にデータ分析・機械学習導入の文脈でまとめています。

データサイエンスの基礎について基本のキから学びつつ、なるべく堅苦しい説明は抜きにしてイメージを掴んでいきます。

統計学・機械学習の基本的な内容を学び各手法の詳細についてもなるべく概念的に分かりやすく理解できるように学んでいきます。

そしてデータ分析の流れについては実務に即したCRISP-DMというフレームワークに沿って体系的に学んでいきます!

データ分析というと機械学習でモデル構築する部分にスポットがあたりがちですが、それ以外の工程についてもしっかりおさえておきましょう!

続いて実践編ではデータコンペの中古マンションのデータを題材にして、実際に手を動かしながら機械学習手法を実装していきます。

ここでは、探索的にデータを見ていきながらデータを加工し、その上でLight gbm という機械学習手法を使ってモデル構築までおこなっていきます。

是非興味のある方は受講してみてください!

\30日間全額返金可能/このコースを見てみる

現役シリコンバレーエンジニアが教えるPython 3 入門 + 応用 +アメリカのシリコンバレー流コードスタイル

Udemy コース データサイエンス
【オススメ度】
【講師】シリコンバレーのSplunkで働く現役エンジニア
【時間】28.5時間
【レベル】初級~上級

シリコンバレーで働く現役エンジニアの酒井さんのコースです。

Pythonにおけるエンジニアリング領域の内容を非常に深く学ぶことが出来ます。

シリコンバレーで働いている現地の様子なども知れるので米国で働くことを夢見ている人必見のコースになります。

このコースは初歩の初歩から上級レベルまで幅広く網羅しているのが特徴です。

それもそのはずUdemyのコースとしては相当ボリューミーな28.5時間というコンテンツ量。

テンポよく話すのでそれで28.5時間は相当なコンテンツ量です。

チーム開発を進めていく上でのPython記述法の極意も学べるのである程度Pythonに知見がある方でも勉強になります。

\30日間全額返金可能/このコースを見てみる

RstudioではじめるRプログラミング入門

created by Rinker
¥2,860
(2021/10/25 01:49:17時点 Amazon調べ-詳細)

統計学に関することは一旦おいておいてプログラミング言語としてのRを学びたいという方におすすめの本です。

この本は、「統計の知識がなくてもRを純粋にプログラミング言語として学ぼう」ということをコンセプトにして作られたらしく、データ解析というよりプログラミングよりのRのポテンシャルを引き出してくれる本です!

RはRtipsというサイトが非常にまとまっていて分かりやすいです。

本を読みながら分からないところはRtipsで逆引きして勉強すると理解が深まると思います。

Rtips逆引き辞典という本も出ていますが、Webサイトで十分です。

Rのオススメ本は以下の記事で他にも紹介しています!

R Pythonの本
厳選10冊!データ解析(R・Python)の勉強におすすめな本当サイト【スタビジ】の本記事では、PythonとRを勉強するのにおすすめな書籍を徹底的にまとめていきます!書籍だと続かない・・・という人のために書籍以外の勉強法についても紹介していきますのでぜひチェックしてみてください!...

スッキリわかるSQL入門ドリル215問付き!スッキリわかるシリーズ

こいつはアマゾンでの評価が高くて飛びついて買った本です。

この本に出てくるロボットがめちゃくちゃ分かりやすくSQLについて教えてくれます。

ドリルも付属として付いてくるので、手を動かして練習しながら勉強しましょう。

データベース環境がない方も問題ありません!

こちらの本では仮想データベース環境を用意してくれるのでそこからログインして勉強することができるんです。

SQL本と勉強方法については以下の記事をチェックしてみてください!

SQL
SQLを最速でマスターできるオススメ本と勉強方法!当サイト【スタビジ】の本記事では、SQLを勉強するのにオススメな本と勉強法についてまとめていきます!SQLはデータサイエンスの基本であり必ずマスターしておかなくてはいけない言語です。早い段階から手を動かすことで理解が深まりますよー!...

また、R/Python/SQLなどデータ分析に必要な言語とそれらの学習方法について以下の記事でまとめていますのでよければ見てみてください!

統計モデリングに強いStanという言語もあるんですよー!

統計解析を行う上で便利なプログラミング言語を比較!当サイト【スタビジ】の本記事では、統計解析において便利なプログラミング言語「Python/R/Stan/SQL」を比較していきます。それぞれのプログラミング言語にどのような特徴があるのか、どのように勉強していけばよいのか見てきますよー!...

統計学・機械学習の理論を勉強するのにオススメな本・教材10選!

元々バックグラウンドが理論系なので、統計学機械学習の理論に関してはたくさんオススメしたい本があるのですが、初歩的な話から名著まで厳選して紹介したいと思います。

またこの領域に関してもまずは動画教材でイメージをつかむことが有用です。

徐々にレベルが高くなっていくように並べています。

【世界で21万人が受講】データサイエンティストを目指すあなたへ〜データサイエンス25時間ブートキャンプ〜

Udemy コース データサイエンス
【オススメ度】
【講師】ITコンサルタント
【時間】26時間
【レベル】初級

非常に簡単で分かりやすいので、まず全体感をつかむために見て欲しい!

海外で非常に人気だったデータサイエンスコースの日本語版!

コミカルな動画と共にデータサイエンスの理論が幅広く学べるので非常に分かりやすく、かつボリューミーです。

ビジネスサイドの話からデータサイエンスについて学べるのでビジネスサイドの人でも入りやすいです。

章立ての最後にある実践問題では、学んだ内容を実際にビジネスでどのように使うか分かりやすく解説してくれます!

本筋とはあまり関係ありませんが、k近傍法(Knn)k平均法(Kmeans)を間違って使っていて、だいぶ気になりました笑

最後には実データを使って実際の前処理→ロジスティック回帰による分析→タブローで可視化という流れを行っていくので実践に即した内容になっています。

\30日間全額返金可能/このコースを見てみる

【キカガク流】人工知能・機械学習 脱ブラックボックス講座ー初級編ー

Udemy コース アルゴリズム
【オススメ度】
【講師】株式会社キカガク代表取締役
【時間】4.5時間
【レベル】初級

統計学の基本となる単回帰分析を数式から学んでいくもの。

ビックリしたんですが、パワポではなく紙に手書きで進んでいくんです!

よくよく考えたら学生時代の教育は先生が手書きで黒板に書いて進めてましたもんね。

統計学や機械学習理論の書籍に進む前の数学慣れにピッタリの教材になっています!

数学のレベルは高校2年生の数ⅡBレベルが何となくわかれば大丈夫です。

\30日間全額返金可能/このコースを見てみる

【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 中級編 –

Udemy コース ブラックボックス中級
【オススメ度】
【講師】株式会社キカガク代表取締役
【時間】4.5時間
【レベル】初級~中級

初級編は単回帰分析について微分を使って紐解いていきますが、本コースでは線形代数を学びながら重回帰分析まで展開していきます。

線形代数は機械学習を学ぶ上で非常に重要なんです!

実際に数式的に重回帰分析を行い、その後にscikit-learnを使って分析を行っていきます。

このコースを受講しておけば、書籍で突然出てくる行列やベクトルに対しても吐き気をもよおさず読み進めることができるでしょう!

\30日間全額返金可能/このコースを見てみる

入門統計解析法

created by Rinker
¥3,190
(2021/10/24 20:30:37時点 Amazon調べ-詳細)

基本的に高校レベルの数学ができれば問題なく理解できるレベルです。

僕自身大学1年生~2年生の時に統計学を体系的に学ぶ上で非常に役立った本です。

統計学の考え方から検定回帰分析まで学ぶことができます。

これで統計学の土台が作り上げられたと言っても過言ではありません。オススメです。

多変量解析法入門

created by Rinker
¥2,420
(2021/10/25 13:39:44時点 Amazon調べ-詳細)

多変量解析に関してはこちらの1冊で基本的にカバーできると思います。

機械学習時系列分析なども厳密には多変量解析ですが、ここではそれらを勉強する上での基礎となる回帰のお話から主成分分析などの話が丁寧に分かりやすく載っています。

単回帰、重回帰、判別分析、主成分分析のところは丁寧に読み込んでおくと良いでしょう。

データ分析のための数理モデル入門

データサイエンスにおいて必要な数理モデルを包括的に学ぶことができるのがこの 「データ分析のための数理モデル入門」!

数式による解説を最小限におさえてイメージでつかめるようになっているため、初学者の入門書として最適です。

統計学の入門と多変量解析について理解した後に、統計モデリングや機械学習の世界に入っていく前の橋渡しとして読んでいただけると理解が深まると思います。

データ解析のための統計モデリング入門

統計モデリングの本で、どのようにモデルを作り上げていくか非常に勉強になります。

線形モデリングからベイズにおけるモデリングまで理解が進みます。

伝統的な統計学とベイズ統計学を関連付けながら包括的に理解することができるでしょう。

はじめてのパターン認識

created by Rinker
¥3,300
(2021/10/24 22:55:54時点 Amazon調べ-詳細)

機械学習手法と言えばこの本!

統計学全般の理解が進んだあとは、機械学習系のアルゴリズムにもある程度触れておいた方がよいでしょう!

ほぼすべての主要機械学習手法に関して網羅していますが、結構難しいです。

はじめてのと付いていますが、概念的な説明よりも数式展開で話が進んでいくので、ある程度理解している人でないと読破するのは難しいです。

ただ名著であることは間違いないので周りの人たちと一緒に読み進めていくのが理想です。大学院時代に研究室の輪読に用いてみんなで理解を進めていきました。

これなら分かる最適化数学

created by Rinker
¥3,190
(2021/10/25 16:32:21時点 Amazon調べ-詳細)

あまり他のWebサイトなどで紹介されているのは見ませんが圧倒的におすすめの名著です!

数学をベースにして最適化手法について学んでいくのですが、それが実は様々な手法と関連しているということが分かってくると面白い。

それほど読みやすい本ではないのでじっくり腰を据えて読むか輪読などで回りの人と読むと良いと思います。

これを1冊しっかり理解すると統計学をまた違った視点から見ることができるようになると思います!

ゼロから作るディープラーニング

ディープラーニングの理論について実際にゼロから実装しながら理解していく名著です。

もし機械学習を一通り勉強してディープラーニングについてさらに踏み込んで学びたい場合はこちらの書籍を読んでいただくとより一層理解が深まると思います。

非常に分かりやすく、かなり平易なところから解説されています。

ディープラーニングの勉強法やおすすめ書籍に関しては以下の記事で簡単にまとめています!

書籍
ディープラーニングを学習する上でオススメな本と勉強法当サイト【スタビジ】の本記事では、ディープラーニングを学習するのにオススメな本と勉強法について紹介していきます。ディープラーニングだけ分かっても意味がありません。まずは、データサイエンスの基本である機械学習手法を理解してPythonで実装できるまでになりましょう!...

 

統計学・機械学習理論の本はこれ以外にも色々とオススメな本があるので是非以下の記事を参考にしてみてください!

書籍
厳選32冊!統計学を勉強する上でおすすめな本当サイト【スタビジ】の本記事では、統計学のおすすめ書籍を分野別に徹底的にまとめていきます!統計学は難しいイメージがあるかもしれませんが学び方を間違えなければ大丈夫。悪書に当たると一気に挫折してしまうので気を付けてください。ここで紹介する書籍はどれも良本なので安心してくださいね!...

マーケティング・ビジネスを学ぶのにオススメな本・教材4選!

正直、ここの部分が一番習得が難しかったりするんですよね・・・体系だって学ぶことはなかなか難しい。

実践で学ばないと結局机上の空論になってしまいます。

ただ実際にデータをどのようにマーケティングに活かしているかを知るのは非常に大事。

データ的側面からビジネスに落とし込む話が学べる本の中でオススメをいくつか紹介していきます。

俺たちひよっこデータサイエンティストが世界を変える

created by Rinker
¥322
(2021/10/25 13:30:21時点 Amazon調べ-詳細)

手前味噌で恐縮なのですが、僕自身が「俺たちひよっこデータサイエンティストが世界を変える」という書籍を出版しています。

具体的なデータサイエンティストの仕事について分かりやすく書いている本がなかったので自分で執筆しました!

ストーリー形式で分かりやすく書いていますので、ぜひ最初に目を通していただけるとイメージが湧くと思います。

価格は300円ちょっとですし、Kindle unlimitedであれば無料で読めるのでぜひチェックしてみてくださいね!

【データサイエンス×ビジネスコミュニケーション】現役データサイエンティストが教える「伝えて動かすデータ分析」

ビジネス データ分析
【オススメ度】
【講師】データサイエンティスト
【時間】12.5時間
【レベル】初級

現役のデータサイエンティストがビジネスと絡めてデータ分析について教えてくれる講座です。

他の講座では技術偏重であるのに対して、このコースは実務に即したビジネス×データサイエンスについて学べるコースになっていて、ビジネスシーンでどのようにデータ分析を推進していけばよいのか知りたい!という方には是非読んでほしい書籍です。

\30日間全額返金可能/このコースを見てみる

仕事ではじめる機械学習

created by Rinker
¥987
(2021/10/24 23:24:25時点 Amazon調べ-詳細)

この本は、ビジネス観点から機械学習について教えてくれる良書です。

個人的には、機械学習の書籍なのに、機械学習を使わないで解決できる方法を考えよう!と書いてある点が非常に好感を持てます。

そう、機械学習はあくまで手段であり目的ではないんです。

機械学習を導入することが目的になってしまうプロジェクトは失敗しやすいです。

何のために機械学習を導入するのか・機械学習を導入しないで解決できる方法はないのか、について考えておきましょう!

確率思考の戦略論

created by Rinker
¥3,520
(2021/10/25 16:20:52時点 Amazon調べ-詳細)

言わずと知れた森岡毅さんの名著ですね。

この前に発売された「USJを変えたたった一つの考え方」は消費者視点のマーケティングを考える上で非常に勉強になる本だったのですが、こちらの「確率思考の戦略論」は一転して数学的色の非常に強い内容になっています。

USJで打ち出された様々な施策が実はこれほど精緻な計算のもと出されたものだったとは驚きました。

デジタルマーケティングを行う上で非常に重要な数字的側面を勉強できます。

堅苦しい数式などは本編と分けられていて、数学に強くない人でも分かりやすく学べるようになっています。

是非読んでみてください!

ちなみにデジタルマーケティングを学ぶ上で学ぶオススメ本は以下にまとめています。

書籍
厳選14冊!デジタルマーケティングを勉強する上でオススメな本!当サイト【スタビジ】の本記事では、デジタルマーケティングを学ぶ上でオススメの書籍をまとめていきます!デジタルマーケティングとはいえテクノロジーよりの本とマーケ概論よりの本があります。どちらも理解してこそ真のデジタルマーケターと言えるでしょう!...

データサイエンスを学ぶ上でオススメな本 まとめ

見事に紹介した本・教材の数が、3:5:2ということで自分の理論への偏りを感じます笑

ただ、ここで紹介してきた本はどれもデータサイエンスを本格的に学ぶ上で身になる本です!

是非手に取ってみてください。

データサイエンスの理論を学ぶ上ではエッセンスが書籍に詰まっているので書籍を読んで欲しいのですが、全体感をつかむ上ではまず本でない方がよいと思っています。

最初の取っ掛かりとしては分かりにくく挫折してしまう人が多いイメージを持っています。

そのため、適宜紹介したUdemyの動画でぜひ学んでみてください!

Udemyは、世界最大の教育オンライン学習プラットフォーム!

書籍やUdemyで学びながらも並行して手を動かすためにデータ分析コンペNishikaなどを利用してみることをオススメします。

以下のトレーニングコンペが様々な構造データに対してベーシックなスキルを付けられるのでオススメです!

もしモチベーションが保てないという人にはプログラミングスクールを受講するのも1つの手です。

僕自身はテックアカデミーデイトラを受講した経験があります!

【体験談】テックアカデミー評判は?3か月本気受講してみたので徹底レビュー!当ブログ【スタビジ】では、様々なプログラミングスクールの中からテックアカデミーのメリット・デメリット・評判について3か月の体験談をもとに赤裸々にレビューしていきます。...
デイトラ タイトル
【体験談】デイトラを受講して評判・口コミを徹底解剖!当サイト【スタビジ】の本記事では、デイトラを実際に受講した体験談を元にデイトラのレビューをしていきたいと思います!主観的なレビューだけではなく客観的な評判などもチェックしてデイトラの評価を徹底的に見ていきますよ!...

データサイエンス色は薄いですが、開発よりのPython言語について実践的に学びたいのであればデイトラめちゃくちゃオススメです!

ウマたん
ウマたん
データサイエンスをマスターしてデータサイエンティストを目指そう!

データサイエンティストを目指すためのロードマップを以下にまとめているのでこちらも合わせてチェックしてみてくださいね!

【入門者向け】データサイエンティストに必要なスキルと独学勉強ロードマップ!当サイト【スタビジ】の本記事では、データサイエンティストに求められるスキルとそれを身に付けるための勉強法について徹底的にまとめていきます!入門者でも、しっかりデータサイエンティストについて理解しある程度独学で駆け出しの状態までいけることを目指します。...
Pythonを初学者が最短で習得する勉強法

Pythonを使うと様々なことができます。しかしどんなことをやりたいかという明確な目的がないと勉強は捗りません。

Pythonを習得するためのロードマップをまとめましたのでぜひチェックしてみてくださいね!