おすすめ書籍

【初学者向け】データサイエンスを学ぶ上でオススメな本10選!

本
ウマたん
ウマたん
当サイト【スタビジ】の本記事では、データサイエンスを学ぶ上でオススメできる本を厳選して紹介していきます。ここではデータサイエンティストになるために習得するスキルをデータサイエンスと称しております。いくつかの観点に切り分けて見ていきます。

こんにちは!データサイエンティストのウマたん(@statistics1012)です。

わりとマーケティングサイドの仕事もガッツリやっているんですが、大学院時代は統計学を専攻していて最近は業務がマーケティングよりもデータサイエンスにかなり寄ってきてます。

そんな僕がデータサイエンスを学ぶ上でのオススメ本を紹介していきたいと思います!

ウマたん
ウマたん
データサイエンスって響きはかっこよいけど、実は愚直な作業だったりもするよー!笑

そもそもデータサイエンスって何?

そもそもデータサイエンスって何なのかについて考えていきましょう。

以下の動画でも解説しています!

一時、データサイエンティストという職業が「21世紀最もセクシーな職業」なんてもてはやされてからデータサイエンスという言葉も聞かれるようになってきました。

Googleトレンドを見てみると、データサイエンスとデータサイエンティストの需要が右肩上がりで上がってきていることが分かります。

一方、ビッグデータは一時の流行りは落ち着いてきているみたい。

そんなデータサイエンスですが、主に3つのスキルに分かれます。

※データサイエンティストのスキルをここではデータサイエンスと定義します。2番目の統計学の部分だけをデータサイエンスとくくる場合もあります。

一つ目がエンジニアリング・ITスキル

こちらはデータの抽出・加工、分析、データ連携、データベース構築などのスキル。SQL・R・Pythonなどのスキルセットが望ましいと思ってください。

二つ目が統計学のスキル

こちらは、実際にエンジニアリングした結果を正しく統計的に解釈することができるか。データに惑わされない勘所を押さえておくべきです。

検定を行った時のよくある勘違いや・偽相関時系列データの見せかけの相関などエンジニアリングして出力した結果に対して解釈を間違えると大変なことになるパターンもあります。

三つ目がマーケティング・ビジネスのスキル

そして最後にマーケティング・ビジネス視点の能力。これがないと、分析をして結果解釈までして果たしてその後どうするかまで導き出せません。

この能力がないと、無用の長物になってしまうことが多いです。

データを解析してそこから洞察を抽出し実際にビジネスインパクトにつなげる業務を一気通貫で行うのがデータサイエンティストという職業なのです!

とは言っても、これを一人で全部完璧に行うのは厳しいのでチームで疑似データサイエンティストを作っているパターンも多いです。

データサイエンティストに関して詳しくは以下の記事をご覧ください!

【入門者向け】データサイエンティストに必要なスキルと独学勉強ロードマップ!当サイト【スタビジ】の本記事では、データサイエンティストに求められるスキルとそれを身に付けるための勉強法について徹底的にまとめていきます!入門者でも、しっかりデータサイエンティストについて理解しある程度独学で駆け出しの状態までいけることを目指します。...

データサイエンスを勉強するのにオススメな本10選!

それでは、早速データサイエンスを勉強するのにオススメな本を見ていきましょう!

エンジニアリング・ITスキルを勉強するのにオススメな本3選!

まずは、先ほどの必要な1つ目のスキル、エンジニアリングスキル

とりあえずPython(もしくはR)・SQLが書ければそれほど困らずやりたいことを実現できるでしょう!それぞれ一冊ずつ紹介していきます!

Pythonスタートブック

created by Rinker
¥2,750
(2020/11/23 23:15:40時点 Amazon調べ-詳細)

他のプログラミング言語を触ったことある人には少し退屈な内容かもしれませんが、かなり初歩的なところからPythonについて学ぶことが可能です。

Pythonについて本で学ぶのはこれくらいで、それ以外はWebサービスとかプログラミングスクールで実際に手を動かして覚えたほうが良いと思います。

以下の記事で、自分なりにPythonを勉強するのにオススメな方法についてまとめているのでそちらも参考にしてみてください!

Python 勉強
【入門】初心者が3か月でPythonを習得できるようになる勉強法!当ブログ【スタビジ】の本記事では、Pythonを効率よく独学で習得する勉強法を具体的なコード付き実装例と合わせてまとめていきます。Pythonはできることが幅広いので自分のやりたいことを明確にして勉強法を選ぶことが大事です。...

RstudioではじめるRプログラミング入門

統計学に関することは一旦おいておいてプログラミング言語としてのRを学びたいという方におすすめの本です。

この本は、「統計の知識がなくてもRを純粋にプログラミング言語として学ぼう」ということをコンセプトにして作られたらしく、データ解析というよりプログラミングよりのRのポテンシャルを引き出してくれる本です!

RはRtipsというサイトが非常にまとまっていて分かりやすいです。

本を読みながら分からないところはRtipsで逆引きして勉強すると理解が深まると思います。

Rtips逆引き辞典という本も出ていますが、Webサイトで十分です。

Rのオススメ本は以下の記事で他にも紹介しています!

R Pythonの本
厳選10冊!データ解析(R・Python)の勉強におすすめな本当サイト【スタビジ】の本記事では、PythonとRを勉強するのにおすすめな書籍を徹底的にまとめていきます!書籍だと続かない・・・という人のために書籍以外の勉強法についても紹介していきますのでぜひチェックしてみてください!...

スッキリわかるSQL入門ドリル215問付き!スッキリわかるシリーズ

こいつはアマゾンでの評価が高くて飛びついて買った本です。

この本に出てくるロボットがめちゃくちゃ分かりやすくSQLについて教えてくれます。

ドリルも付属として付いてくるので、手を動かして練習しながら勉強しましょう。

データベース環境がない方も問題ありません!

こちらの本では仮想データベース環境を用意してくれるのでそこからログインして勉強することができるんです。

SQL本と勉強方法については以下の記事をチェックしてみてください!

SQL
SQLを最速でマスターできるオススメ本と勉強方法!当サイト【スタビジ】の本記事では、SQLを勉強するのにオススメな本と勉強法についてまとめていきます!SQLはデータサイエンスの基本であり必ずマスターしておかなくてはいけない言語です。早い段階から手を動かすことで理解が深まりますよー!...

また、R/Python/SQLなどデータ分析に必要な言語とそれらの学習方法について以下の記事でまとめていますのでよければ見てみてください!

統計モデリングに強いStanという言語もあるんですよー!

統計解析を行う上で便利なプログラミング言語を比較!当サイト【スタビジ】の本記事では、統計解析において便利なプログラミング言語「Python/R/Stan/SQL」を比較していきます。それぞれのプログラミング言語にどのような特徴があるのか、どのように勉強していけばよいのか見てきますよー!...

統計学を勉強するのにオススメな本5選!

元々バックグラウンドが統計学なので、統計学に関してはたくさんオススメしたい本があるのですが、初歩的な話から名著まで厳選して紹介したいと思います。

徐々にレベルが高くなっていくように並べています。

入門統計解析法

基本的に高校レベルの数学ができれば問題なく理解できるレベルです。

僕自身大学1年生~2年生の時に統計学を体系的に学ぶ上で非常に役立った本です。

統計学の考え方から検定回帰分析まで学ぶことができます。

これで統計学の土台が作り上げられたと言っても過言ではありません。オススメです。

多変量解析法入門

多変量解析に関してはこちらの1冊で基本的にカバーできると思います。

機械学習時系列分析なども厳密には多変量解析ですが、ここではそれらを勉強する上での基礎となる回帰のお話から主成分分析などの話が丁寧に分かりやすく載っています。

単回帰、重回帰、判別分析、主成分分析のところは丁寧に読み込んでおくと良いでしょう。

データ解析のための統計モデリング入門

統計モデリングの本で、どのようにモデルを作り上げていくか非常に勉強になります。

線形モデリングからベイズにおけるモデリングまで理解が進みます。

伝統的な統計学とベイズ統計学を関連付けながら包括的に理解することができるでしょう。

はじめてのパターン認識

機械学習手法と言えばこの本!

統計学全般の理解が進んだあとは、機械学習系のアルゴリズムにもある程度触れておいた方がよいでしょう!

ほぼすべての主要機械学習手法に関して網羅していますが、結構難しいです。

はじめてのと付いていますが、概念的な説明よりも数式展開で話が進んでいくので、ある程度理解している人でないと読破するのは難しいです。

ただ名著であることは間違いないので周りの人たちと一緒に読み進めていくのが理想です。大学院時代に研究室の輪読に用いてみんなで理解を進めていきました。

これなら分かる最適化数学

あまり他のWebサイトなどで紹介されているのは見ませんが圧倒的におすすめの名著です!

数学をベースにして最適化手法について学んでいくのですが、それが実は様々な手法と関連しているということが分かってくると面白い。

それほど読みやすい本ではないのでじっくり腰を据えて読むか輪読などで回りの人と読むと良いと思います。

これを1冊しっかり理解すると統計学をまた違った視点から見ることができるようになると思います!

 

統計学の本はこれ以外にも色々とオススメな本があるので是非以下の記事を参考にしてみてください!

書籍
厳選32冊!統計学を勉強する上でおすすめな本当サイト【スタビジ】の本記事では、統計学のおすすめ書籍を分野別に徹底的にまとめていきます!統計学は難しいイメージがあるかもしれませんが学び方を間違えなければ大丈夫。悪書に当たると一気に挫折してしまうので気を付けてください。ここで紹介する書籍はどれも良本なので安心してくださいね!...

マーケティング・ビジネスを学ぶのにオススメな本2選!

正直、ここの部分が一番習得が難しかったりするんですよね・・・体系だって学ぶことはなかなか難しい。

実践で学ばないと結局机上の空論になってしまいます。

ただ実際にデータをどのようにマーケティングに活かしているかを知るのは非常に大事。

データ的側面からビジネスに落とし込む話が学べる本の中でオススメをいくつか紹介していきます。

俺たちひよっこデータサイエンティストが世界を変える

created by Rinker
¥322
(2020/11/23 11:53:58時点 Amazon調べ-詳細)

手前味噌で恐縮なのですが、僕自身が「俺たちひよっこデータサイエンティストが世界を変える」という書籍を出版しています。

具体的なデータサイエンティストの仕事について分かりやすく書いている本がなかったので自分で執筆しました!

ストーリー形式で分かりやすく書いていますので、ぜひ最初に目を通していただけるとイメージが湧くと思います。

価格は300円ちょっとですし、Kindle unlimitedであれば無料で読めるのでぜひチェックしてみてくださいね!

確率思考の戦略論

created by Rinker
¥3,520
(2020/11/23 14:10:09時点 Amazon調べ-詳細)

言わずと知れた森岡毅さんの名著ですね。

この前に発売された「USJを変えたたった一つの考え方」は消費者視点のマーケティングを考える上で非常に勉強になる本だったのですが、こちらの「確率思考の戦略論」は一転して数学的色の非常に強い内容になっています。

USJで打ち出された様々な施策が実はこれほど精緻な計算のもと出されたものだったとは驚きました。

デジタルマーケティングを行う上で非常に重要な数字的側面を勉強できます。

堅苦しい数式などは本編と分けられていて、数学に強くない人でも分かりやすく学べるようになっています。

是非読んでみてください!

ちなみにデジタルマーケティングを学ぶ上で学ぶオススメ本は以下にまとめています。

書籍
厳選12冊!デジタルマーケティングを勉強する上でオススメな本!当サイト【スタビジ】の本記事では、デジタルマーケティングを学ぶ上でオススメの書籍をまとめていきます!デジタルマーケティングとはいえテクノロジーよりの本とマーケ概論よりの本があります。どちらも理解してこそ真のデジタルマーケターと言えるでしょう!...

データサイエンスを本で学ぶのはしんどい人にはこれ!

データサイエンスの理論を学ぶ上ではエッセンスが書籍に詰まっているので書籍を読んで欲しいのですが、全体感をつかむ上ではまず本でない方がよいと思っています。

最初の取っ掛かりとしては分かりにくく挫折してしまう人が多いイメージを持っています。

いきなりギリシャ文字とかたくさん出てくるんでね・・・

そのため、まずはUdemyの動画でぜひ学んで欲しい!

Udemyは、世界最大の教育オンライン学習プラットフォーム!

いくつかあるんですが、以下の講座が全体感を掴む上ではオススメです!

【世界で21万人が受講】データサイエンティストを目指すあなたへ〜データサイエンス25時間ブートキャンプ〜

Udemy コース データサイエンス
【オススメ度】
【講師】ITコンサルタント
【時間】26時間
【レベル】初級

非常に簡単で分かりやすいので、まず全体感をつかむために見て欲しい!

海外で非常に人気だったデータサイエンスコースの日本語版!

コミカルな動画と共に学べるので非常に分かりやすく、かつボリューミーです。

ビジネスサイドの話からデータサイエンスについて学べるのでビジネスサイドの人でも入りやすいです。

章立ての最後にある実践問題では、学んだ内容を実際にビジネスでどのように使うか分かりやすく解説してくれます!

本筋とはあまり関係ありませんが、k近傍法(Knn)k平均法(Kmeans)を間違って使っていて、だいぶ気になりました笑

最後には実データを使って実際の前処理→ロジスティック回帰による分析→タブローで可視化という流れを行っていくので実践に即した内容になっています。

\30日間返金無料/

そして以下の講座は、書籍を読む前に見ておくと数式を効率よく理解できるのでオススメ!

【キカガク流】人工知能・機械学習 脱ブラックボックス講座ー初級編ー

Udemy コース アルゴリズム
【オススメ度】
【講師】株式会社キカガク代表取締役
【時間】4.5時間
【レベル】初級

統計学の基本となる単回帰分析を数式から学んでいくもの。

ビックリしたんですが、パワポではなく紙に手書きで進んでいくんです!

最初は抵抗があったものの、なるほど意外と分かりやすい。

よくよく考えたら学生時代の教育は先生が手書きで黒板に書いて進めてましたもんね。

統計学の書籍に進む前の数学慣れにピッタリの教材になっています!

数学のレベルは高校2年生の数ⅡBレベルが何となくわかれば大丈夫です。

\30日間返金無料/

【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 中級編 –

Udemy コース ブラックボックス中級
【オススメ度】
【講師】株式会社キカガク代表取締役
【時間】4.5時間
【レベル】初級~中級

初級編は単回帰分析について微分を使って紐解いていきますが、本コースでは線形代数を学びながら重回帰分析まで展開していきます。

線形代数は機械学習を学ぶ上で非常に重要なんです!

実際に数式的に重回帰分析を行い、その後にscikit-learnを使って分析を行っていきます。

このコースを受講しておけば、書籍で突然出てくる行列やベクトルに対しても吐き気をもよおさず読み進めることができるでしょう!

\30日間返金無料/

Udemyはクオリティが高くてとにかくオススメできるサービスなんですよー!

Udemyに関しては以下の記事でまとめています!

Udemy レビュー
【体験談】評判の良いUdemyを実際に20コース受けてみてレビュー!当サイト【スタビジ】の本記事では、世界最大のオンライン学習プラットフォームであるUdemyのメリット・デメリット・評判・口コミについてまとめていきます!実際にPython関連のコースを20個受講して分かった体験談をもとにお伝えしていきます。...

ちなみに書籍もUdemyも基本自分だけで進めることになります。

もしモチベーションが保てないという人にはプログラミングスクールをオススメします!

僕自身はテックアカデミーを3か月受講した経験があります!

【体験談】テックアカデミー評判は?3か月本気受講してみたので徹底レビュー!当ブログ【スタビジ】では、様々なプログラミングスクールの中からテックアカデミーのメリット・デメリット・評判について3か月の体験談をもとに赤裸々にレビューしていきます。...

無料体験は事前に出来るので不安な方は試してみることをオススメします!

データサイエンスを学ぶ上でオススメな本 まとめ

見事に紹介した本の数が、3:5:2ということで自分の統計学への偏りを感じます笑

ただ、ここで紹介してきた本はどれもデータサイエンスを本格的に学ぶ上で身になる本です!

是非手に取ってみてください。

個人的にはデータサイエンスを学ぶ上で3つ目のマーケ・ビジネスだけ学んでも机上の空論で終わってしまうので、まずはエンジニアリング・統計スキルを学ぶ本を手に取ってもらって雰囲気つかんでもらうことが大事かなと。

ウマたん
ウマたん
データサイエンスをマスターしてデータサイエンティストを目指すぞ!

データサイエンティストを目指すためのロードマップを以下にまとめているのでこちらも合わせてチェックしてみてくださいね!

【入門者向け】データサイエンティストに必要なスキルと独学勉強ロードマップ!当サイト【スタビジ】の本記事では、データサイエンティストに求められるスキルとそれを身に付けるための勉強法について徹底的にまとめていきます!入門者でも、しっかりデータサイエンティストについて理解しある程度独学で駆け出しの状態までいけることを目指します。...
Pythonを初学者が最短で習得する勉強法

Pythonを使うと様々なことができます。しかしどんなことをやりたいかという明確な目的がないと勉強は捗りません。

Pythonを習得するためのロードマップをまとめましたのでぜひチェックしてみてくださいね!