こんにちは!
消費財メーカーのデータサイエンティスト、ウマたん(@statistics1012)です!
この記事では、データ分析をする上で非常に役立つ本を紹介していきます。
実は、仕事で行うデータ分析と研究で行うデータ分析には結構違う面が多いんです。
そのため、理論を書籍で学んだとしてもなかなか仕事にその理論を活かせないのが現実。
そこで、この記事では理論偏重な本だけでなく実務のデータ分析に役立つという観点もあわせて書籍を紹介していきますよ!
データ分析におすすめの本10選!
それでは早速データ分析を学ぶのにおすすめの書籍を紹介していきます!
会社を変える分析の力
データ分析の力を使ってどのようにビジネスに貢献するか、そして会社をどのように変えていくかについて非常に分かりやすく書かれている名著です。
著者は大阪ガスにて10年以上データ分析業務に従事してこられた河本さん。
事業会社のインハウスデータ分析屋さんとしての経験をもとにデータ分析を使ってどのように既存ビジネスに変革を起こしていくかということが語られています。
このように社内を駆け回ってデータ分析から価値を生み続けている方のお話は説得力があります。
データ分析というと、高度な手法やモデリング作業が注目されがちですが、結局モデルが出来てもビジネスに活かされなければ何の意味もありません。
意思決定に寄与しなかれば何の意味もありません。
ぜひこの書籍を読んで、ビジネス活用をしっかり考えた上でのデータ分析が行えるようになってください!
「会社を変える分析の力」に関しては以下のYoutube動画で詳しく解説しています!
確率思考の戦略論
(2024/11/20 23:54:50時点 Amazon調べ-詳細)
言わずと知れた超名著「確率思考の戦略論」
P&G出身の森岡毅さんが統計モデルを使ってUSJの来客者を予測してV字回復させたというお話が実際に数式と共に語られています。
統計・数学・データ分析をどのようにマーケティングに活かしていけばよいのか、という観点で学ぶことの出来る非常におすすめの書籍です。
ぜひ読んでみてください!
統計学は最強の学問であるシリーズ
(2024/11/21 06:44:19時点 Amazon調べ-詳細)
(2024/11/21 07:07:45時点 Amazon調べ-詳細)
(2024/11/21 07:07:46時点 Amazon調べ-詳細)
統計学ブームを巻き起こした書籍でもある「統計学は最強の学問である」シリーズ!
非常に平易で分かりやすい観点から統計学について学ぶことの出来るおすすめの書籍です。
シリーズの中には通常版とビジネス編と実践編があります。
ビジネス編はほとんど数式が出てこず、どのようにビジネスにデータ分析の観点を取り入れていけばよいかについて語られているので序盤で読んでみることをおすすめします!
データ分析のための数理モデル
(2024/11/21 03:57:54時点 Amazon調べ-詳細)
データ分析に必要な数理モデルを分かりやすく学べる書籍です。
厳密な数式などはそれほど多く出てこないので、データ分析のための理論を学びたいけど数学はあまり得意ではないし・・・という方にはオススメです。
実務での実装例はそれほど載っておらず、数理モデルの理論ベースに話が進むので実務に適用させるための学習は他の書籍で学ぶことをオススメします。
因果関係に迫る思考法
(2024/11/21 11:53:40時点 Amazon調べ-詳細)
因果関係を理論的に考えていく分野を統計学では、統計的因果推論と言いますが、そんな因果推論の世界を実例とともに平易にわかりやすく解説している本です。
因果の奥深さとビジネスへの活用を理解するのに非常に有用な書籍になっています。
ビジネスにおいて、データ分析の結果から正しいアクションを取るためには因果関係を見定めることが非常に重要になってきます。
相関関係だけでアクションを取ることも多いですが、相関関係と因果関係は違うものであるということしっかり理解しておきましょう!
因果関係に迫る思考法に関しては、以下のYoutube動画で詳しく解説しています!
もし統計的因果推論の理論に興味がある方は以下の記事で理論分野のおすすめ書籍を紹介しているので是非見てみてください!
Kaggleで勝つデータ分析の技術
Kaggleに特化した内容になっていますが、実務のデータ分析においても非常に勉強になる書籍です。
・どのような手法を使えばよいのか
・それぞれの手法にはどんなメリット・弱点があるのか
などの理解が進みます。
特徴量エンジニアリングをはじめとしたデータ分析におけるステップについて非常に細かく学べます。
Kaggleとは世界中のデータサイエンティストが参加するデータ分析コンペです。
以下の記事でKaggleについてまとめていますので興味のある方は見てみてください!
仕事ではじめる機械学習
仕事に即したデータ分析を学ぶことの出来る名著です。
機械学習や統計学の理論だけではなく、それらを使ってどのようにビジネス課題を解いていくかという部分に重きが置かれています。
データの取得から、機械学習モデルをどのようにアウトプットに活かしていくかについても非常に分かりやすく学べます。
なかなか理論や実装だけを学んでもビジネス側面からの課題や乗り越えなくてはいけない壁は学べないので、この書籍は必ず読んでおきたい1冊です。
最強のデータ分析組織
先程の会社を変えるデータ分析の力の著者「河本さん」の書籍です。
データ分析が個人で出来るようになった後に目指したいのは、データ分析に強い組織を作っていくということ。
河本さんは事業会社のデータサイエンティストとして数々の分析業務をこなしてきました。
その中で乗り越えてきた組織の壁について分かりやすく学べるので、データ分析でビジネス課題を解決したい!と考えている人には是非オススメの書籍です。
理論やプログラミングは全く出てきません。
スッキリわかるSQL入門ドリル215問付き!スッキリわかるシリーズ
データ分析における言語としてはPythonやRが有名ですが、実はSQLを使うことが多いんです。
SQLは地味な言語に思われるかもしれませんが、有用で多くの場面で利用されています。
ただなかなか実務以外でSQLを学べる環境がないのも事実。
ということでこの書籍を紹介しておきます。
書籍での勉強用の環境が用意されているので、その環境を使ってSQLを勉強することが可能です。
以下の記事でSQLの勉強方法についてもまとめていますので是非チェックしてみてくださいねー!
俺たちひよっこデータサイエンティストが世界を変える
手前味噌ですが、僕自身が書いているこちらの書籍も紹介させてください。
「俺たちひよっこデータサイエンティストが世界を変える」という書籍を出版しています。
あまり具体的なデータサイエンティストの仕事について分かりやすく書いている本が見当たらなかったので自分で執筆しました!
ストーリー形式で分かりやすく書いていますので、ぜひ最初に目を通していただけるとイメージが湧くと思います。
価格は300円ちょっとですし、Kindle unlimitedであれば無料で読めるのでぜひチェックしてみてくださいね!
データ分析の実装部分は本以外で学ぼう!
データ分析をどのように実務に落とし込んでいくかの部分は書籍で学ぶことができるのですが、実際にPythonやRを使ってコーディングしていくところはどうしても本だと限界があります。
そこでここでは、データ分析の実装部分の勉強を本以外で学ぶ方法についてまとめています!
僕自身もお世話になった2つの学習方法について紹介しておきますよー!
Udemyで学ぶ
公式サイト:https://www.udemy.com/courses/search/?q=Python
Udemyという非常に優良なWebサービスがあります。
全世界で利用されているサービスで、色んな分野の第一人者のオンライン講座を受講することができるんです。
【実践】ビジネスケースとつなげてPythonで出来ること5つを学べる3日間集中コース
【オススメ度】 | |
---|---|
【講師】 | 僕自身!今なら購入時に「VGRBCQDF」という講師クーポンコードを入れると94%OFFになりますのでぜひご受講ください! |
【時間】 | 3.5時間 |
【レベル】 | 初級~中級 |
手前味噌ですが、Pythonについて理解してみるのにオススメなコースを僕自身が出しています!
Pythonで出来ることのうち以下の5つを網羅して学んでいきます。
・データ集計・加工・描画
・機械学習を使ったモデル構築
・Webスクレイピング
・APIの利用
・Webアプリケーション開発
データ集計・加工・描画と機械学習モデル構築に関してはKaggleというデータ分析コンペティションのWalmartの小売データを扱いながら学んでいきます。
WebスクレイピングとAPI利用とWebアプリケーション開発に関しては、楽天の在庫情報を取得してSlackに自動で通知するWebアプリケーションを作成して学んでいきます。
Pythonで何ができるのか知りたい!という方には一番はじめにまず受けていただきたいコースです!
Udemyの中でPythonのおすすめコースは以下の記事で詳しくまとめていますよ!
【初学者向け】データ分析コンペで楽しみながら学べるPython×データ分析講座
【オススメ度】 | |
---|---|
【講師】 | 僕自身!今なら購入時に「VGRBCQDF」という講師クーポンコードを入れると94%OFFになりますのでぜひご受講ください! |
【時間】 | 4時間 |
【レベル】 | 初級~中級 |
先ほどはPythonのコースでしたが、こちらはデータ分析機械学習関連のUdemyコースになります!
僕自身がUdemyの色んなコースを受けてみた中で、他のコースにはないこんなコースあったらいいなみたいなコースを作ってみました。
このコースは、なかなか勉強する時間がないという方に向けてコンパクトに分かりやすく必要最低限の時間で重要なエッセンスを学び取れるように作成しています。
アニメーションを使った概要編とハンズオン形式で進む実践編に分かれており、概要編ではYoutubeの内容をより体系的にデータ分析・機械学習導入の文脈でまとめています。
データサイエンスの基礎について基本のキから学びつつ、なるべく堅苦しい説明は抜きにしてイメージを掴んでいきます。
統計学・機械学習の基本的な内容を学び各手法の詳細についてもなるべく概念的に分かりやすく理解できるように学んでいきます。
そしてデータ分析の流れについては実務に即したCRISP-DMというフレームワークに沿って体系的に学んでいきます!
データ分析というと機械学習でモデル構築する部分にスポットがあたりがちですが、それ以外の工程についてもしっかりおさえておきましょう!
続いて実践編ではデータコンペの中古マンションのデータを題材にして、実際に手を動かしながら機械学習手法を実装していきます。
ここでは、探索的にデータを見ていきながらデータを加工し、その上でLight gbm という機械学習手法を使ってモデル構築までおこなっていきます。
是非興味のある方は受講してみてください!
UdemyのPythonコースに関しては以下の記事でまとめていますので是非チェックしてみてください!
プログラミングスクールで学ぶ
プログラミング実装部分は独学で進めるのが厳しい面もあるので、プログラミングスクール通ってしまうのも一つの手です。
プログラミングスクールにはいくつかの種類がありますが、価格が安く質も高いデイトラが圧倒的にオススメです!
デイトラ
公式サイト:https://www.daily-trial.com/python【オススメ度】 | |
---|---|
【レベル】 | 初級〜中級 |
【価格】 | 49,800円〜99,800円 |
デイトラはデイリートレーニングの略でTwitter発のプログラミングスクールです。
毎日コツコツと課題をこなしプログラミング学習を継続することでプログラミングを短期間で習得することを目的に作成されたプログラミングスクール!
他の多くのプログラミングスクールが20万円近くする中、デイトラは10万円以下という破格で今非常に注目されているプログラミングスクールです。
以下の記事で体験談をふまえて詳しく解説していますので気になる方は是非チェックしてみてください!
テックアカデミー
パーソナルメンター付きで勉強したいならテックアカデミーというプログラミングスクールがおすすめです。
公式サイト:https://techacademy.jp/
【価格】 | 163,900円~(4週間) |
---|---|
【オススメ度】 | |
【サポート体制】 | |
【受講形式】 | オンライン形式 |
【Pythonの学習範囲】 | 基本構文、データサイエンス |
以下の記事で体験談をより詳しくまとめていますので是非チェックしてみてください!
ディープロ
本格的にじっくり学びたいのであればディープロというプログラミングスクールがおすすめです。
公式サイト:https://diveintocode.jp/ai_curriculum
【価格】 | 入学金:200,000円 受講料:877,800円 (4ヶ月) |
---|---|
【オススメ度】 | |
【サポート体制】 | |
【受講形式】 | オフライン形式 平日の日中 |
【Pythonの学習範囲】 | ディープラーニングを実装。インフラ・DBまわりの知識も学ぶ |
ディープロに関して詳しくは以下の記事で解説しています!
以下の記事でPythonのおすすめスクールをまとめていますので是非チェックしてみてください。
データ分析におすすめの本 まとめ
ここまででデータ分析におすすめの書籍についてまとめてきました。
この記事では、あまり理論偏重ではなくて実務に即したデータ分析が学べる書籍を紹介しました。
ただ、実際にデータ分析を進める上では理論の理解も必要なことは間違いないです。
理論への理解を深めることでよりデータ分析の世界が広がります。
データ分析の土台となる統計学や機械学習の理解にオススメな書籍は以下の記事でまとめていますのでこちらもあわせてチェックしてみてください!