こんにちは!
データサイエンティストのウマたん(@statistics1012)です。
この記事では、そんなデータサイエンティストに必要な数学のレベル・知識、そしてそれらを習得するための勉強法についてまとめていきます!
目次
データサイエンティストってどんな仕事?
まず、データサイエンティストという仕事についてまとめておきましょう!
以下の動画でも解説しています!
データサイエンティストは、何かしらのデータを原料に自分の知識とスキルと経験を総動員して新たな知見を導き出すプロフェッショナル。
業務範囲は広く、分析設計やデータの収集・加工、アウトプットの解釈から示唆出し、そして事業戦略に落とし込むところまでやるのがデータサイエンティストのお仕事なんです。
データサイエンティストの需要というのは年々伸びてきており、これからもある一定の割合で伸びていくことが予想されます。
しかしデータサイエンティストって定義が難しくて、ただPythonやRが書ければデータサイエンティストかというとそんなことはないんですね。
適切なデータ分析やデータの解釈を行うためには機械学習や統計の理論が頭に入っているコトが必要。
そしてそれらの理論を理解するためには数学の知識が必要になってくるのです。
とはいえ、大学でガッツリ勉強する数学が必要かというとそんなこともありません。
必要最低限で大丈夫ですよー!
データサイエンティストについてはより詳しく以下の記事でまとめているのでチェックしてみてください!
データサイエンティストに必要な数学の知識・レベル
ここではそんなデータサイエンティストにはどのレベルの数学知識が必要かまとめていきます。
もちろん数学が出来た方が良いですし、データサイエンティストには大学の数学科や物理科の人も多いのですが・・・
安心してください!
絶対に高度な数学ができないといけないわけではありません!
基礎的な数字への感度・勘所
まずは、基礎的な数学の勘所をおさえられるようになっておきましょう!
データサイエンティストは、データから知見を得てビジネスに活かすことの出来る人材です。
ビジネスシーンで数字の規模感をパッと思い描くことができないようでは、データサイエンティストにはなれません。
というかマーケターや営業・プログラマーなど、どんな職種でも数字への感度・勘所は大事です。
確率統計
ここからデータサイエンティストっぽくなってきますが、確率統計の知識は基礎的な知識として必ずおさえておいてください!
世の中の全ての事象は、確率統計で表現することができます。
・競馬で当たる事象も
・交通事故の起きる事象も
・あなたが好きな人に告白して成功する事象も・・・
ということは、ある広告をあるお客さんに当てた時に成功する事象も確率統計に当てはめることができるということですね!
なんだかそう考えると面白くなってきませんか?
USJをV字回復に導いた森岡毅さんは、まさにこの確率統計の知識を用いてUSJの来場者数をモデル化して予測しました。
確率統計を駆使することで、倒産寸前の企業をそんな状態から復活させることができるのです!
この森岡毅さんの確率思考に関しては以下の書籍で詳しく述べられているので興味のある方は是非読んでみてください!
(2024/11/22 00:15:36時点 Amazon調べ-詳細)
マーケターの中でもデータサイエンティストの中でも読み継がれる名著です。
微積分
続いて微積分!
微積分になるとグッと数学感が増してしまうので、拒否反応を起こしてしまう人もいるかもれしれません。
安心してください。
データサイエンティストに必要な微積分の知識はそれほど複雑ではありません。
というか微積分と書いていますが、基本的な微分ができればそれほど困ることはないです。
微分を使うと何ができるかというと・・・カンタンに言うと「ある数値が最小になるところを求めることができる」。
データサイエンスにおいて強いモデルを作るために必要な機械学習。
機械学習って結局は最適化の手法なんですよー。
つまり「最適化=ある数値が最小(もしくは最大)になるところを求める」ということ。
微分の知識があれば、機械学習のアルゴリズムの飲み込みは早くなります。
線形代数
最後に線形代数!
線形代数って、正直高校や大学の時はムダな知識だなーと思っていた時期がありました。
しかーし、線形代数は大量のデータを扱うAIの分野で非常に重要な知識なんです!
線形代数がAIを学ぶ上で一番重要な基礎知識だと言っても過言ではないです。
線形代数とは、カンタンに言うと「たくさんあるデータをまとめて計算するマジック」
データサイエンスの世界では、大量のデータを扱います。
そんな大量のデータをアルゴリズムに適用させることを定式化する上で線形代数は非常に便利!
機械学習や統計学の理論の理解を深める上で微分よりも線形代数は重要です。
データサイエンティストに必要な数学の勉強法
さてさて、ここで取り上げてきた数学の知識をどのように習得していけばよいか勉強法についてまとめておきましょう!
以下のステップで学んでいきましょう!
Step1:データサイエンス×数学の全体感を掴む
Step2:確率統計×マーケティングを学ぶ
Step3:微分を学ぶ
Step4:線形代数を学ぶ
Step5:総力戦で学ぶ
Step1:データサイエンス×数学の全体感を掴む
数字に対する感度を上げる+データサイエンティストの全体感を掴む上でまず以下のUdemy動画をぜひ見てみてください!
【初学者向け】データ分析コンペで楽しみながら学べるPython×データ分析講座
【オススメ度】 | |
---|---|
【講師】 | 僕自身!今なら購入時に「VGRBCQDF」という講師クーポンコードを入れると94%OFFになりますのでぜひご受講ください! |
【時間】 | 4時間 |
【レベル】 | 初級~中級 |
このコースは、なかなか勉強する時間がないという方に向けてコンパクトに分かりやすく必要最低限の時間で重要なエッセンスを学び取れるように作成しています。
アニメーションを使った概要編とハンズオン形式で進む実践編に分かれており、概要編ではデータ分析・機械学習導入の文脈でまとめています。
データサイエンスの基礎について基本のキから学びつつ、なるべく堅苦しい説明は抜きにしてイメージを掴んでいきます。
統計学・機械学習の基本的な内容を学び各手法の詳細についてもなるべく概念的に分かりやすく理解できるように学んでいきます。
そしてデータ分析の流れについては実務に即したCRISP-DMというフレームワークに沿って体系的に学んでいきます!
データ分析というと機械学習でモデル構築する部分にスポットがあたりがちですが、それ以外の工程についてもしっかりおさえておきましょう!
続いて実践編ではデータコンペの中古マンションのデータを題材にして、実際に手を動かしながら機械学習手法を実装していきます。
ここでは、探索的にデータを見ていきながらデータを加工し、その上でLight gbm という機械学習手法を使ってモデル構築までおこなっていきます。
数学要素は出来るだけ除外しておりますので、Step1に超絶オススメです!
是非興味のある方は受講してみてください!
Step2:確率統計×マーケティングを学ぶ
その後は、先ほども紹介した森岡さんの確率思考の戦略論で数学とマーケティングを結ぶ土台作りをしていきましょう!
(2024/11/22 00:15:36時点 Amazon調べ-詳細)
以下のYoutube動画でなるべく噛み砕いて説明しておりますのでチェックしてみてください!
複雑なモデルが出てきますが、ここまでビジネスを精緻にモデル化できるのはあせらなくて大丈夫です。
まずは、確率分布を応用するとここまでビジネスに大きな影響を与えることができるのだっ!!という認識を強く持っておくことが大事です。
確率モデルについてもっと理論サイドから詳しく知りたい場合はぜひ以下の書籍に目を通してみてください!
(2024/11/21 15:25:34時点 Amazon調べ-詳細)
確率モデルに関連して、統計学の基本である推計統計学まで学びたい場合は以下の書籍がオススメです!
Step3:微分を学ぶ
微分は以下のUdemy動画がめちゃくちゃ分かりやすいのでぜひチェックしてみてください!
【キカガク流】人工知能・機械学習 脱ブラックボックス講座ー初級編ー
教育サービスを提供するキカガクの代表取締役の方が丁寧に機械学習のアルゴリズムについて教えてくれます。
まあ機械学習の基本・土台となる単回帰分析を数式から学んでいくもの。
ビックリしたんですが、パワポではなく紙に手書きで進んでいくんです!
最初は抵抗があったものの、なるほど意外と分かりやすい。
よくよく考えたら学生時代の教育は先生が手書きで黒板に書いて進めてましたもんね。
書籍で学ぶより断然学びやすいです!
Step4:線形代数を学ぶ
線形代数を学ぶのにおすすめなのは先ほど紹介したUdemy講座の中級編!
【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 中級編 –
本コースでは線形代数を学びながら重回帰分析まで展開していきます。
線形代数を学びながら微分も用いて定式化していきますよー!
実際に手計算で重回帰分析を行い、その後Pythonのscikit-learnを使って分析を行っていきます。
Pythonを使うとこんなにカンタンに計算できてしまうのかとビックリすると思いますが実際に手計算をする経験は有用。
Step5:総力戦で学ぶ(おまけ)
最後に今まで学んだことの総力戦で、是非読んで欲しい本が以下の書籍!
まさに微分=最適化のお話ですよーと言ったように微分・線形代数を使った最適化の理論が詳しく載っています。
機械学習を学ぶ上で非常に重要な内容なので、余裕があれば是非学んでみることをオススメします!
ただ、ここを理解しなくても大丈夫っちゃ大丈夫なので、おまけとしています!
まとめ
データサイエンティストに必要な数学のレベルと勉強法について簡単にまとめてきました!
ここでは非常に基礎的で簡単なレベルまでの勉強法をお伝えしてきました。
ただ、まずはこれでデータサイエンティストへの第1歩目が切れるでしょう!
この記事では数学だけに絞ってまとめてきましたが、データサイエンティストに必要なスキルは数学だけではありません。
全体的に底上げを図るのであれば数学だけではなく様々なスキルが必要!むしろ他のスキルの方が必要と言っても過言ではありません。
当メディアが運営するスクール「スタアカ(スタビジアカデミー)」では、業界最安値でデータサイエンスが学べます!
24時間以内の質問対応と現役データサイエンティストによる1週間に1回のメンタリングを実施します!
カリキュラム自体は、他のスクールと比較して圧倒的に良い自信があるのでぜひ受講してみてください!
他のスクールのカリキュラムはPythonでの機械学習実装だけに焦点が当たっているものが多く、実務に即した内容になっていないものが多いです。
そんな課題感に対して、実務で使うことの多いSQLや機械学習のビジネス導入プロセスの理解などもあわせて学べるボリューム満点のコースになっています!
ウォルマートのデータを使って商品の予測分析をしたり、実務で使うことの多いGoogleプロダクトのBigQueryを使って投球分析をしたり、データサイエンティストに必要なビジネス・マーケティングの基礎を学んでマーケティングプランを作ってもらったりする盛りだくさんの内容になってます!
・BigQuery上でSQL、Google Colab上でPythonを使い野球の投球分析
・世界最大手小売企業のウォルマートの実データを用いた需要予測
・ビジネス・マーケティングの基礎を学んで実際の企業を題材にしたマーケティングプランの策定
プログラミングスクールはある程度の金額がしますが、本気で取り組むならオススメです!
僕自身プログラミングスクールに通うことで苦手な分野を集中的に学習した経験があります。
以下の記事でデータサイエンティストへの勉強ができるスクールをまとめているので是非チェックしてみてください!
また、以下の記事でデータサイエンティストへの必要なスキル・ロードマップをまとめているので是非チェックしてみてください!
また、データサイエンティストに必要なPythonや統計学や機械学習やマーケティングのスキルを以下の記事でまとめているのであわせてチェックしてみてください!