データ解析

データサイエンティストに必要な数学の知識・レベルを徹底解説!

データサイエンティスト 数学
ウマたん
ウマたん
当サイト【スタビジ】の本記事では、データサイエンティストに必要な数学の知識・レベル、そしてそれらの数学の勉強法について徹底的に解説していきます!データサイエンティストには確かにある程度の数学知識は必要ですが、真っ向から勉強しようとすると挫折する可能性大!効率的に勉強をしていきましょう!

こんにちは!

消費財メーカーでデータサイエンティストをやってるウマたん(@statistics1012)です。

ロボたん
ロボたん
データサイエンティストというと難しい数学を扱うイメージがあるけど・・・
ウマたん
ウマたん
もちろん数学の知識は必要最低限あると嬉しいんだけど、そこまで複雑な知識は必要ないよ!

この記事では、そんなデータサイエンティストに必要な数学のレベル・知識、そしてそれらを習得するための勉強法についてまとめていきます!

データサイエンティストってどんな仕事?

PC

まず、データサイエンティストという仕事についてまとめておきましょう!

以下の動画でも解説しています!

データサイエンティストは、何かしらのデータを原料に自分の知識とスキルと経験を総動員して新たな知見を導き出すプロフェッショナル。

業務範囲は広く、分析設計やデータの収集・加工、アウトプットの解釈から示唆出し、そして事業戦略に落とし込むところまでやるのがデータサイエンティストのお仕事なんです。

データサイエンティストの需要というのは年々伸びてきており、これからもある一定の割合で伸びていくことが予想されます。

しかしデータサイエンティストって定義が難しくて、ただPythonやRが書ければデータサイエンティストかというとそんなことはないんですね。

適切なデータ分析やデータの解釈を行うためには機械学習や統計の理論が頭に入っているコトが必要。

そしてそれらの理論を理解するためには数学の知識が必要になってくるのです。

とはいえ、大学でガッツリ勉強する数学が必要かというとそんなこともありません。

必要最低限で大丈夫ですよー!

データサイエンティストについてはより詳しく以下の記事でまとめているのでチェックしてみてください!

【入門者向け】データサイエンティストに必要なスキルと独学勉強ロードマップ!当サイト【スタビジ】の本記事では、データサイエンティストに求められるスキルとそれを身に付けるための勉強法について徹底的にまとめていきます!入門者でも、しっかりデータサイエンティストについて理解しある程度独学で駆け出しの状態までいけることを目指します。...

データサイエンティストに必要な数学の知識・レベル

本

ここではそんなデータサイエンティストにはどのレベルの数学知識が必要かまとめていきます。

もちろん数学が出来た方が良いですし、データサイエンティストには大学の数学科や物理科の人も多いのですが・・・

安心してください!

絶対に高度な数学ができないといけないわけではありません!

基礎的な数字への感度・勘所

まずは、基礎的な数学の勘所をおさえられるようになっておきましょう!

データサイエンティストは、データから知見を得てビジネスに活かすことの出来る人材です。

ビジネスシーンで数字の規模感をパッと思い描くことができないようでは、データサイエンティストにはなれません。

というかマーケターや営業・プログラマーなど、どんな職種でも数字への感度・勘所は大事です。

確率統計

ここからデータサイエンティストっぽくなってきますが、確率統計の知識は基礎的な知識として必ずおさえておいてください!

世の中の全ての事象は、確率統計で表現することができます。

・競馬で当たる事象も
・交通事故の起きる事象も
・あなたが好きな人に告白して成功する事象も・・・

ということは、ある広告をあるお客さんに当てた時に成功する事象も確率統計に当てはめることができるということですね!

なんだかそう考えると面白くなってきませんか?

USJをV字回復に導いた森岡毅さんは、まさにこの確率統計の知識を用いてUSJの来場者数をモデル化して予測しました。

確率統計を駆使することで、倒産寸前の企業をそんな状態から復活させることができるのです!

この森岡毅さんの確率思考に関しては以下の書籍で詳しく述べられているので興味のある方は是非読んでみてください!

created by Rinker
¥3,520
(2020/08/05 17:51:32時点 Amazon調べ-詳細)

マーケターの中でもデータサイエンティストの中でも読み継がれる名著です。

微積分

続いて微積分!

微積分になるとグッと数学感が増してしまうので、拒否反応を起こしてしまう人もいるかもれしれません。

安心してください。

データサイエンティストに必要な微積分の知識はそれほど複雑ではありません。

というか微積分と書いていますが、基本的な微分ができればそれほど困ることはないです。

微分を使うと何ができるかというと・・・カンタンに言うと「ある数値が最小になるところを求めることができる」。

ロボたん
ロボたん
んー・・・?それが分かって何が嬉しいんだ?
ウマたん
ウマたん
機械学習の理論を学ぶ上で重要になってくるんだ!

データサイエンスにおいて強いモデルを作るために必要な機械学習。

機械学習って結局は最適化の手法なんですよー。

つまり「最適化=ある数値が最小(もしくは最大)になるところを求める」ということ。

微分の知識があれば、機械学習のアルゴリズムの飲み込みは早くなります。

線形代数

最後に線形代数!

線形代数って、正直高校や大学の時はムダな知識だなーと思っていた時期がありました。

しかーし、線形代数は大量のデータを扱うAIの分野で非常に重要な知識なんです!

線形代数がAIを学ぶ上で一番重要な基礎知識だと言っても過言ではないです。

線形代数とは、カンタンに言うと「たくさんあるデータをまとめて計算するマジック

データサイエンスの世界では、大量のデータを扱います。

そんな大量のデータをアルゴリズムに適用させることを定式化する上で線形代数は非常に便利!

機械学習や統計学の理論の理解を深める上で微分よりも線形代数は重要です。

データサイエンティストに必要な数学の勉強法

メモ

さてさて、ここで取り上げてきた数学の知識をどのように習得していけばよいか勉強法についてまとめておきましょう!

ウマたん
ウマたん
いきなり難しい書籍で勉強すると挫折してしまう可能性が高いからやめよう!

以下のステップで学んでいきましょう!

Step1:データサイエンス×数学の全体感を掴む
Step2:確率統計×マーケティングを学ぶ
Step3:微分を学ぶ
Step4:線形代数を学ぶ
Step5:総力戦で学ぶ

Step1:データサイエンス×数学の全体感を掴む

数字に対する感度を上げる+確率統計を含めたデータサイエンティストの全体感を掴む上でまず以下のUdemy動画をぜひ見てみてください!

【世界で21万人が受講】データサイエンティストを目指すあなたへ〜データサイエンス25時間ブートキャンプ〜

Udemy コース データサイエンス

データサイエンスの分野を幅広くおさえている講座ですが、その中でも確率統計に関して初歩的な部分をしっかりおさえています。

コミカルな動画と共に学べるので非常に分かりやすいです。

ビジネスサイドに立ってどのようにデータを扱えばよいかという議論のもとデータサイエンスについて学べるので分かりやすくスーッと頭に入ってくると思います。

\30日間返金無料/

Step2:確率統計×マーケティングを学ぶ

その後は、先ほども紹介した森岡さんの確率思考の戦略論で数学とマーケティングを結ぶ土台作りをしていきましょう!

created by Rinker
¥3,520
(2020/08/05 17:51:32時点 Amazon調べ-詳細)

複雑なモデルが出てきますが、ここまでビジネスを精緻にモデル化できるのはあせらなくて大丈夫です。

まずは、確率分布を応用するとここまでビジネスに大きな影響を与えることができるのだっ!!という認識を強く持っておくことが大事です。

確率モデルについてもっと理論サイドから詳しく知りたい場合はぜひ以下の書籍に目を通してみてください!

確率モデルに関連して、統計学の基本である推計統計学まで学びたい場合は以下の書籍がオススメです!

created by Rinker
¥3,190
(2020/08/06 09:22:33時点 Amazon調べ-詳細)

Step3:微分を学ぶ

微分は以下のUdemy動画がめちゃくちゃ分かりやすいのでぜひチェックしてみてください!

【キカガク流】人工知能・機械学習 脱ブラックボックス講座ー初級編ー

Udemy コース アルゴリズム

教育サービスを提供するキカガクの代表取締役の方が丁寧に機械学習のアルゴリズムについて教えてくれます。

まあ機械学習の基本・土台となる単回帰分析を数式から学んでいくもの。

ビックリしたんですが、パワポではなく紙に手書きで進んでいくんです!

最初は抵抗があったものの、なるほど意外と分かりやすい。

よくよく考えたら学生時代の教育は先生が手書きで黒板に書いて進めてましたもんね。

書籍で学ぶより断然学びやすいです!

\30日間返金無料/

Step4:線形代数を学ぶ

線形代数を学ぶのにおすすめなのは先ほど紹介したUdemy講座の中級編!

【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 中級編 –

Udemy コース ブラックボックス中級

本コースでは線形代数を学びながら重回帰分析まで展開していきます。

線形代数を学びながら微分も用いて定式化していきますよー!

実際に手計算で重回帰分析を行い、その後Pythonのscikit-learnを使って分析を行っていきます。

Pythonを使うとこんなにカンタンに計算できてしまうのかとビックリすると思いますが実際に手計算をする経験は有用。

\30日間返金無料/

Step5:総力戦で学ぶ(おまけ)

最後に今まで学んだことの総力戦で、是非読んで欲しい本が以下の書籍!

created by Rinker
¥3,190
(2020/08/05 19:46:43時点 Amazon調べ-詳細)

まさに微分=最適化のお話ですよーと言ったように微分・線形代数を使った最適化の理論が詳しく載っています。

機械学習を学ぶ上で非常に重要な内容なので、余裕があれば是非学んでみることをオススメします!

ただ、ここを理解しなくても大丈夫っちゃ大丈夫なので、おまけとしています!

まとめ

データサイエンティストに必要な数学のレベルと勉強法について簡単にまとめてきました!

ここでは非常に基礎的で簡単なレベルまでの勉強法をお伝えしてきました。

ただ、まずはこれでデータサイエンティストへの第1歩目が切れるでしょう!

ロボたん
ロボたん
そんなに複雑な数学を勉強する必要がないと聞いて安心したよ!
ウマたん
ウマたん
なるべくエッセンスだけに絞って勉強を進めていくことが大事!数学を毛嫌いせずに勉強を進めていこう!

この記事では数学だけに絞ってまとめてきましたが、データサイエンティストに必要なスキルは数学だけではありません。

以下の記事でデータサイエンティストへの必要なスキル・ロードマップをまとめているので是非チェックしてみてください!

【入門者向け】データサイエンティストに必要なスキルと独学勉強ロードマップ!当サイト【スタビジ】の本記事では、データサイエンティストに求められるスキルとそれを身に付けるための勉強法について徹底的にまとめていきます!入門者でも、しっかりデータサイエンティストについて理解しある程度独学で駆け出しの状態までいけることを目指します。...

また、データサイエンティストに必要なPythonのスキルを以下の記事でまとめているので合わせてチェックしてみてください!

【独学入門】初心者が3か月でPythonを習得できるようになる勉強法!当ブログ【スタビジ】の本記事では、Pythonを効率よく独学で習得する勉強法を具体的なコード付き実装例と合わせてまとめていきます。Pythonはできることが幅広いので自分のやりたいことを明確にして勉強法を選ぶことが大事です。...
Pythonを初学者が最短で習得する勉強法

Pythonを使うと様々なことができます。しかしどんなことをやりたいかという明確な目的がないと勉強は捗りません。

Pythonを習得するためのロードマップをまとめましたのでぜひチェックしてみてくださいね!