データサイエンティストのウマたん(@statistics1012)です!
この記事では一貫してデータのキャリアを歩んできた僕が、機械学習を勉強して仕事に活かしていくロードマップについて徹底的にまとめていきます。
機械学習の需要は年々増えています。
しかし、機械学習をビジネスに活かそうとするとなかなか上手くいかないというのも事実。
理論だけ勉強してもダメです。
実践だけ勉強してもダメです。
しっかり理論と実践の両輪を回して機械学習を操れる人材になってください!
目次
Step0:機械学習の独学勉強ロードマップのゴールと前準備
ここからなるべく挫折せず独学で機械学習を学び続けられる勉強方法について徹底的にまとめていきます。
機械学習を学ぼうとする人は多いものの、実際のところは
と意気込んで難しい書籍を購入してよく分からず挫折するケースというのが結構多いように思います。
なので、個人的にはまずは
・機械学習の概要を込み入った話なしで理解すること
・何ができるのかという漠然としたイメージを持つこと
が大事だと思っています。
そして機械学習の勉強をしっかり継続するためには
・機械学習を使って何がしたいのか
・機械学習を独学で習得した先に何を目指しているのか
というのをしっかり明確にしておくべきなのです!
そこを曖昧にしたまま機械学習の勉強に挑んでも途中で挫折してしまう可能性が高いです。
是非そこをおさえた上で機械学習の勉強にのぞみましょう!
ここから機械学習の勉強ステップについて紹介していきますが、当メディアが提供している「スタビジアカデミー(スタアカ)」でまとめて勉強できるので、良かったらチェックしてみてください。
Step1:機械学習の概要を学ぶ
それでは早速、機械学習独学勉強ロードマップのStep1
機械学習の概要から学んでいきましょう!
最初から機械学習の深い理論から入らないでください。
いきなりPythonの実装から入らないでください。
まずは機械学習の雰囲気を掴んでいきましょう!
・機械学習の各論に入る前に機械学習は何ができるのか
・機械学習にはザックリどんな手法があってどんな場面で使われているのか
について学んでいきましょう!
手前味噌ですがUdemyというサービスの僕自身が公開している以下の講座がめちゃくちゃオススメです!!
【初学者向け】データ分析コンペで楽しみながら学べるPython×データ分析講座
【オススメ度】 | |
---|---|
【講師】 | 僕自身!今なら購入時に「VGRBCQDF」という講師クーポンコードを入れると94%OFFになりますのでぜひご受講ください! |
【時間】 | 4時間 |
【レベル】 | 初級~中級 |
僕自身がUdemyの色んなコースを受けてみた中で、他のコースにはないこんなコースあったらいいなみたいなコースを作ってみました。
このコースは、なかなか勉強する時間がないという方に向けてコンパクトに分かりやすく必要最低限の時間で重要なエッセンスを学び取れるように作成しています。
アニメーションを使った概要編とハンズオン形式で進む実践編に分かれており、概要編ではYoutubeの内容をより体系的にデータ分析・機械学習導入の文脈でまとめています。
データサイエンスの基礎について基本のキから学びつつ、なるべく堅苦しい説明は抜きにしてイメージを掴んでいきます。
統計学・機械学習の基本的な内容を学び各手法の詳細についてもなるべく概念的に分かりやすく理解できるように学んでいきます。
そしてデータ分析の流れについては実務に即したCRISP-DMというフレームワークに沿って体系的に学んでいきます!
データ分析というと機械学習でモデル構築する部分にスポットがあたりがちですが、それ以外の工程についてもしっかりおさえておきましょう!
続いて実践編ではデータコンペの中古マンションのデータを題材にして、実際に手を動かしながら機械学習手法を実装していきます。
ここでは、探索的にデータを見ていきながらデータを加工し、その上でLight gbm という機械学習手法を使ってモデル構築までおこなっていきます。
是非興味のある方は受講してみてください!
機械学習の各種アルゴリズムや手法に関しては以下の記事で詳しく解説していますので是非チェックしてみてください!
また、僕自身のYoutubeでも機械学習の色々についてまとめていますのでこちらも是非参考にしてみてください!
Step2:機械学習をPythonで実装してみる
Step1で機械学習の概要の理解を進めた後はPythonで手を動かしながら実装をしてみましょう!
Pythonは非常に様々なことができる言語なのですが、その中でも特に機械学習に強みがあります。
機械学習を独学で進める際にもちろん理論を勉強するのも大事ですが、まずは学んでいて楽しい!何か形になった!と実感することが大事です。
そのため最初から理論に深入りするよりも、まずは概要をおさえた上でPythonを使って色々実装してみてデキる感覚を得ることが非常に重要です。
ここでは、先ほど紹介した私のデータ分析のコースでももちろんPythonを使ってデータ分析コンペの実践までおこなっているのでこちらであわせて学習するのもオススメ!
他にも以下のUdemyのPythonコースを受けてみて手を動かして学んでみることをオススメします。
【実践】ビジネスケースとつなげてPythonで出来ること5つを学べる3日間集中コース
【オススメ度】 | |
---|---|
【講師】 | 僕自身!今なら購入時に「VGRBCQDF」という講師クーポンコードを入れると94%OFFになりますのでぜひご受講ください! |
【時間】 | 3.5時間 |
【レベル】 | 初級~中級 |
こちらも手前味噌ですが、Pythonについて理解してみるのにオススメなコースを僕自身が出しています!
Pythonで出来ることのうち以下の5つを網羅して学んでいきます。
・データ集計・加工・描画
・機械学習を使ったモデル構築
・Webスクレイピング
・APIの利用
・Webアプリケーション開発
データ集計・加工・描画と機械学習モデル構築に関してはKaggleというデータ分析コンペティションのWalmartの小売データを扱いながら学んでいきます。
WebスクレイピングとAPI利用とWebアプリケーション開発に関しては、楽天の在庫情報を取得してSlackに自動で通知するWebアプリケーションを作成して学んでいきます。
データ分析・機械学習領域に特化した内容ではありませんが、まずPythonで何ができるのか知りたい!という方には一番はじめにまず受けていただきたいコースです!
データ分析コンペ
ここまで来ると、機械学習の概要を理解した上でデータ分析の勘所も分かっていて課題解決ができるようになっている状態のはず。
そこで自分の腕試しにデータ分析コンペに挑戦してみましょう!
僕のUdemy講座「【初学者向け】データ分析コンペで楽しみながら学べるPython×データ分析講座」ではNishikaというデータ分析コンペを題材にしています!
また日本では他にSignateというコンペがあり、世界的にはKaggleというデータ分析コンペが最も有名です。
これらのデータ分析の中で序列をつけるとするならば、規模や知名度は
Nishika<Signate<Kaggle
というようになっていますが、このフェーズでのオススメ度は
Nishika>Signate>Kaggle
です。
というのも、規模が大きく知名度が高い分、参加者も多く取り組む課題も複雑になりがちです。
個人的に最初のうちはなるべく小規模で実績を作りやすいNishikaあたりに挑戦してみるのがオススメです!
そしてそこからSignateやKaggleにステップアップしていくとよいでしょう!
ただ色んなデータ分析課題が常にアップデートされているので、日々各プラットフォームをチェックしておくとよいかもしれません!
以下の記事で各データ分析コンペの特徴について比較していますのでよければチェックしてみてください!
プログラミングスクールに通ってみる
このPython実装タイミングでは、プログラミングスクールを利用するのもありです。
僕自身も過去に3ヶ月ほどプログラミングスクールに通った経験があります。
僕自身も通ったスクールでオススメなのはテックアカデミー!
現役エンジニアのパーソナルメンターがつくので分からないところも解消しやすく書籍などで進めるよりは圧倒的に進みが早いです。
価格は3か月で284,900円!
価格は少々かかりますが、そのぶんお尻に火が付きます。
メンターのレベルは非常に高いので自分のやる気さえあれば教材の範囲を超えた内容をガツガツ学ぶことが可能!
僕自身3か月のコースを1か月で終わらせて、応用をガツガツ学んでました。
ただ少し価格が高いんですよね、、、そこで当メディアでは今までの知見を元に、業界最安値でしっかり学べる「スタアカ」というスクールを作りました!
機械学習を網羅的に学べる素晴らしいスクールに仕上げているので是非チェックしてみてくださいね!
公式サイト:https://toukei-lab.com/achademy/
【価格】 | ライトプラン:1280円/月 プレミアムプラン:149,800円 |
---|---|
【オススメ度】 | |
【サポート体制】 | |
【受講形式】 | オンライン形式 |
【学習範囲】 | データサイエンスを網羅的に学ぶ 実践的なビジネスフレームワークを学ぶ SQLとPythonを組みあわせて実データを使った様々なワークを行う マーケティングの実行プラン策定 マーケティングとデータ分析の掛け合わせで集客マネタイズ |
24時間以内の質問対応と現役データサイエンティストによる1週間に1回のメンタリングを実施します!
カリキュラム自体は、他のスクールと比較して圧倒的に良い自信があるのでぜひ受講してみてください!
他のスクールのカリキュラムはPythonでの機械学習実装だけに焦点が当たっているものが多く、実務に即した内容になっていないものが多いです。
そんな課題感に対して、実務で使うことの多いSQLや機械学習のビジネス導入プロセスの理解などもあわせて学べるボリューム満点のコースになっています!
ウォルマートのデータを使って商品の予測分析をしたり、実務で使うことの多いGoogleプロダクトのBigQueryを使って投球分析をしたり、データサイエンティストに必要なビジネス・マーケティングの基礎を学んでマーケティングプランを作ってもらったり・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践してもらったりする盛りだくさんの内容になってます!
・BigQuery上でSQL、Google Colab上でPythonを使い野球の投球分析
・世界最大手小売企業のウォルマートの実データを用いた需要予測
・ビジネス・マーケティングの基礎を学んで実際の企業を題材にしたマーケティングプランの策定
・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践して稼ぐ
機械学習やデータサイエンスを学べるスクールは他にもたくさんあります。
以下の記事でまとめていますのでこちらもあわせてチェックしてみてください!
ここまでPythonでの機械学習実装についてまとめてきました。
Pythonの勉強法については以下の記事でも詳しくまとめていますので是非チェックしてみてください!
Step3: 数学の基礎を勉強し機械学習理論の理解へとつなげる
ここまでで機械学習の概要を掴んだ上で、手を動かしてPythonでの実装をしてきました。
この時点でだいぶ力がついてきているはずです。
ここで改めて機械学習の理論を深堀りしていくフェーズに入りましょう!
機械学習手法の理論に踏み込む上では少々数学が必要です。
数学の勉強で大事なのは以下の2つ。
・微分積分
・線形代数
モデルの誤差を損失関数と言いますが、損失関数をなるーーべく小さくすると良いモデルになります。
その時に微分を使うんですよねー。
微分積分に関しては以下の記事をチェックしてもらえると概要が理解できると思います。
これなら分かる最適化数学
ここまで、おおかた数学の土台は出来上がっていると思いますが、もしさらに深く数学について学びたい場合はこの書籍をオススメします!
ちょっと難しいですが、深くエッセンスの詰まった書籍。
数学側に主眼を置いていますが、AI/機械学習手法と絡ませながら学ぶとより一層学びが深まる良書です。
もしこのタイミングであまり理解が進まなくてもまた戻ってきて読み直してみることをオススメします。
Step4:本格的に機械学習の理論を勉強する
ある程度数学の土台が出来たあとは、機械学習手法の実践に挑戦してみましょう!
最初は難しいかもしれませんが、ここまでくれば比較的多くの機械学習書籍を独学で読めるようになっているはずです。
ぜひこのフェーズでは名著と呼ばれる機械学習書籍に手を出していきましょう!
はじめてのパターン認識
機械学習の本としては以下の「はじめてのパターン認識」が名著です。
こちらには、かなり詳しく載っています。
「はじめての」と書いている割には、はじめて感がないのが特徴です笑
データ解析のための統計モデリング入門
(2024/11/21 15:25:34時点 Amazon調べ-詳細)
また、直接的に機械学習ではありませんが統計的モデリングについて理解しておくと非常に機械学習の理解も深まるので以下の書籍も一緒に読むことをオススメします!
線形モデリングからベイズモデリングの領域まで詳しく学べて、これを1冊読んでおくと機械学習領域に対する解像度が高まります。
ゼロから作るディープラーニング
(2024/11/21 07:52:34時点 Amazon調べ-詳細)
機械学習の領域の中でもホットな領域であるディープラーニングについて詳しく解説されている書籍です。
非常に読みやすく、ここまでたどり着いている方であれば、スーッと理解できるはずです。
その名の通り、ゼロからディープラーニングについて理解を深めて、Pythonでの実装もしていきます。
本当に分かりやすい書籍なので是非目を通してみてください!
機械学習を勉強するためにオススメの本を以下にまとめていますのでこちらも参考にしてみてください!
Step5:ビジネスシーンに機械学習を導入する勉強
ここまで来れば正直、機械学習理論の理解と実装は問題ないはずです。
だいぶ理解も深まっていることでしょう!
ただ理論が理解出来ていて、実装も出来ても、それをビジネスシーンに落とし込むにはもうひと押し必要なんです。
そこで大事なのがビジネスシーンでどのように機械学習を使ってどのように課題解決をしていくかという観点。
機械学習の導入にはCRISP-DMというフレームワークが非常に重要です。
機械学習をビジネスに活かすために機械学習だけを学ぶのではその前後のプロセスについてもしっかり理解しましょう!
このフェーズで学ぶことは正直Step1あたりで勉強しても問題ないんですが、一応最後のStepとしておいておきます。
会社を変える分析の力
著者は大阪ガスにて10年以上データ分析業務に従事してこられた河本さん。
事業会社のインハウスデータ分析屋さんとしての経験をもとにデータ分析を使ってどのように既存ビジネスに変革を起こしていくかということが語られています。
このように社内を駆け回ってデータ分析から価値を生み続けている方のお話は説得力があります。
専門的なデータの話はされていませんが、データ分析をビジネスに活かすために必要なことについて徹底的に語られている非常にオススメな書籍です。
Kaggleで勝つデータ分析の技術
仕事になると機械学習課題の細かいチューニングや課題設定が大事になります。
この書籍は、そんな機械学習の実践のエッセンスが詰まった1冊です。
Kaggleというデータ分析コンペの猛者が著者で書かれている実践的なデータ分析のための書籍です。
機械学習のアルゴリズムや手法の内容よりも、どのようにデータを調理してデータ分析に活かせばよいかという話がしっかり載っている最強の書籍です!
仕事で機械学習を使う際に、精度を上げることを求めるシーンでぜひ手元に置いておきたい1冊になります。
仕事ではじめる機械学習
機械学習を学んで実際にビジネスシーンではなかなか上手くいかないことが多いです。
そんな時にオススメなのがこの「仕事ではじめる機械学習」!
この本は、ビジネス観点から機械学習について教えてくれる良書です。
個人的には機械学習の書籍なのに、
「機械学習を使わないで解決できる方法を考えよう!」
と書いてある点が非常に好感を持てます。
そう、機械学習はあくまで手段であり目的ではないんです。
機械学習を導入することが目的になってしまうプロジェクトは失敗しやすいです。
・何のために機械学習を導入するのか
・機械学習を導入しないで解決できる方法はないのか
について考えておきましょう!
俺たちひよっこデータサイエンティストが世界を変える
手前味噌ですが、僕自身が書いているこちらの書籍も紹介させてください。
「俺たちひよっこデータサイエンティストが世界を変える」という書籍を出版しています。
あまり具体的なデータサイエンティストの仕事について分かりやすく書いている本が見当たらなかったので自分で執筆しました!
勾配ブースティング木のXGBoostを使ったビジネスシーンでの実装についてストーリー形式で簡単にまとめていますのでイメージをふくらませてもらうのにちょうど良いかと思います!
価格は300円ちょっとですし、Kindle unlimitedであれば無料で読めるのでぜひチェックしてみてくださいね!
業界最安値のデータサイエンス専門スクール「スタアカ」
公式サイト:https://toukei-lab.com/achademy/
何度も紹介していますが、スタアカでは特にどうやって機械学習をビジネスシーンに導入していくかという部分にかなりフォーカスしています。
CRISP-DMのフレームワークに沿って機械学習をビジネスにつなげてインパクトを出す本質的な内容を学んでいきますよ!
ぜひぜひここまでのロードマップを網羅して学ぶのであれば「スタアカ(スタビジアカデミー)」を受講してみてください!
機械学習の独学勉強ロードマップ まとめ
ここまでで機械学習の独学勉強ロードマップについて徹底的にまとめてきました!
以下の動画でも解説していますので改めてチェックしてみてください!
機械学習の独学は一見厳しそうに思えるかもしれませんが、やり方さえ間違わなければ問題なくできると思っています。
ぜひここで紹介した機械学習の独学勉強ロードマップに沿って機械学習を学んでいきましょう!
色々お伝えしてきましたが、以下のステップで進めればまず問題ないとおもってます!
Step1:機械学習の概要を学ぶ
Step2:機械学習をPythonで実装してみる
Step3: 数学の基礎を勉強し機械学習理論の理解へとつなげる
Step4:本格的に機械学習の理論を勉強する
Step5:ビジネスシーンに機械学習を導入する勉強
じっくり読んであなたに合った学習法を見つけてくださいね!
また、以下の記事でPythonやデータサイエンス・統計学、G検定の勉強法をまとめていますので是非チェックしてみてください!
機械学習に関する資格でG検定・E資格があるので、興味がある方は以下の記事をチェックしてみてください。