こんにちは!
データサイエンティストのウマたん(@statistics1012)です。
大学院では統計学を専攻しながらデータアナリストとして1年ほどベンチャー企業で働いていた過去があります。
データ分析を生業とする職業として「データサイエンティストとデータアナリスト」がありますが、この2つの境目は曖昧。
人によって解釈も異なり業界や会社が変われば定義も若干変わってくるこれらの職種ですが、自分の経験をふまえてどのような違いがあるのか考察していきたいと思います。
ぜひ、データサイエンティストとデータアナリストの違いを理解して自分のキャリアに活かしてくださいね!
以下のYoutubeでも詳しく解説していますよ!
目次
データサイエンティストとデータアナリストの仕事の違い
早速、データサイエンティストとデータアナリストの仕事上の違いを見ていきましょう!
どちらが明確に優れているという話ではありませんが、データサイエンティストの方がデータアナリストよりも業務領域が広いのは間違いありません。
データサイエンティストはビジネスまでコミットする
データサイエンティストとデータアナリストの違いとして明確に言える1つ目がビジネスへの関与度。
データアナリストは、データを加工・集計して分析することで何かしらのアウトプットを出したり、データの可視化・KPI管理などを主戦場とします。
実際にデータアナリストとして働いていた時は、すでに存在するデータを集計・分析してそこから得たアウトプットを経営陣に伝えていました。
もちろん一概には言えませんが、データアナリストは得られたアウトプットのビジネス化の部分までコミットすることは求められません。
一方データサイエンティストは、データからアウトプットしてハイ終わりではなく、そのアウトプット結果をどのようにビジネスに活かすか、まで求められます。
データから価値を生みだしそれをビジネスに活かし、いかにビジネスをドライブできるかどうかがデータサイエンティストに求められていることなのです。
データサイエンティストはデータ蓄積部分にもコミットする
さらにデータサイエンティストは、データ分析の前手に必要なデータ蓄積部分にコミットすることも多いです。
もちろん、この部分はデータエンジニアやインフラエンジニアなどと協働していくことになりますが、ビジネス課題の特定から必要なデータやデータの持ち方などを定義してデータ蓄積部分にもコミットする必要が出てきます。
実際にJavascriptを書きWebログデータをDMPに貯めたり、サードパーティーデータの活用などをおこなっています。
データアナリストはデータ集計・分析・ビジュアライズを主戦場とするため、このデータ基盤部分にはコミットしない場合が多いです。
過去にデータアナリストを経験して、現在データサイエンティストをやっている身からするとデータアナリストよりもデータサイエンティストの方が圧倒的に面白い!!
やっぱりデータから価値を生んでもそれをビジネスに活かすことができないとあんまり面白くないですよねー!
出口までコミットできるデータサイエンティストの方がエキサイティングでっす!
データサイエンティストとデータアナリストのスキルの違い
データサイエンティストとデータアナリストの仕事の違いを見てきましたが、つまりデータサイエンティストは、データ蓄積→データ分析→ビジネス活用の一連の業務を一気通貫で行う業務領域の広い職種であると言えます。
データサイエンティストのスキルについては以下の動画でも解説しています。
データサイエンティストのスキルは大きく分けて3つあると言われています。
・エンジニアリング・ITのスキル
・統計学や機械学習理論のスキル
・マーケティング・ビジネスのスキル
この中でも統計学/機械学習理論のスキルや一部のエンジニアリング・ITのスキルはデータアナリストと被ってくる部分ですが、
データサイエンティストに関してはそれにプラスしてエンジニアリング・ITのスキルやマーケティング・ビジネスのスキルをさらに深めたのがデータサイエンティストと呼べるでしょう!
さらに細かいスキルリストに関しては、データサイエンティスト協会の以下の資料に非常に細かく記載されているため、興味のある方は是非見てみてください!
余談ですが、データサイエンティスト協会の理事である安宅さんのシン・ニホンはデータサイエンスとAIの可能性をものすごく熱く語っている本なのでオススメです。
データアナリスト・データサイエンティスト問わず、データから価値を生む仕事に付いている人にはぜひ読んで欲しい書籍になっています!
(2024/10/29 23:46:18時点 Amazon調べ-詳細)
データサイエンティストになるためには
データサイエンティストとデータアナリストの違いについて見てきましたが、データサイエンティストになるためにはどのようなステップ・勉強を経ればよいのでしょうか?
実務経験が大事なのは言わずもがなですが、以下のようなステップでデータサイエンティストのある程度の下地は付けられると思います。
・データサイエンティストの仕事イメージ、全体像
・統計学と機械学習理論
・Pythonによる実装
・ビジネススキル
データサイエンティストの仕事イメージ、全体像
まず、データサイエンティストの仕事の一部を知るために手前味噌ですが以下の書籍を書いていますのでそちらを読んでいただくとイメージが湧くと思います!
ストーリー形式で分かりやすく書いていますので、ぜひ最初に目を通していただけるとイメージが湧くと思います。
データ分析部分に特化して取り上げています。
Kindle unlimitedであれば無料で読めるのでぜひチェックしてみてくださいね!
統計学と機械学習理論
統計学と機械学習理論はデータサイエンスを学ぶ上で欠かせません。
平均・分散など統計の基本的な部分を学んで統計的検定などの統計学基礎が分かり、基本的な教師あり学習・教師なし学習などの手法のアルゴリズムが分かるようなレベルをとりあえずは目指したいですね!
いきなり書籍は取っつきにくいと思うので以下のUdemy講座を受講してみてください!データサイエンスの基本的な内容についてこれでもかというくらい分かりやすくまとめています!
【初学者向け】データ分析コンペで楽しみながら学べるPython×データ分析講座
【オススメ度】 | |
---|---|
【講師】 | 僕自身!今なら購入時に「66FLEHE87LQ6」という講師クーポンコードを入れると94%OFFになりますのでぜひご受講ください! |
【時間】 | 4時間 |
【レベル】 | 初級~中級 |
なかなか勉強する時間がないという方に向けてコンパクトに分かりやすく必要最低限の時間で重要なエッセンスを学び取れるように作成しています。
アニメーションを使った概要編とハンズオン形式で進む実践編に分かれており、概要編では体系的にデータ分析・機械学習導入をまとめています。
データサイエンスの基礎について基本のキから学びつつ、なるべく堅苦しい説明は抜きにしてイメージを掴んでいきます。
統計学・機械学習の基本的な内容を学び各手法の詳細についてもなるべく概念的に分かりやすく理解できるように学んでいきます。
そしてデータ分析の流れについては実務に即したCRISP-DMというフレームワークに沿って体系的に学んでいきます!
データ分析というと機械学習でモデル構築する部分にスポットがあたりがちですが、それ以外の工程についてもしっかりおさえておきましょう!
続いて実践編ではデータコンペの中古マンションのデータを題材にして、実際に手を動かしながら機械学習手法を実装していきます。
ここでは、探索的にデータを見ていきながらデータを加工し、その上でLight gbm という機械学習手法を使ってモデル構築までおこなっていきます。
是非興味のある方は受講してみてください!
また、以下の記事で統計学と機械学習の学習方法についてまとめています。
統計学と機械学習は被る部分も多いのですが、統計学は現状のデータを把握することに重きを置き、機械学習は将来のデータを予測することに重きを置くということを頭に入れておいてください!
Pythonでの実装
実際にデータを加工して集計してモデル構築をする上でプログラミング言語を扱える必要があります。
正直PythonでなくてRでもいいですし、データ加工の大部分はSQLで行うことが多いので、そこも一緒に学んで欲しいところですが、やはりPython学習は欠かせません。
Pythonを学ぶのであれば、以下のUdemy講座でPythonで出来ることをコンパクトにまとめていますのでチェックしてみてください!
【実践】ビジネスケースとつなげてPythonで出来ること5つを学べる3日間集中コース
【オススメ度】 | |
---|---|
【講師】 | 僕自身!今なら購入時に「66FLEHE87LQ6」という講師クーポンコードを入れると94%OFFになりますのでぜひご受講ください! |
【時間】 | 3.5時間 |
【レベル】 | 初級~中級 |
手前味噌ですが、Pythonについて理解してみるのにオススメなコースを僕自身が出しています!
Pythonで出来ることのうち以下の5つを網羅して学んでいきます。
・データ集計・加工・描画
・機械学習を使ったモデル構築
・Webスクレイピング
・APIの利用
・Webアプリケーション開発
データ集計・加工・描画と機械学習モデル構築に関してはKaggleというデータ分析コンペティションのWalmartの小売データを扱いながら学んでいきます。
WebスクレイピングとAPI利用とWebアプリケーション開発に関しては、楽天の在庫情報を取得してSlackに自動で通知するWebアプリケーションを作成して学んでいきます。
Pythonで何ができるのか知りたい!という方には一番はじめにまず受けていただきたいコースです!
また、Pythonの学習にはPyQというサービスが非常におすすめ!
公式サイト:https://pyq.jp
このサービスはPythonに特化したオンライン学習サービスでとにかくコーディングしまくれます。
とにかく写経してしまくってください!
Pythonに関しては以下の記事で詳しくまとめているので是非チェックしてみてください!
ビジネススキル
最後にビジネススキル!
ビジネススキルは実際に実務を行いながら身に付けていくべきですが、まずは基本的なビジネス思考やマインドセット、フレームワークなどはおさえておきたいところ。
以下の書籍でデータサイエンティストの仕事をビジネス視点が簡単にまとめていますので是非見てみてください!
価格は300円ちょっとですし、Kindle unlimitedであれば無料で読めるのでぜひチェックしてみてくださいね!
ここまでで、データサイエンティストになるためのロードマップについて簡単に解説してきました。
データサイエンティストに必要なスキルセットはボリューミーなのでスクールに通ってしまうのも一つの手です。
ちなみに当メディアが運営するAIデータサイエンス特化スクールの「スタアカ(スタビジアカデミー)」では、ここで紹介した内容がすべて網羅的に学べるのでオススメです!
スタアカ(スタビジアカデミー)
公式サイト:https://toukei-lab.com/achademy/
【価格】 | ライトプラン:1280円/月 プレミアムプラン:149,800円 |
---|---|
【オススメ度】 | |
【サポート体制】 | |
【受講形式】 | オンライン形式 |
【学習範囲】 | データサイエンスを網羅的に学ぶ 実践的なビジネスフレームワークを学ぶ SQLとPythonを組みあわせて実データを使った様々なワークを行う マーケティングの実行プラン策定 マーケティングとデータ分析の掛け合わせで集客マネタイズ |
データサイエンティストとしての自分の経験をふまえてエッセンスを詰め込んだのがこちらのスタビジアカデミー、略して「スタアカ」!!
24時間以内の質問対応と現役データサイエンティストによる1週間に1回のメンタリングを実施します!
カリキュラム自体は、他のスクールと比較して圧倒的に良い自信があるのでぜひ受講してみてください!
他のスクールのカリキュラムはPythonでの機械学習実装だけに焦点が当たっているものが多く、実務に即した内容になっていないものが多いです。
そんな課題感に対して、実務で使うことの多いSQLや機械学習のビジネス導入プロセスの理解などもあわせて学べるボリューム満点のコースになっています!
ウォルマートのデータを使って商品の予測分析をしたり、実務で使うことの多いGoogleプロダクトのBigQueryを使って投球分析をしたり、データサイエンティストに必要なビジネス・マーケティングの基礎を学んでマーケティングプランを作ってもらったり・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践してもらったりする盛りだくさんの内容になってます!
・BigQuery上でSQL、Google Colab上でPythonを使い野球の投球分析
・世界最大手小売企業のウォルマートの実データを用いた需要予測
・ビジネス・マーケティングの基礎を学んで実際の企業を題材にしたマーケティングプランの策定
・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践して稼ぐ
他にもいくつかスクールがあります。以下でまとめていますのでチェックしてみてください!
また、データサイエンティストの勉強ステップについて詳しくまとめていますので是非チェックしてみてください!
データサイエンティストとデータアナリストの違い まとめ
データサイエンティストとデータアナリストの違いについてまとめてきました!
データサイエンティストの方が業務範囲が広くデータ蓄積設計からビジネス出口まで幅広く抑えている職種であることが分かりましたね!
個人的なポジショントークになってしまいますが、やっぱりせっかくデータ関連のお仕事をするのであればデータサイエンティストを目指してほしいなと思います。
必要とされるスキルや業務範囲は非常に広いですが、ぜひデータサイエンティストを目指しましょう!
以下の記事でデータサイエンティストの将来についてまとめています!
よければ目を通してみてください!
イラスト出典:Illustration by Stories by Freepik