こんにちは!
データサイエンティストのウマたん(@statistics1012)です。
ごりごりのデータサイエンティスト微妙だなーという感覚を大学生の時に持ちながらマーケ畑をかじって最終的にデータサイエンティストやっている人間です。
大学院は統計科学専攻でアルゴリズム改良などだいぶ理論よりのことやってました。
世間的にデータサイエンティストの需要が高まっている中、色々と思うところもあるのでこの記事では新卒データサイエンティストとしての就職について語っていきたいと思います。
目次
データサイエンティストとは
そもそもデータサイエンティストとはどんな職業なのでしょうか?
Youtubeでも簡単に解説しているので、ぜひそちらも参考にしてみてください。
データサイエンティストは、データをサイエンスする人!(そのまんま笑)
何かしらのデータを原料に自分の知識とスキルと経験を総動員して新たな知見を導き出すプロフェッショナル。
ただ意外と業務範囲は広く、分析設計やデータの収集・加工、アウトプットの解釈から示唆出し、そして事業戦略に落とし込むところまでやるのがデータサイエンティストのお仕事なんです。
実は、データサイエンティストとは以下の3つのスキルを持つ人と明確に定義されています。
・エンジニアリング・ITのスキル
・統計学や機械学習理論のスキル
・マーケティング・ビジネスのスキル
人によってどの領域に強いか違いはありますが、基本的にはこの3つの素養を持ちあわせてはじめてデータサイエンティストと言えるのです。
データサイエンティストの種類と仕事内容
先ほど3つのスキルがあると言いましたがそれらのスキルのどこに強いかによって職種も少し変わってきます。
それぞれのデータサイエンティストの種類は以下の3つ!それぞれ見ていきましょう!
・エンジニアタイプのデータサイエンティスト
・研究者タイプのデータサイエンティスト
・ビジネスタイプのデータサイエンティスト
エンジニアタイプのデータサイエンティスト
先ほどの3つのスキルの中で、エンジニアリング・ITのスキルが強いデータサイエンティスト。
データサイエンティストではなく機械学習エンジニアと呼ばれることもあります。
データサイエンティストと機械学習エンジニアは明確に違う職種と言われることもありますが、正直境界は曖昧です。
データのエンジニアリングやモデル構築を得意としています。
研究者タイプのデータサイエンティスト
3つのスキルの中では統計学や機械学習理論のスキルに強い人材。
ビジネス場面に登場するというよりも研究者として企業R&Dに従事したり、大学や研究所での研究に専念しているケースが多いです。
海外では、研究者タイプのデータサイエンティストがGoogleやFacebookに高額で引き抜かれて人工知能開発に携わっていたりもします。
本来は、このタイプのデータサイエンティストが長期的な視点で将来を切り拓いていく重要な役割を担っているのですが、なかなか日本ではこのタイプが育ちにくい環境になっています。
詳しくは安宅さんの書籍「シン・ニホン」に書かれていますので興味のある方は読んでみてください!
(2024/09/13 15:02:32時点 Amazon調べ-詳細)
Youtubeでも解説していますよ!
ビジネスタイプのデータサイエンティスト
続いてビジネスタイプのデータサイエンティスト。
僕の場合は、統計学や機械学習理論のバックグラウンドを持ちながら主にこの「ビジネスタイプのデータサイエンティスト」として現在仕事をしています。
エンジニアリングまわりもやりますが、基礎的な分析からビジュアライズ、初期仮説出し、課題設定みたいなところをやります。
また最終的な打ち手にある程度精通していないとワークしないので、マーケティングまわりの知識も必要です。
勉強するべきマーケティングの知識は以下の記事でザックリまとめています。
データサイエンティストへのロードマップ
僕の場合元々データサイエンス系の専攻をしていて、そこからマーケティングとデータサイエンスの中間みたいなところで仕事をはじめ、そこから業務がデータサイエンス側に寄ってきたという感じ。
事業会社側のデータサイエンティストなので、データサイエンティストをソリューションとして提供しているような会社とは少しイメージが違うかもしれません。
ポジショントークになってしまいますが、個人的にはやはり事業側に近いところでデータサイエンティストをやった方が面白いよということ。
実は学部生の時にデータアナリストインターンシップを1年間経験し、もう少し事業よりの方がいいなと思って今にいたります。
人によって適性があると思うので先ほど紹介したスキルや領域のうち
・どこのスキルが今自分が強いのか
・どこの領域に自分は進みたいのか
CanとWantを明確にした方がいいですね。
僕の場合は、Canは統計・機械学習の理論、Wantはビジネス・マーケティングでした。
Wantを目指しつつ、自分のCanを活かして就職活動をすると良いでしょう!
そして自分の目指したいデータサイエンティストの姿が明確になれば行きたい企業も明確になりますし就活の確度も上がるでしょう!
ひよっこデータサイエンティストたちの奮闘を描いた小説を書いているので興味のある方は、是非見てみてください!
あまり具体的なデータサイエンティストの仕事について分かりやすく書いている本が見当たらなかったので自分で執筆しました!
ストーリー形式で分かりやすく書いていますので、ぜひ最初に目を通していただけるとイメージが湧くと思います。
価格は300円ちょっとですし、Kindle unlimitedであれば無料で読めるのでぜひチェックしてみてくださいね!
データサイエンティストに必要なスキルセットはボリューミーなのでスクールに通ってしまうのも一つの手です。
僕自身スクールに通った経験もあります。
また、データサイエンティストになる上で必要な基礎的な知識や勉強法については以下の記事で詳しくまとめています!
新卒データサイエンティスト就職先
あなたの得意なところ・目指す先は明確になりましたでしょうか?
そこが明確になった後はそれぞれの領域に強い会社を探してみましょう!
ここでは、データサイエンティストで新卒採用をおこなっている企業をいくつかピックアップしていきます。
ブレインパッド
データサイエンス専門の会社と言えば、ブレインパッド!
非常に優秀な方が多く、豊富な人材がそろっています。
修士の同期も何人かブレインパッドに就職しています。
社長の草野さんは、データサイエンティスト協会の代表理事を務められています(2020年7月)
Albert
Albertはデータサイエンティストを専門とする会社。
事業会社のコンサルや業務支援をしている会社で事業形態はブレインパッドと近いです。
コロナ期間の感染者分析をAlbertの方がおこなっていたということで話題になりました。
DeNA
言わずと知れたメガITベンチャー「DeNA」。
非常に優秀な人が多く、データサイエンティストも多く在籍しています。
ブレインパッドやAlbertと違い事業会社として自社のサービスをグロースさせるためのインハウスデータサイエンティストが多数在籍しています。
Kaggleと呼ばれるデータサイエンスコンペのトップランカーが多数在籍している印象が強いです。
リクルート
日本を代表するIT企業と言えば「リクルート」。
リクルートは人々の生活と密接に関わる事業を数多く展開しており、そんなリクルートにもインハウスのデータサイエンティストが多数存在します。
先ほどのKaggleへの出題がリクルートから過去ありました。
飲食店の需要を予測する問題でしたね。
事業サイドに密接に関わるデータサイエンティストとして働きたいならDeNAやリクルートがオススメです!
データサイエンティストの将来性
最後にデータサイエンティストの将来について少しだけ言及しておきましょう!
まず、データサイエンティストは現在過剰に注目されている職業であるという見方もありますが、この流れはしばらく続くと思っています。
ビッグデータというワードのトレンドは右肩下がりなのですが、データサイエンティストのトレンドは右肩上がりになっています。
全てのモノと情報が繋がるIOT化が進み、データはより多量になっていきます。
そのデータをいかに価値に変換するか、というアクションはなくなるわけがありません。
だからデータサイエンティストのトレンドはこれからも伸び続けます。
ただ、中途半端なデータサイエンティストは消滅する可能性はあります。
先ほど3つのタイプのデータサイエンティストがいると伝えましたが、そのどこに軸足を持つか、自分のポジションを明確にしておくとより価値のあるデータサイエンティストになれると思います!
データサイエンティストの将来性については以下の記事で詳しくまとめています!
以下の記事では、エンジニアタイプとビジネスタイプの2極化という観点から論じています。
データサイエンティストを目指すあなたに
最後になりました。
「データサイエンティスト」という言葉が世の中を席捲しているのは確かなのですが、データサイエンティストという言葉にこだわりすぎなくても大丈夫です!
・なんか難しそうだな~
・データサイエンティストなれなさそう~
と思った人もぜひデータに触れる機会を持ってください。
以下のUdemy講座でデータサイエンティストに近づくデータ分析について学べますので興味のある方は是非チェックしてみてください!
【初学者向け】データ分析コンペで楽しみながら学べるPython×データ分析講座
【オススメ度】 | |
---|---|
【講師】 | 僕! |
【時間】 | 4時間 |
【レベル】 | 初級~中級 |
このコースは、なかなか勉強する時間がないという方に向けてコンパクトに分かりやすく必要最低限の時間で重要なエッセンスを学び取れるように作成しています。
アニメーションを使った概要編とハンズオン形式で進む実践編に分かれており、概要編ではYoutubeの内容をより体系的にデータ分析・機械学習導入の文脈でまとめています。
データサイエンスの基礎について基本のキから学びつつ、なるべく堅苦しい説明は抜きにしてイメージを掴んでいきます。
統計学・機械学習の基本的な内容を学び各手法の詳細についてもなるべく概念的に分かりやすく理解できるように学んでいきます。
そしてデータ分析の流れについては実務に即したCRISP-DMというフレームワークに沿って体系的に学んでいきます!
データ分析というと機械学習でモデル構築する部分にスポットがあたりがちですが、それ以外の工程についてもしっかりおさえておきましょう!
続いて実践編ではデータコンペの中古マンションのデータを題材にして、実際に手を動かしながら機械学習手法を実装していきます。
ここでは、探索的にデータを見ていきながらデータを加工し、その上でLight gbm という機械学習手法を使ってモデル構築までおこなっていきます。
是非興味のある方は受講してみてください!
Twitterアカウント(@statistics1012)にメンションいただければ2000円以下になる講師クーポンを発行いたします!
データサイエンティストという一見おごそかな職業でなくても、データから価値を生めたらそれはもうデータサイエンティストの入り口に立っています。
多くの人のデータリテラシーが高まることが結局世の中をデータで変えるためには必要なのです。
また大学生向けに勉強法や勉強ジャンルもまとめていますので興味のある方は大学生の方は参考にしてみてください!