大好評のデータサイエンス業界で話題なトピックを聞いてみよう!インタビュー企画!
第2回は、早稲田大学経営システム工学科情報数理応用研究室教授 兼 早稲田大学データサイエンス研究所所長 の後藤先生にお話しをお伺いに来ました!
よろしくお願いします!
目次
後藤先生の背景となぜデータサイエンスをやるようになったのか
そのあと博士課程では早稲田大学に移りニューラルからは一旦離れ、情報理論の研究に従事していました。
その中でベイズ統計の枠組みで理論研究を中心に行っていました。その頃は、データをいじるというより理論を主にやっていましたね。
その後、縁あって東大のビジネス系の研究室に参加し、そこで理論からビジネスの方に入っていった気がします。
東大では、ビジネスモデル学会の運営などにも携わり、企業の経営にかかわる解析を行うようになりました。
その後、武蔵工業大学の環境情報学部に着任し、ここでもデータを実際に使って分析するということを行っていました。
でも、その頃は大規模なデータを機械学習などで解析するようなことではなく、アンケートデータをとって統計的に解析するようなことをやっていました。
そこで、自然言語が面白いなと気付いて、機械学習に戻っていった気がします。
早稲田大学に着任後は主に情報数理をベースとしてテキストデータ等の大規模データの解析に従事しています。
もともと機械学習でずっとやっているわけではなく、いろいろまわって機械学習に戻ってきているんです。
なかなか使えない企業のデータを学生の研究に活かせるようにしたかったのが最初です。企業の方々を含め多くの人の協力を経て、実現できました。
AI・データサイエンティストの現状と将来について
昨今、AIやデータサイエンスという言葉が世の中を席捲していますが、このような分野の現状と今後の将来についてどのようにお考えですか?
一つ目は、昔はデータがなく集めるのが大変だったのにも拘らず、今ではオンラインで大量のデータを抽出することができるようになったからです。
ただ、現在ではデータの量はものすごく多いですが、情報が少なくスカスカで薄いデータばかり。
それらの薄い大量のデータから何か知見を抽出することができるデータサイエンティストが求められています。
二つ目は、コンピューターの処理速度の上昇。これは良く言われますよね。
三つ目は、アルゴリズムの改善です。著しいスピードで新しい革新的なアルゴリズムが開発されています。統計学は分かるけどディープラーニングなどは分からないという人は時代の流れについていけないのではないでしょうか?
確かに現在多くの企業でとりあえずディープラーニングを取り入れようなんて動きがありますが、そのような意味でのブームは落ち着いていくでしょう。ただ、データサイエンス分野の技術はこれからどんどん進歩していくでしょう。
最近興味のある分野
いまは、特定の状況でどのように解析するのがよいかに興味を持っています。
たとえば、古着のブランドの価格を予測したいという時にディープラーニングでいいかというとそうとは言えません。なんでもかんでもディープラーニングが良いわけではなくて、データの量・質によって全然違ってきますよね。
どれか特定の分野ではなくて、いかなる状況においてどのように解析できるかが非常に重要。
これがデータサイエンティストに求められる素養だと思っています。
これからデータサイエンスを勉強する学生に一言
マネジメント・経営
→マネジメントの実務経験は会社に入ってから積まれてゆくものでしょう。ただし、経営システムの全体像について、フレームワークを勉強していることは将来大変役に立つと思います。経営工学系を卒業した学生が社会から評価されている一つの理由ですね。
IT・情報
→必要に応じてやればよいでしょう。研究でもなんでもやらなくちゃいけない環境に追い込まれたらやるし、できるようになると思います。ただし、「情報系やプログラミングは嫌いで、受け付けられない」という人は時代に取り残されてしまいます。ITやプログラミングは手段であって目的ではありません。これらのスキルは、自ら必要性を見出せる目標を見つけるのが先で、その目標に向かってポジティブに取り組むのが良いと思います。
統計
→やはりこの部分が圧倒的に重要です。社会人になってから、基礎をやりたくても時間ないから。
線形代数などの統計の背景にある部分はしっかり詰めておくべきですね。
気が済むまでやっておくべきですね。損得じゃなくて勉強するべきです。学生のうちしかできないから!一見関係ない分野を勉強すると、実は関係していたってことがよくあります。
とりあえず理論的なところをしっかり詰めていくべきですね
後藤先生のおすすめ書籍:
測度から確率へ
カルマンフィルター
後藤先生の著書:
パターン認識入門