インタビュー

データサイエンスについて後藤先生に聞いてみた!

記事内に商品プロモーションを含む場合があります

大好評のデータサイエンス業界で話題なトピックを聞いてみよう!インタビュー企画!

第2回は、早稲田大学経営システム工学科情報数理応用研究室教授 兼 早稲田大学データサイエンス研究所所長 の後藤先生にお話しをお伺いに来ました!

よろしくお願いします!

後藤先生の背景となぜデータサイエンスをやるようになったのか

ロボたん
ロボたん
まず、先生の背景となぜデータサイエンスをやるようになったのか教えてください。
後藤先生
後藤先生
1990年代前半にたまたまニューラルネットワークのちょっとしたブームがあって卒業論文で取り組みました。
そのあと博士課程では早稲田大学に移りニューラルからは一旦離れ、情報理論の研究に従事していました。
その中でベイズ統計の枠組みで理論研究を中心に行っていました。その頃は、データをいじるというより理論を主にやっていましたね。

その後、縁あって東大のビジネス系の研究室に参加し、そこで理論からビジネスの方に入っていった気がします。
東大では、ビジネスモデル学会の運営などにも携わり、企業の経営にかかわる解析を行うようになりました。

その後、武蔵工業大学の環境情報学部に着任し、ここでもデータを実際に使って分析するということを行っていました。
でも、その頃は大規模なデータを機械学習などで解析するようなことではなく、アンケートデータをとって統計的に解析するようなことをやっていました。
そこで、自然言語が面白いなと気付いて、機械学習に戻っていった気がします。

早稲田大学に着任後は主に情報数理をベースとしてテキストデータ等の大規模データの解析に従事しています。

もともと機械学習でずっとやっているわけではなく、いろいろまわって機械学習に戻ってきているんです。

ロボたん
ロボたん
なるほどー、データサイエンス研究所の所長をやりはじめたのはどのような経緯でしょうか?
後藤先生
後藤先生
正直、誰もやらないからやったような感じはありますね笑
なかなか使えない企業のデータを学生の研究に活かせるようにしたかったのが最初です。企業の方々を含め多くの人の協力を経て、実現できました。

AI・データサイエンティストの現状と将来について

ロボたん
ロボたん
ありがとうございます。それでは、続いて次の質問です。

昨今、AIやデータサイエンスという言葉が世の中を席捲していますが、このような分野の現状と今後の将来についてどのようにお考えですか?

後藤先生
後藤先生
データサイエンスのブームがきている理由は3つあると思っています。

一つ目は、昔はデータがなく集めるのが大変だったのにも拘らず、今ではオンラインで大量のデータを抽出することができるようになったからです。

ただ、現在ではデータの量はものすごく多いですが、情報が少なくスカスカで薄いデータばかり。

それらの薄い大量のデータから何か知見を抽出することができるデータサイエンティストが求められています。

二つ目は、コンピューターの処理速度の上昇。これは良く言われますよね。

三つ目は、アルゴリズムの改善です。著しいスピードで新しい革新的なアルゴリズムが開発されています。統計学は分かるけどディープラーニングなどは分からないという人は時代の流れについていけないのではないでしょうか?

確かに現在多くの企業でとりあえずディープラーニングを取り入れようなんて動きがありますが、そのような意味でのブームは落ち着いていくでしょう。ただ、データサイエンス分野の技術はこれからどんどん進歩していくでしょう。

最近興味のある分野

ロボたん
ロボたん
ありがとうございます。それでは、先生が最近興味を持っている分野に関して教えていただけないでしょうか?
後藤先生
後藤先生
少し前であればWord2Vec、現在ならGAN(Generative Adversarial Network)などの新しい手法にはある程度興味を持っていますが、手法やアルゴリズムに興味を持つフェイズは終わった気がします。
いまは、特定の状況でどのように解析するのがよいかに興味を持っています。

たとえば、古着のブランドの価格を予測したいという時にディープラーニングでいいかというとそうとは言えません。なんでもかんでもディープラーニングが良いわけではなくて、データの量・質によって全然違ってきますよね。

どれか特定の分野ではなくて、いかなる状況においてどのように解析できるかが非常に重要。
これがデータサイエンティストに求められる素養だと思っています。

これからデータサイエンスを勉強する学生に一言

ロボたん
ロボたん
ありがとうございます。それでは、最後にこれからデータサイエンスを目指す学生に一言お願いします!
後藤先生
後藤先生
データサイエンスには3つの能力が必要と言われます。

マネジメント・経営

→マネジメントの実務経験は会社に入ってから積まれてゆくものでしょう。ただし、経営システムの全体像について、フレームワークを勉強していることは将来大変役に立つと思います。経営工学系を卒業した学生が社会から評価されている一つの理由ですね。

IT・情報

→必要に応じてやればよいでしょう。研究でもなんでもやらなくちゃいけない環境に追い込まれたらやるし、できるようになると思います。ただし、「情報系やプログラミングは嫌いで、受け付けられない」という人は時代に取り残されてしまいます。ITやプログラミングは手段であって目的ではありません。これらのスキルは、自ら必要性を見出せる目標を見つけるのが先で、その目標に向かってポジティブに取り組むのが良いと思います。

統計

→やはりこの部分が圧倒的に重要です。社会人になってから、基礎をやりたくても時間ないから。

線形代数などの統計の背景にある部分はしっかり詰めておくべきですね。

ロボたん
ロボたん
統計の数理的な背景が大事なのは分かるのですが、どこまでやるべきなのでしょうか?
後藤先生
後藤先生
私のスタンスとしては、とことんやった方が良いと思っています。

気が済むまでやっておくべきですね。損得じゃなくて勉強するべきです。学生のうちしかできないから!一見関係ない分野を勉強すると、実は関係していたってことがよくあります。

とりあえず理論的なところをしっかり詰めていくべきですね

ロボたん
ロボたん
貴重なお話ありがとうございました!

後藤先生のおすすめ書籍:

測度から確率へ

カルマンフィルター

後藤先生の著書:

パターン認識入門

スタビジアカデミーでデータサイエンスをさらに深く学ぼう!

スタアカサービスバナースタビジのコンテンツをさらに深堀りしたコンテンツが動画と一緒に学べるスクールです。

プレミアムプランでは私がマンツーマンで伴走させていただきます!ご受講お待ちしております!

スタビジアカデミーはこちら