こんにちは!
消費財メーカーでデータ分析・デジタルマーケティングをやっているウマたん(@statistics1012)です!
データ分析においてどうしてもモデル構築の部分が注目されがちなのですが、本当に価値のあるデータ分析をするためにはビジネスを理解し、インパクトのある課題を特定していかなくてはいけません。
この記事ではそんなデータ分析におけるビジネス理解の重要性についてまとめていきたいと思います!
以下の動画でも詳しくまとめていますのであわせてチェックしてみてください!
目次
データ分析のステップにおいてビジネス理解がどのような役割を果たすか
データ分析のステップにはCRISP-DMと呼ばれる有名なフレームワークがあります。
(出典:Wikipedia-‘Cross-industry standard process for data mining’)
CRISP-DMとは、「Cross-industry standard process for data mining」の略であり、データマイニング・データサイエンス・AI開発などにおいて業界横断で標準的に使えるデータ分析プロセスになります。
このCRISP-DMには全部で6つのプロセスがあります。
Business Understanding(ビジネス理解)
Data Understanding(データ理解)
Data Preparation(データ準備)
Modeling(モデル構築)
Evaluation(評価)
Deployment(実装)
この中でBusiness understanding(ビジネス理解)は最初のステップになります。
どんなに技術力があっても、ビジネスをしっかり理解していないと意味のある結果を生み出すことはできません。
昨今では、ビジネスドメインの知識が重要になってきていて、価値のあるデータ分析を行うためにはその業界や会社の理解、そして業務フローの理解が必要です。
また、実際に業務を行っている人の課題ヒアリングが欠かせません。
そこから新たに課題が見えてくるかもしれません。
CRISP-DMに関しては以下の動画や記事でも詳しく解説しているのでもう少し知りたいという方は是非見てみてください!
データ分析におけるビジネス理解の例
それでは、ビジネス理解にはどんな例があるのか見ていきましょう!
たとえば、あるサービスにおいて会員数の伸びが鈍化してきている原因を突き止めそこにテコ入れをしていくプロジェクトがあったとしましょう。
目的はなんとなく分かりましたが、もちろんこれだけでは機械学習を使ってモデル構築するステップに移れません。
モデルを構築するためには課題を特定して目的をよりシャープにしていかないといけないのです。
まずは、どこに原因があるのか突き止めるためにデータの基礎分析や可視化を行っていきます。
この工程はCRISP-DMのData understandingの工程であり、探索的データ分析EDAと呼ばれ、ビジネス理解と一緒に相互的に行っていきます。
会員数の増加を新規会員の獲得と既存会員の解約にブレイクダウンした時に、既存会員の解約数が増えていることが分かりました。
さらに既存会員の解約が増えた原因を突き止めていくと、どうやら競合が大きなプロモーションと販促をしかけてきたことが原因であることが分かりました。
さて、そのような状況で既存会員の解約を防ぐにはどうすればよいでしょうか?
既存会員に対して金銭的なインセンティブを提供するのはどうでしょう?
ただ全会員に対して金銭的なインセンティブを提供してしまうのは収益構造が悪化するのでしたくありません。
できれば解約しそうな既存会員だけにインセンティブを提供したいです。
ここで既存会員の解約を予測する必要が出てきました。
だいぶ目的がシャープになってきましたね。
最初は、
「会員数の鈍化を防ぐ」
というざっくりとしたテーマだったのが、
「既存会員が解約というアクションをとる確率を予測する」
というシャープな目的になりました。
ここまで来るとモデル構築ができそうです。
既存会員の属性データや行動データからその既存会員が解約してしまうかしてしまわないかを確率で算出することができそうです。
ただモデル構築する上では業務用件も加味した上で、もう少しだけ詳細に落としていく必要があります。
この既存会員の予測は日別に行うべきでしょうか?週別に行うべきでしょうか?
この場合は日別でも問題なさそうですが、例えばある商品の需要を予測する上で日別で翌日のデータを予測しても結局生産調整に1ヶ月かかってしまうなら意味がありません。
その場合は、1ヶ月前に翌月全体の需要データが予測できるのが重要になってきますね。
このようにビジネス理解をせず、適当に設定した課題に対するモデルは、現実の業務に当てはまらず無用の長物になってしまう可能性があるので注意しましょう。
ビジネス理解の工程に唯一無二の正解はありませんが、現場へのヒアリングや探索的にデータを見ていって、課題を特定し、最終的な出口設計も考えた上でモデル構築に移れるようにしましょう!
ここの工程をないがしろにしてしまうと大変なことになります。
データ分析におけるビジネス理解をする上で読んでほしい本
ここまででデータ分析においてビジネス理解について簡単にまとめてきましたが、最後にここの領域を学ぶ上でオススメな本を紹介していきたいと思います。
正直、ここの領域は実践あるのみなのですが非常に参考になる書籍もあります。
会社を変える分析の力
著者は大阪ガスにて10年以上データ分析業務に従事してこられた河本さん。
事業会社のインハウスデータ分析屋さんとしての経験をもとにデータ分析を使ってどのように既存ビジネスに変革を起こしていくかということが語られています。
このように社内を駆け回ってデータ分析から価値を生み続けている方のお話は説得力があります。
専門的なデータの話はされていませんが、データ分析をビジネスに活かすために必要なことについて徹底的に語られている非常にオススメな書籍です。
仕事ではじめる機械学習
機械学習を学んで実際にビジネスシーンではなかなか上手くいかないことが多いです。
そんな時にオススメなのがこの「仕事ではじめる機械学習」!
この本は、ビジネス観点から機械学習について教えてくれる良書です。
個人的には機械学習の書籍なのに、
「機械学習を使わないで解決できる方法を考えよう!」
と書いてある点が非常に好感を持てます。
そう、機械学習はあくまで手段であり目的ではないんです。
機械学習を導入することが目的になってしまうプロジェクトは失敗しやすいです。
・何のために機械学習を導入するのか
・機械学習を導入しないで解決できる方法はないのか
について考えておきましょう!
俺たちひよっこデータサイエンティストが世界を変える
手前味噌ですが、僕自身が書いているこちらの書籍も紹介させてください。
「俺たちひよっこデータサイエンティストが世界を変える」という書籍を出版しています。
あまり具体的なデータサイエンティストの仕事について分かりやすく書いている本が見当たらなかったので自分で執筆しました!
勾配ブースティング木のXGBoostを使ったビジネスシーンでの実装についてストーリー形式で簡単にまとめていますのでイメージをふくらませてもらうのにちょうど良いかと思います!
価格は300円ちょっとですし、Kindle unlimitedであれば無料で読めるのでぜひチェックしてみてくださいね!
データ分析におけるビジネス理解で重要なこと まとめ
本記事では、データ分析において
・なぜビジネス理解が必要なのか
・どのような例があるのか
・どうやってビジネス理解を勉強すればよいのか
について解説してきました。
ぜひビジネス理解を深めることでデータ分析のインパクトを最大限まで高めていきましょう!
ビジネスやマーケティングの勉強法は以下の記事で詳しくまとめていますのでデータサイエンス力とあわせて力を付けていきましょう!
また、以下の記事でデータ分析の手法や勉強法、機械学習、Python、データ分析の資格、について詳しく解説していますので是非チェックしてみてください!