こんにちは!
大学院で統計学を専門に研究し、マーケティング領域のデータサイエンティストをやっているウマたん(@statistics1012)です。
そんな時に統計学の知識を持っておくと役に立つことが多々あります。
マーケターにとって統計学は大きな武器になります。
是非マーケターのみなさんに統計学の知識を付けて欲しい。
そこで、この記事ではマーケターの方に向けて統計学のエッセンスをまとめていきます。
ちなみに手っ取り早く統計学・データサイエンスのスキルを身につけたいマーケターの方には当メディアが運営する「スタアカ」がオススメです!
業界最安級AIデータサイエンス特化スクール「スタアカ」
マーケティングと統計学をつなぐプロフェッショナルになっていただきます!
目次
なぜマーケティングには統計学が必要なのか
マーケティングとは端的に言うと、「顧客を創造し売れる仕組みを作ること」
売れる仕組みを作るためにはロジックとエモーションの2つの観点が重要になります。
ロジックだけで考えてもマーケティングは上手くいきませんが、感情だけに頼っても上手くいかず再現性は生まれないのです。
そしてそのロジックを強固なモノにするのが統計学。
統計学をモノにすることで、
■なんとなく行った施策が果たして統計学的に成功だったのか明確にする
■顧客の購買行動を予測して先手を打つ
■いくつかの要因が盛り込まれた製品から最適の組み合わせを見つける
ことが出来ます。
現在では、これらのことを自動でやってくれるツールや多くの受託会社が存在するため、直接的に統計学を駆使することは少ないかもしれません。
しかし、知識を持っているのといないのでは結果に対する理解度も大きく変わります。
また統計学は数字を上手くごまかすことで騙すことが可能。
本当はさして効果のない結果なのにあたかも大きな結果が出たと見せることも可能なのです。
統計学を学ぶことで、そんな数字にだまされない選球眼を持つこともできます。
マーケティングに用いられる統計的手法
それでは早速マーケティングに用いられる統計学的手法について見ていきましょう!
ここで取り上げる手法群は特に押さえておきたい手法です。
統計的検定
統計学の最も基礎的な検定は様々な場面で使われます。
検定を用いると、なんとなく差がある気がするなーと感覚的に思っていたことが本当に正しいのかどうかが分かります。
ある20代と30代での平均購入金額に有意な差があるのかを測定する時は、t検定と呼ばれる手法を用います。
施策を行った前後の効果やバナーのA/Bテストの効果をを測るにはカイ二乗検定を一般的に用います。
統計的検定に関してはこちらの記事にまとめていますので良ければご覧ください!
また以下の動画でも分かりやすく解説しています!
回帰分析
回帰分析を用いることで、様々な事象の関連性を見ることができます。
そしてその関連性からある事象の予測をすることができるのです。
よくある例では、アイスクリームの需要予測。
回帰分析を用いれば、気温や天気という要素からアイスクリームの需要を予測することができるのです。
ちなみに一口に回帰分析と言っても様々なモノが存在します。
一つの変数から一つの変数を予測するなら単回帰分析。
複数の変数から一つの変数を予測するなら重回帰分析。
良く用いられるのは重回帰分析ですね。
またこれらの単回帰分析や重回帰分析は、目的変数に正規分布を想定しているのですが、ビジネスシーンでは正規分布に従わない場合が多い。
そんな時に使われるのはロジスティック回帰やポアソン回帰などの一般化線形回帰分析。
さらにここから複雑になっていくのですが、マーケティングにおいては一般化線形回帰まで知っていれば良いかなと思います。
こちらに簡単な回帰分析に関してまとめていますので良ければご覧ください!
判別分析
先ほどの回帰分析では目的変数は量的変数でしたが、この判別分析では目的変数が質的変数になります。
例えば、あるユーザーがそれを購入するかしないかは0・1の質的変数。
購買行動を予測するには判別分析が用いられることが多いです。
しかし、この購買行動を購入する確率はどのくらいかというように%の量的変数で予測するパターンもあります。
その場合は先ほどの一般化線形回帰の1つロジスティック回帰分析を用います。
ロジスティック回帰分析は基本的な手法ですが、マーケティングにおいて良く使われているイメージがありますねー!
ロジスティック回帰分析を実際にRで回してシミュレーションしてみた記事をこちらにまとめていますので良ければ参考にしてみてください!
クラスター分析
クラスター分析はある母集団をグループ分けする手法。
例えば、顧客のセグメントを作る時に年代や性別、行動パターンを基にクラスター分析を行うと、今まで見えてこなかったセグメント集団が浮かび上がってくることがあります。
クラスター分析には大きく分けて、階層的クラスター分析と非階層的クラスター分析があります。
もし最初からクラスターの数が決まっているなら非階層的クラスター分析を使うと良いでしょう。
クラスターの数が決まっていないなら階層的クラスター分析を用いて階層木からクラスターを区切りましょう!
ただ気を付けなければいけないのは、クラスター分析で分けられたクラスターに意味を付与するのは人間の仕事。クラスターに分けられただけでそこに意味を見出すのはマーケターの腕の見せ所です。
クラスター分析に関してはこちらにまとめていますので良ければご覧ください!
非階層的クラスター分析の代表であるk-means法に関しては以下の記事を見てみてください!
主成分分析
主成分分析はクラスター分析と近い考え方なのでごっちゃにされがちですが、厳密には違います。
簡単に言うと、
クラスター分析はサンプルをグループ分けする手法
主成分分析は変数をグループ分けする手法
クラスター分析では、多くのユーザーを特徴別にグルーピングしました。
主成分分析では変数の数が多すぎて意味のある変数を抽出できない時に合成変数を作り出して解釈容易性を上げます。
例えば、顧客一人一人の購買商品はたくさんありますのでそれを全て変数として顧客分析するのは非現実的。
そんな時に購買商品に主成分分析をかけることで、嗜好品と日用品などの合成変数が出来上がり、2つの軸で分析することが可能です。
これは一例ですが、主成分分析を用いることで新たな特徴値が浮かび上がってくるかもしれません。
主成分分析に関しては以下の記事にまとめています!
コレスポンデンス分析
コレスポンデンス分析は、マーケティングの中でもブランドイメージ調査やコンセプト調査に用いられる手法です。
競合と比較して自社はどのようなポジショニングに位置しているのかを可視化することができます。
コレスポンデンス分析については以下の記事をご覧ください!
コンジョイント分析
コンジョイント分析は、商品のコンセプト設計を行う時に有用な手法です。
特に情緒に訴えかける商品ではなく、機能面の差が分かりやすい商品には有用。
例えばPCであれば、PCの大きさ・軽さ・CPU・解像度など様々な要因を基にユーザーの効用値を測る調査を行い、最適な組み合わせと最適な価格を決定します。
コンジョイント分析に関しては以下の記事で詳しくまとめています!
ランダムフォレスト
いわゆる最近流行りの機械学習手法の1つ。
決定木と呼ばれる基本的な回帰手法にアンサンブル学習のバギングを組み合わせた手法です。
ランダムフォレストは比較的実装が可能で、精度が良いのでよく用いられます。
回帰分析や判別分析などの手法は、解釈が容易で何が原因なのかが分かりやすいです。
一方機械学習の各手法は、精度は高い一方解釈が容易でない場合が多いです。
ランダムフォレストでは、どの変数が効いているかを知ることができますが、その変数をどの程度チューニングしたらどの程度効果があるか測るのは大変。
そのため、要員は分からなくていいから精度をとことん追求する!という場合はランダムフォレストをはじめとする機械学習手法を用いるとよいでしょう。
精度よりもそれが起きた要因を知りたい!という場合には一般的な回帰分析を用いるとよいでしょう。
ビジネスシーンでは解釈容易性の高い回帰分析が用いられることが多いです。
ランダムフォレストに関してはこちらにまとめていますので良ければご覧ください!
さらに高度な機械学習手法
高い精度を出力する機械学習手法としてランダムフォレストを例に挙げましたが、他にもたくさんの強い機械学習手法があります。
いくつか精度の期待できる手法を以下に紹介しておきます。
ここで詳しくは紹介しませんが、全てPythonやRで実装しているのでぜひチェックしてみてください!
機械学習手法全般に関しては以下の記事でまとめていますよー!
また事象の関係性を解明する統計的因果推論という分野もある程度分かっているとマーケティング打ち手を考えたり効果の検証をする際に便利です。
少なくとも相関と因果は違うということはマーケターなら理解しておきましょう!
マーケターにとっての統計学勉強法
さて、たくさんの統計的手法群を紹介してきましたが全てを完全に網羅するのは大変です。
ここでは、マーケターがどのように統計学を勉強していけばよいかまとめていきますよー!
Step1:全体的な統計の知識を学習
Step2:統計学の理論を学習
Step3:統計的手法を実装
全体的な統計の知識を身に付ける
全体的な統計の知識をまずは学習していきましょう。
この時、なるべくいきなりコテコテの理論から入るのではなくビジネス視点からどのようなことができるのか理解しながら学習していくのがオススメ!
ということでまずはこちらのYoutube動画をご覧ください!
統計学ってどう使うの!?という人もこの動画を観ればイメージが湧くと思います!
続いて統計学を扱うデータサイエンティストと呼ばれる職業のイメージを持ってもらうために以下の書籍を読んでみてください!
「俺たちひよっこデータサイエンティストが世界を変える」という書籍で、僕が執筆したものです。
あまり具体的なデータサイエンティストの仕事について分かりやすく書いている本が見当たらなかったので自分で執筆しました!
勾配ブースティング木のXGBoostを使ったビジネスシーンでの実装についてストーリー形式で簡単にまとめていますのでイメージをふくらませてもらうのにちょうど良いかと思います!
価格は300円ちょっとですし、Kindle unlimitedであれば無料で読めるのでぜひチェックしてみてくださいね!
これでザックリ統計学の理解をした後は以下のUdemyの講座をご覧ください!
【初学者向け】統計学の基礎をアニメーションを通じてビジネス観点で理解していこう!
【オススメ度】 | |
---|---|
【講師】 | 僕自身!今なら購入時に「VGRBCQDF」という講師クーポンコードを入れると94%OFFになりますのでぜひご受講ください! |
【時間】 | 3時間 |
【レベル】 | 初級 |
手前味噌ですが、僕自身がUdemyにて統計学を網羅的に学べる講座を作っています。
そんな方に向けてアニメーションで統計学を簡単に理解してもらう講座を作りました!
ビジネス観点で必要な統計学の知識だけを抽出してまとめています。
アニメーションで学ぶ概要編とPythonで実際に手を動かしながら学んでいく実践編に分かれています。
まず、統計学の全体像とビジネスに必要な知識を学んでいきます。
そして多変量解析の領域に入りよく使われる手法を中心に学んでいきます。
ビジネスに活かせる統計学について網羅的にしっかり学ぶことが可能ですので是非受講してみてください!
こちらでは統計学に必要なエッセンスを抽出して分かりやすくまとめています!
統計学の理論を身に付ける
Udemyの講座で、全体的なイメージを掴んだら具体的な統計理論に入っていきましょう!
ここから記述統計学・推計統計学・多変量解析の理論まで入っていきましょう!
以下の書籍をオススメしています。
いきなりこの書籍に挑戦すると訳わからなくて挫折する可能性高いの注意!
ここのフェーズはサラッと流してしまっても大丈夫です!
理論がしっかり深く分かっていなくてもどんな時に何を使えばよいか、注意するべきポイントは何かなどが分かっていれば問題ないです!
統計的手法を実装
続いて統計的手法を実装していきましょう!
今まで紹介してきたUdemy講座でもPythonを用いた実装は行っていたのである程度参考にしながら実装を進めて欲しいのですが、ここまで来たらデータ加工から簡単な回帰手法の実装まで学べる以下の講座がオススメ!
【初学者向け】データ分析コンペで楽しみながら学べるPython×データ分析講座
【オススメ度】 | |
---|---|
【講師】 | 僕自身!今なら購入時に「VGRBCQDF」という講師クーポンコードを入れると94%OFFになりますのでぜひご受講ください! |
【時間】 | 4時間 |
【レベル】 | 初級~中級 |
先ほどはPythonのコースでしたが、こちらはデータ分析機械学習関連のUdemyコースになります!
僕自身がUdemyの色んなコースを受けてみた中で、他のコースにはないこんなコースあったらいいなみたいなコースを作ってみました。
このコースは、なかなか勉強する時間がないという方に向けてコンパクトに分かりやすく必要最低限の時間で重要なエッセンスを学び取れるように作成しています。
アニメーションを使った概要編とハンズオン形式で進む実践編に分かれており、概要編では体系的にデータ分析・機械学習導入の文脈でまとめています。
データサイエンスの基礎について基本のキから学びつつ、なるべく堅苦しい説明は抜きにしてイメージを掴んでいきます。
統計学・機械学習の基本的な内容を学び各手法の詳細についてもなるべく概念的に分かりやすく理解できるように学んでいきます。
そしてデータ分析の流れについては実務に即したCRISP-DMというフレームワークに沿って体系的に学んでいきます!
データ分析というと機械学習でモデル構築する部分にスポットがあたりがちですが、それ以外の工程についてもしっかりおさえておきましょう!
続いて実践編ではデータコンペの中古マンションのデータを題材にして、実際に手を動かしながら機械学習手法を実装していきます。
ここでは、探索的にデータを見ていきながらデータを加工し、その上でLight gbm という機械学習手法を使ってモデル構築までおこなっていきます。
是非興味のある方は受講してみてください!
ちょっと高度な機械学習手法まで踏み込んでいきますが、統計学から機械学習まではしっかり繋がっているのでここでしっかりおさえておいて欲しいです!
より詳しくPythonについて学びたいのであれば以下の記事でまとめていますのでチェックしてみてください!
また、以下の記事で統計学の勉強法について詳しくまとめていますよー!
ちなみに以下の3つのステップを順を網羅的に学べる「スタアカ」というスクールを当メディアが運営しております。
Step1:全体的な統計の知識を学習
Step2:統計学の理論を学習
Step3:統計的手法を実装
マーケティング視点で必要なデータサイエンスのエッセンスだけを盛り込んで分かりやすく学べるスクールなので是非興味のある方はチェックしてみてください!
公式サイト:https://toukei-lab.com/achademy/
【価格】 | ライトプラン:1280円/月 プレミアムプラン:149,800円 |
---|---|
【オススメ度】 | |
【サポート体制】 | |
【受講形式】 | オンライン形式 |
【Pythonの学習範囲】 | データサイエンスを網羅的に学ぶ 実践的なビジネスフレームワークを学ぶ 実際に実データを使った様々なワークを行う |
24時間以内の質問対応と現役データサイエンティストによる複数回のメンタリングを実施します!
カリキュラム自体は、他のスクールと比較して圧倒的に良い自信があるのでぜひ受講してみてください!
ウォルマートのデータを使って商品の予測分析をしたり、実務で使うことの多いGoogleプロダクトのBigQueryを使って投球分析をしたり、データサイエンティストに必要なビジネス・マーケティングの基礎を学んでマーケティングプランを作ってもらったりする盛りだくさんの内容になってます!
・BigQuery上でSQL、Google Colab上でPythonを使い野球の投球分析
・世界最大手小売企業のウォルマートの実データを用いた需要予測
・ビジネス・マーケティングの基礎を学んで実際の企業を題材にしたマーケティングプランの策定
マーケティングにおいての統計学 まとめ
ここまで様々な統計学的手法を見てきました。
統計学の知識は必ずマーケターとしての武器になります。
マーケティングのオススメ本と統計学のオススメ本をこちらの記事にまとめていますので良ければご覧ください!
さらに統計学の学習を終えて、機械学習やディープラーニングの勉強・そしてデータサイエンティストを目指すという人はぜひ以下の記事をチェックしてみてください!