こんにちは!
大学院で統計学を専門に研究し、現在消費財メーカーでデジタルマーケとデータサイエンスを担っているウマたん(@statistics1012)です。
そんな時に統計の知識を持っておくと役に立つことが多々あります。
マーケターにとって統計学は大きな武器になります。
是非マーケターのみなさんに統計学の知識を付けて欲しい。
そこで、この記事ではマーケターの方に向けて統計学のエッセンスをまとめていきます。
目次
なぜマーケティングには統計学が必要なのか

マーケティングとは端的に言うと、「顧客を創造し売れる仕組みを作ること」
売れる仕組みを作るためにはロジックとエモーションの2つの観点が重要になります。
ロジックだけで考えてもマーケティングは上手くいきませんが、感情だけに頼っても上手くいかず再現性は生まれないのです。
そしてそのロジックを強固なモノにするのが統計学。
統計学をモノにすることで、
■なんとなく行った施策が果たして統計学的に成功だったのか明確にする
■顧客の購買行動を予測して先手を打つ
■いくつかの要因が盛り込まれた製品から最適の組み合わせを見つける
ことが出来ます。
現在では、これらのことを自動でやってくれるツールや多くの受託会社が存在するため、直接的に統計学を駆使することは少ないかもしれません。
しかし、知識を持っているのといないのでは結果に対する理解度も大きく変わります。
また統計学は数字を上手くごまかすことで騙すことが可能。
本当はさして効果のない結果なのにあたかも大きな結果が出たと見せることも可能なのです。
統計学を学ぶことで、そんな数字にだまされない選球眼を持つこともできます。
マーケティングに用いられる統計的手法

それでは早速マーケティングに用いられる統計学的手法について見ていきましょう!
ここで取り上げる手法群は特に押さえておきたい手法です。
統計的検定
統計学の最も基礎的な検定は様々な場面で使われます。
検定を用いると、なんとなく差がある気がするなーと感覚的に思っていたことが本当に正しいのかどうかが分かります。
ある20代と30代での平均購入金額に有意な差があるのかを測定する時は、t検定と呼ばれる手法を用います。
施策を行った前後の効果やバナーのA/Bテストの効果をを測るにはカイ二乗検定を一般的に用います。
統計学的検定に関してはこちらの記事にまとめていますので良ければご覧ください!

また以下の動画でも分かりやすく解説しています!
回帰分析
回帰分析を用いることで、様々な事象の関連性を見ることができます。
そしてその関連性からある事象の予測をすることができるのです。
よくある例では、アイスクリームの需要予測。
回帰分析を用いれば、気温や天気という要素からアイスクリームの需要を予測することができるのです。
ちなみに一口に回帰分析と言っても様々なモノが存在します。
一つの変数から一つの変数を予測するなら単回帰分析。
複数の変数から一つの変数を予測するなら重回帰分析。
良く用いられるのは重回帰分析ですね。
またこれらの単回帰分析や重回帰分析は、目的変数に正規分布を想定しているのですが、ビジネスシーンでは正規分布に従わない場合が多い。
そんな時に使われるのはロジスティック回帰やポアソン回帰などの一般化線形回帰分析。
さらにここから複雑になっていくのですが、マーケティングにおいては一般化線形回帰まで知っていれば良いかなと思います。
こちらに簡単な回帰分析に関してまとめていますので良ければご覧ください!

判別分析
先ほどの回帰分析では目的変数は量的変数でしたが、この判別分析では目的変数が質的変数になります。
例えば、あるユーザーがそれを購入するかしないかは0・1の質的変数。
購買行動を予測するには判別分析が用いられることが多いです。
しかし、この購買行動を購入する確率はどのくらいかというように%の量的変数で予測するパターンもあります。
その場合は先ほどの一般化線形回帰の1つロジスティック回帰分析を用います。
ロジスティック回帰分析は基本的な手法ですが、マーケティングにおいて良く使われているイメージがありますねー!
ロジスティック回帰分析を実際にRで回してシミュレーションしてみた記事をこちらにまとめていますので良ければ参考にしてみてください!

クラスター分析
クラスター分析はある母集団をグループ分けする手法。
例えば、顧客のセグメントを作る時に年代や性別、行動パターンを基にクラスター分析を行うと、今まで見えてこなかったセグメント集団が浮かび上がってくることがあります。
クラスター分析には大きく分けて、階層的クラスター分析と非階層的クラスター分析があります。
もし最初からクラスターの数が決まっているなら非階層的クラスター分析を使うと良いでしょう。
クラスターの数が決まっていないなら階層的クラスター分析を用いて階層木からクラスターを区切りましょう!
ただ気を付けなければいけないのは、クラスター分析で分けられたクラスターに意味を付与するのは人間の仕事。クラスターに分けられただけでそこに意味を見出すのはマーケターの腕の見せ所です。
クラスター分析に関してはこちらにまとめていますので良ければご覧ください!

非階層的クラスター分析の代表であるk-means法に関しては以下の記事を見てみてください!

主成分分析
主成分分析はクラスター分析と近い考え方なのでごっちゃにされがちですが、厳密には違います。
簡単に言うと、
クラスター分析はサンプルをグループ分けする手法
主成分分析は変数をグループ分けする手法
クラスター分析では、多くのユーザーを特徴別にグルーピングしました。
主成分分析では変数の数が多すぎて意味のある変数を抽出できない時に合成変数を作り出して解釈容易性を上げます。

例えば、顧客一人一人の購買商品はたくさんありますのでそれを全て変数として顧客分析するのは非現実的。
そんな時に購買商品に主成分分析をかけることで、嗜好品と日用品などの合成変数が出来上がり、2つの軸で分析することが可能です。
これは一例ですが、主成分分析を用いることで新たな特徴値が浮かび上がってくるかもしれません。
主成分分析に関しては以下の記事にまとめています!

コレスポンデンス分析
コレスポンデンス分析は、マーケティングの中でもブランドイメージ調査やコンセプト調査に用いられる手法です。
競合と比較して自社はどのようなポジショニングに位置しているのかを可視化することができます。

コレスポンデンス分析については以下の記事をご覧ください!

コンジョイント分析
コンジョイント分析は、商品のコンセプト設計を行う時に有用な手法です。
特に情緒に訴えかける商品ではなく、機能面の差が分かりやすい商品には有用。
例えばPCであれば、PCの大きさ・軽さ・CPU・解像度など様々な要因を基にユーザーの効用値を測る調査を行い、最適な組み合わせと最適な価格を決定します。
コンジョイント分析に関しては以下の記事で詳しくまとめています!

ランダムフォレスト
いわゆる最近流行りの機械学習手法の1つ。
決定木と呼ばれる基本的な回帰手法にアンサンブル学習のバギングを組み合わせた手法です。

ランダムフォレストは比較的実装が可能で、精度が良いのでよく用いられます。
回帰分析や判別分析などの手法は、解釈が容易で何が原因なのかが分かりやすいです。
一方機械学習の各手法は、精度は高い一方解釈が容易でない場合が多いです。
ランダムフォレストでは、どの変数が効いているかを知ることができますが、その変数をどの程度チューニングしたらどの程度効果があるか測るのは大変。
そのため、要員は分からなくていいから精度をとことん追求する!という場合はランダムフォレストをはじめとする機械学習手法を用いるとよいでしょう。
精度よりもそれが起きた要因を知りたい!という場合には一般的な回帰分析を用いるとよいでしょう。
ビジネスシーンでは解釈容易性の高い回帰分析が用いられることが多いです。
ランダムフォレストに関してはこちらにまとめていますので良ければご覧ください!

さらに高度な機械学習手法
高い精度を出力する機械学習手法としてランダムフォレストを例に挙げましたが、他にもたくさんの強い機械学習手法があります。
いくつか精度の期待できる手法を以下に紹介しておきます。
ここで詳しくは紹介しませんが、全てPythonやRで実装しているのでぜひチェックしてみてください!
機械学習手法全般に関しては以下の記事でまとめていますよー!

マーケターにとっての統計学勉強法

さて、たくさんの統計的手法群を紹介してきましたが全てを完全に網羅するのは大変です。
ここでは、マーケターがどのように統計学を勉強していけばよいかまとめていきますよー!
Step1:全体的な統計の知識を学習
Step2:統計学の理論を学習
Step3:統計的手法を実装
全体的な統計の知識を身に付ける
全体的な統計の知識をまずは学習していきましょう。
この時、なるべくいきなりコテコテの理論から入るのではなくビジネス視点からどのようなことができるのか理解しながら学習していくのがオススメ!
そんなことを学べる教材が・・・あるんです!
Udemyという世界最大の教育プラットフォームで人気を博しているデータサイエンス講座!
【世界で21万人が受講】データサイエンティストを目指すあなたへ〜データサイエンス25時間ブートキャンプ〜

データサイエンスの分野を幅広くおさえている講座で、全世界で好評なコース。
ユニークなアニメーションと一緒にビジネスサイドからデータサイエンスを学べるのでオススメです!
内容は簡単で、ある程度分かってる人には冗長な部分も多いのですが、まずは基本からしっかり理解したいという人には圧倒的にオススメなんです!
最後には実データを使って実際の前処理→ロジスティック回帰による分析→タブローで可視化という流れを行っていくので実践に即した内容になっています。
26時間という長丁場なので、自分の気になるところだけつまみ食い的に勉強すると良いでしょう!
Udemyは世界最大のオンライン教育学習プラットフォームで自分の学びたい内容を分かりやすく学べるのでめちゃくちゃオススメです!
以下でUdemyについてまとめているので是非チェックしてみてくださいね!

統計学の理論を身に付ける
Udemyの講座で、全体的なイメージを掴んだら具体的な統計理論に入っていきましょう!
統計学を学習する上で非常に重要な微分・線形代数を理解する上で非常に重要な以下の2つの講座を受講しましょう!
【キカガク流】人工知能・機械学習 脱ブラックボックス講座ー初級編ー

【オススメ度】 | |
---|---|
【講師】 | 株式会社キカガク代表取締役 |
【時間】 | 4.5時間 |
【レベル】 | 初級 |
教育サービスを提供するキカガクの代表取締役の方が丁寧に機械学習のアルゴリズムについて教えてくれます。
まあ機械学習と言ってもそんなに高度な内容ではなく、その基本となる単回帰分析を数式から学んでいくもの。
ビックリしたんですが、パワポではなく紙に手書きで進んでいくんです!
最初は抵抗があったものの、なるほど意外と分かりやすい。
よくよく考えたら学生時代の教育は先生が手書きで黒板に書いて進めてましたもんね。
Pythonでコーディングしていく部分は少なめですが、回帰分析の裏側のロジックを学ぶには絶好のコースです。
もしブラックボックスでロジックの中身をあまり理解していなければぜひ受講してほしいコースです。
数学のレベルは高校2年生の数ⅡBレベルが何となくわかれば大丈夫です。
【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 中級編 –

【オススメ度】 | |
---|---|
【講師】 | 株式会社キカガク代表取締役 |
【時間】 | 4.5時間 |
【レベル】 | 初級~中級 |
初級編と合わせて受講すると理解が深まりやすいですが、中級編だけでも十分だと思います。
初級編は単回帰分析について微分を使って紐解いていきますが、本コースでは線形代数を学びながら重回帰分析まで展開していきます。
線形代数は機械学習を学ぶ上で非常に重要なんです!
実際に数式的に重回帰分析を行い、その後にsklearnを使って分析を行っていきます。
Pythonだとライブラリを使えば中身を理解しなくても実装できちゃうので結構実務で危ないんですよねー。
やはりある程度は中身を理解していることが大事です。
このコースを受講しておけば、書籍で突然出てくる行列やベクトルに対しても吐き気をもよおさず読み進めることができるでしょう!
統計学・機械学習について概念的になんとなーくわかっているけど、手法のロジックについてはさっぱりという方にぜひ受講して欲しいコースです!
Udemy講座を受けた後はだいぶ統計学で出てくる数式への抵抗がなくなっているはず!
ここから記述統計学・推計統計学・多変量解析の理論まで入っていきましょう!
以下の書籍をオススメしています。
数式が頭に入っているようになっているので大丈夫。
いきなりこの書籍に挑戦すると訳わからなくて挫折する可能性高いの注意!
統計的手法を実装
続いて統計的手法を実装していきましょう!
今まで紹介してきたUdemy講座でもPythonを用いた実装は行っていたのである程度参考にしながら実装を進めて欲しいのですが、ここまで来たらデータ加工から簡単な回帰手法の実装まで学べる以下の講座がオススメ!
【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門

【オススメ度】 | |
---|---|
【講師】 | オプトのデータサイエンティスト |
【時間】 | 8.5時間 |
【レベル】 | 初級~中級 |
データサイエンスにおける非常に重要な要素を基礎から学べます。
簡単な単回帰分析から機械学習(決定木)を使って回帰と分類問題を解いていくコース。
課題定義や分析において気を付けるべきところについても学べるので実務においても役立つ内容です。
データ分析においては基礎分析が大事なんですよねー!
DescribeやShapeなど基本的なPythonの関数を使ってデータの統計量をながめ→分布にしてみたり、外れ値・欠損値に注意したり、と地味だけど重要なエッセンスがつまっていますよー!
実際に手を動かしながらSignateのコンペにコードを提出します。
8.5時間なのでサクッと学べるけどだいぶ濃い内容でした。
データ解析コンペではKaggleが有名ですが、Signateという国産コンペもあるんですねー!
より詳しくPythonについて学びたいのであれば以下の記事でまとめていますのでチェックしてみてください!

また、以下の記事で統計学の勉強法について詳しくまとめていますよー!

マーケティングにおいての統計学 まとめ
ここまで様々な統計学的手法を見てきました。
統計学の知識は必ずマーケターとしての武器になります。
マーケティングのオススメ本と統計学のオススメ本をこちらの記事にまとめていますので良ければご覧ください!


さらに統計学の学習を終えて、機械学習やディープラーニングの勉強・そしてデータサイエンティストを目指すという人はぜひ以下の記事をチェックしてみてください!


