こんにちは!
データサイエンティストのウマたん(@statistics1012)です!
多変量解析手法の1つでありアンケート調査の可視化などに使われる「コレスポンデンス分析」
コレスポンデンス分析は、データの可視化に非常に優れた手法であり、マーケティングの場でよく使われます。
この記事では、そんなコレスポンデンス分析についてRでの実装も含めて見ていきましょう!
コレスポンデンス分析とは
まずは、コレスポンデンス分析について見ていきましょう!
コレスポンデンス分析は、商品・サービスの特徴を可視化するのに優れた分析手法であり、マーケティングにおける調査に良く使われます。
多変量解析における数量化3類と考え方はほぼ同じです。
例えば、新たに化粧品の商品開発を行い競合とのイメージを比較したい時に消費者に対して以下のような項目を回答してもらいます。
しっとり | 安心感 | 持ちの良さ | 香りの良さ | |
自社製品 | ||||
競合A | ||||
競合B |
これらの点数を基に自社製品は消費者にとってどのようなイメージを持たれているのかを簡単に可視化することが可能なのです。
これだけであれば表でも比較できるかもしれませんが、項目数や比較したい競合数が増えてくると表だけではどうしても分かりづらくなってきます。
そんな時にコレスポンデンス分析の出番なのです!!
以下イメージ図です。
このように簡単にマッピングして、分かりやすく自社製品の特徴を捉えることができるのです。
ただここで注意しておかないといけないのは、自社製品は香りの良さが近い!という直感的な解釈をしてはいけないということ。
これは方向性の解釈をするのに適しており、距離的な比較はできない点に注意してください。
コレスポンデンス分析をRで実装してみよう!
それでは、早速コレスポンデンス分析をRで実装してみます。
コレスポンデンス分析は、非常に簡単に実装できちゃうんです。
使用するデータは、統計科学研究所の「成績データ」。以下のURLからダウンロードできます。
https://statistics.co.jp/reference/statistical_data/statistical_data.htm
kokugo | shakai | sugaku | rika | ongaku | bijutu | taiiku | gika | eigo |
30 | 43 | 51 | 63 | 60 | 66 | 37 | 44 | 20 |
39 | 21 | 49 | 56 | 70 | 72 | 56 | 63 | 16 |
29 | 30 | 23 | 57 | 69 | 76 | 33 | 54 | 6 |
95 | 87 | 77 | 100 | 77 | 82 | 78 | 96 | 87 |
70 | 71 | 78 | 67 | 72 | 82 | 46 | 63 | 44 |
67 | 53 | 56 | 61 | 61 | 76 | 70 | 66 | 40 |
29 | 26 | 44 | 52 | 37 | 68 | 33 | 43 | 13 |
9科目の点数が166人分入ってます。
166人から30人抽出してコレスポンデンス分析にかけてみます。
コレスポンデンス分析はMASSパッケージのcorrepという関数で行うことが可能です。
コードは以下のように非常に簡単に実装が可能なんです。
最後の行で、結果をプロットしています。
音楽と英語が他の科目と少し離れていることが分かります。
これにより、科目同士の近さが分かりました。
先ほども述べましたが、人と科目の距離を比較して得意・不得意を比較することは厳密にはできない点に注意しましょう!
実装自体非常に簡単なので、色んなデータセットで試してみてください!
コレスポンデンス分析 まとめ
コレスポンデンス分析について見てきました。
市場調査などでよく使われるコレスポンデンス分析は非常に便利な手法なので、是非使ってみてください。
以下の書籍でコレスポンデンス分析と同じ数量化3類に関して詳しくまとめているので良ければ参考にしてみてください!
多変量解析手法については以下の記事でより詳しくまとめていますので見てみてください!
マーケティングでよく使われるデータ分析手法は以下でまとめています!
また、統計学や機械学習やPythonやデータサイエンスについてより深く学びたい方は以下の記事で詳しくまとめています!