統計学はビジネスにも学問にも非常に役立ちます。
とは言え、統計学は小難しいイメージがどうしても付きまとうモノ。
そんな声にお応えして、この記事では「統計学入門に必要なノウハウと独学の勉強方法」をまとめていきたいと思います。
気になるところへ読み飛ばす
統計学とは?

まず、統計学入門者に知って欲しいのは「統計学とは何なのか」
統計学という漠然とした概念に対してある程度明確な答えを持っておきましょう。
統計学には大きく分けて2つの側面があります。
■現状起こっているコトを可視化する
■未知なる事象を予測する
例えば、数学の点数の平均点を算出するのは前者。
ある人の各教科の点数から合格可能性を算出するのは後者。
学ぶ順番としては、まずは前者の現状の可視化に関する知識を身に付けること。その後に未知なる事象の予測を学んでいく。
予測の側面に関しては機械学習の文脈から語られることが多いですが、結局は統計学も機械学習もデータから価値を生むという意味では一緒なんです。
AI・ビッグデータの時代に入り前者が疎かにされがちなのですが、そんな時代だからこそしっかり理解しておく必要があるのです。
統計学入門者の勉強ロードマップ

ここでは、統計学を学ぶモデルケースをお伝えしますが、これはあくまでも一例であり必ずこのように勉強しなくてはいけないわけではありません。
自分に合う勉強方法があるはずなので、参考にしつつ自分なりの勉強スタイルを歩んでください。
統計学を学べるサイト・スクールはいくつかありますので利用してみることをオススメします!

まずは、統計を扱う職業についてイメージが湧いた方が学習のモチベーションも上がると思うのでぜひ以下の書籍に目を通してみてください!
手前味噌で恐縮なのですが、僕自身が「俺たちひよっこデータサイエンティストが世界を変える」という書籍を出版しています。
具体的なデータサイエンティストの仕事について分かりやすく書いている本がなかったので自分で執筆しました!
ストーリー形式で分かりやすく書いていますので、ぜひ最初に目を通していただけるとイメージが湧くと思います。
価格は300円ちょっとですし、Kindle unlimitedであれば無料で読めるのでぜひチェックしてみてくださいね!
この本でイメージを膨らせた後は、具体的な理論の勉強に入っていきましょう!
ただ、理論だけ学んでうーん・・と唸ってしまわないようになるべく早い段階から手を動かしましょう。
統計解析に使うプログラミング言語に関しては以下の記事で詳しくまとめていますが、個人的にはPythonが圧倒的におすすめなので合わせてチェックしてみてください。

さて、統計学を学ぶステップは以下の4つ
このステップについて動画でも分かりやすく解説していますよー!
基本的な用語や考え方を抑える
まず、統計学に登場する平均・分散・標準偏差などの統計的数値について学びましょう!
そして、それを推定する時に必要な母集団・標本集団の考え方、そして確率分布について学んでいきましょう!
確率分布は奥が深く数式も煩雑になるのでこの時点では正規分布くらい抑えておけば問題ないです。
基本的には、それぞれの統計値がどのような意味を持っていてどんな特徴があるのかを理解しましょう。
例えば、世の中の事象は正規分布で表現できることばかりではなく、サラリーマンの年収の平均値と中央値には大きな乖離があることが理解できるでしょう。
統計学入門をうたった本はたくさんありますが、キャッチーに理解するなら、こちらの「完全独習 統計学入門」がオススメ!
他にもこちらに基本的な統計学を学べるオススメの本(※ベイズ統計学に対して従来型の統計学を伝統的な統計学と呼んでいます)をまとめているので興味のある方はご覧ください!

書籍だと続くか心配だなーという方はUdemyで学ぶことも非常におすすめ!
Udemyはたくさんある教材から自分のレベルにあったものを買い切りで購入できるプラットフォームで動画メインなので分かりやすいです。


教材の客観的評価もしっかり付いているので買い物に失敗することはないです。
返金もできるので安心して自分に合ったコースを選べます。
検定の考え方を学ぶ

統計学に関連する基本用語を抑えたら、今度は検定の考え方を学びましょう。
検定は、ビジネスでも汎用性が高く、統計学の基本となる内容です。
例えば、広告のLPを作成してそれらの効果を測るA/Bテストを行いました。AのLPでは、CVRが50%だったのに対してBのLPでは4%でした。
見かけ上、AのLPの方が圧倒的に良さそうな気がしますが、Aは2人中1人、Bは1000人中40人だったならどうでしょう?
本当に効果があるか疑問に思うと思います。
これらの結果を論理的に評価できるのが検定という考え方なのです。
ちなみにABテストには統計的検定の中でもカイ二乗検定を用います。
検定に関してはこちらの記事にまとめているので詳しくはご覧ください。

また以下の動画でも分かりやすく解説しています!
相関について学ぶ
今までは基本的に1つの変数に関してのお話でしたが、ここからは2つの変数のお話に突入していきます。
例えば、ある商品Aと商品Bの売上にはどれほど相関関係があるか分かれば、商品Aを購入した人には商品Bをリコメンドすればよいのでは?という仮説が立ちます。
ただ、相関関係は因果関係を示しているわけではないので注意が必要です。

因果関係に関しては非常に奥が深く、統計的因果推論という一大テーマとして成り立っています。

ちなみに相関には見せかけの相関があるので注意しましょう!
耳が大きい人ほど足が速いという相関関係は、裏に年齢という軸が隠れていて大人になるにつれて耳が大きくなり大人になるにつれて足が速くなる。
だから一見関係なさそうなところに相関関係が生まれてしまうのです。
これが本質的な相関関係なのか、見せかけの相関関係なのかについては常に注意を払っておかなくてはいけません。
回帰分析

ここまで来たら、回帰分析について学んでいきましょう!
統計学入門としては一旦はここがゴールです。
先ほどの相関関係は2つの変数の関係を可視化することだけにとどまっていましたが、回帰分析を用いることで、複数の変数からある目的とする変数がどのように変化するか可視化することができます。
例えば、どんなユーザーが自社の売上に貢献しているかを可視化すれば、狙うべきマーケットや施策も思いつくことができるかもしれません。
回帰分析は、現代流行りのAIの基本となっている手法であり、この考え方を発展させていくことで複雑なアルゴリズムを持つ機械学習手法も学ぶことができるんです。
回帰分析について勉強するにはこの多変量解析という本がオススメ!
回帰分析以外にもクラスター分析・コンジョイント分析などビジネスに活きる統計的解析手法が載っているのでそちらを目を通しておくと良いでしょう!
ちょっと書籍だと数式が多くハードルが高いです。
不安な人は以下のUdemyのコースを受講してみることをオススメします!
紙に書きながら教えてくれる特殊な講義。
微分や線形代数の知識と合わせながら単回帰から重回帰までの理論がスーッと分かりやすく学べます!
ちょっと高度な内容も知りたいという方は多変量解析手法やRでの実装法についてまとめていますのでよければご覧ください!

統計学入門の勉強方法 まとめ
統計学入門に必要な内容を簡単にまとめてきました!
回帰分析まで分かれば統計学の基礎は完璧。
ただ世の中の事象は単純な回帰分析で解明できるほど甘くはありません。
時系列要素のあるデータや正規分布ではないデータなどばかり。
そのようなデータに対しては、時系列データ分析手法群や一般化線形分析が存在します。
まだまだ奥が深い統計学の世界。
この後は、順番に勉強していくというよりも並行して勉強していくべき。
ベイズ・時系列・一般化線形分析・機械学習と様々な状況に合った手法を勉強していきましょう!
なかなか理論部分は最初はつまずきやすいので、適宜サービスを利用してみるとよいでしょう!

何回も言いますが、なるべく理論と並行もしくは先行して手を動かす経験が大事です。
理論だけ勉強しても飽きますし続かないです。
迷ったらPythonを勉強しましょう!Pythonの勉強法は以下の記事でまとめています!

こちらに統計ジャンルごとのオススメ本を紹介しているので是非ご覧ください!

是非、統計学を勉強してビジネスや学問に活かしていきましょう!
イラスト出典:Illustration by Stories by Freepik