こんにちは!
データサイエンティストのウマたん(@statistics1012)です!
統計学において「因果」は永遠のテーマです。
相関は分かったとしても、その事象に因果があるとは限らない。
この記事では、そんな統計学の奥深いテーマである「因果」を勉強する上でオススメな本を紹介していきたいと思います。
目次
因果推論とは
因果推論は、常に統計学についてまわる問題。
因果を突き止めることができれば、ビジネスに大きなインパクトを与えることができますが、現実問題因果を突き止めることは非常に難しい。
そのため、因果までは解明せず相関だけ突き止めることが多いんです。
例えば、「耳が大きいほど年収が高い」という話があります。
確かに耳の大きさと年収には相関関係があるのです。
しかし果たして因果関係はあるのでしょうか?実は、耳の大きさと年収の間には年齢という別の変数が紛れ込んでいるのです。
耳は、年齢が高くなればなるほど大きくなるので(0歳~15歳くらい?)、この年齢を含めると耳が小さい人は年収がほぼ0となり耳が大きい人(大人)は年収がいくらかあるので、本来因果関係がないところに相関関係が生まれてしまうのです。
これを偽相関と呼びます。
このように相関関係があるからと言って因果関係があるわけではありません。
果たして因果関係があるのか突き止めていくのが統計的因果推論という分野なのです。
以下の記事で詳しくまとめています!
因果推論のオススメ本5選!
さて、そんな因果推論を勉強する上でオススメな本について見ていきたいと思います。
データ分析の力 因果推論に迫る思考法
(2024/12/26 18:05:49時点 Amazon調べ-詳細)
因果推論について簡単に分かりやすく学べる本がこちらの「データ分析の力 因果推論に迫る思考法」になります。
難しい数式などはほぼ出てこず、概念的に様々な内容が学べます。
いきなり理論を学ぼうとすると頓挫する可能性が高いので、最初にまずはこの本を読むことをおすすめします!
以下のYoutubeで分かりやすく解説しています。
岩波データサイエンス Vol.3
統計的因果推論をしっかり学ぶ上でこちらを読んでおけば問題ありません。
理論を学ぶ入門書として最適です。
調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)
より具体的に因果関係を突き止める手法について学べます。
セミパラメトリックモデル推定について学ぶことが可能!
統計的因果推論 -モデル・推論・推測-
「統計的因果推論 -モデル・推論・推測-」はJudea Pearl氏の著書を黒木先生が翻訳したものになります。
バックドア基準やベイジアンネットワークについて詳細に書かれています。
ただ難解であるので最初からここに挑戦するのはオススメしません。
統計的因果探索 (機械学習プロフェッショナルシリーズ)
こちらの本は統計的因果探索についてまとめられた本。
統計的因果探索の入門書として非常にオススメ!
一般的な統計的因果推論についても記載されていますが、あくまで因果探索が主なので傾向スコアなどは出てきません。
因果推論のオススメ本 まとめ
まずは「データ分析の力 因果関係に迫る思考法」で全体感を掴みましょう!
理論をしっかり学ぶなら「岩波データサイエンス Vol.3」から出発して因果推論とは何かを雰囲気を掴んでから「調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)」に行くと進みやすいのではないかと思います。
これらの本で学べる手法については、簡単に以下の記事にまとめていますので興味があればご覧ください!
また、統計学の幅広い分野の本は以下の記事でまとめているので合わせてチェックしてみてください。
データサイエンスについて網羅的に学ぶのであれば当メディアが運営するスタアカ(スタビジアカデミー)がオススメです!
ご受講お待ちしております!