こんにちは!
データサイエンティストのウマたん(@statistics1012)です!
元々大学院で統計学を専攻していてずっとRユーザーだったんですが、社会人になってからはPythonメインで使っています。
そんな僕だからこそ、統計学をPythonで学ぶ重要性をひしひしと感じています。
大学院時代からRではなくてPythonを使っていればよかった・・・
この記事では
・なぜ今の時代、統計学を学ぶ上でPythonが重要なのか?
・Pythonで統計学を学ぶロードマップ
について見ていきたいと思います。
なぜ統計学をPythonで学ぶべきなのか
統計学は現在世の中を席捲しているAIや機械学習の基礎となる考え方。
統計学を理解することで、ビジネスインパクトを正確に測ることが出来たり、怪しいコンサルタントの数字に騙されることもなくなります。
そんな統計学を実装できるプログラミング言語はRやStanなどいくつかあるんです。
簡単な手法であればExcelでも実装できちゃいます。
では、なぜ統計学をわざわざPythonで学ぶべきなのでしょうか?
確かにデータ分析・統計だけを切り取れば他の言語でも十分代替が効きます。
ただ、アプリケーションの開発まで出来て様々な工程を自動化できる言語は他にはないんです。
Pythonをマスターしておくことで、本当に幅広いことが出来るんです!
ざっと以下のコトができます。
詳しくは以下の記事でまとめていますのでチェックしてみてください!
プログラミング言語は手段でありPythonにこだわりすぎるのはよくないですが、Pythonは現在最もホットなプログラミング言語の1つです。
今後、間違いなく統計学を超えたAI・データサイエンスの分野で活躍することになるのはPythonを扱えるエンジニア・データサイエンティスト。
ビジネスサイドの方でも「Pythonで出来ること」を把握しておくことでエンジニアやデータサイエンティストとの会話をスムーズに行うことができ、ビジネスを速いスピードでドライブすることが可能です。
統計学をPythonで学ぶことで、統計学のノウハウを出来るだけ早く実務に取り入れることができるようになります。
Pythonで統計学を学ぶロードマップ
それでは、Pythonを使ってどのように統計学を勉強していけばよいか見ていきたいと思います。
ここでは詳しくは取り上げませんが、統計学の分野は
簡単にまとめると
・基本的な用語や考え方を抑える
・検定の考え方を学ぶ
・相関について学ぶ
・回帰分析
の順番で勉強していくのがベターです。
統計の分野で言うところの記述統計で基本をおさえて、推測統計に入り、最終的には多変量解析まで進みます。
詳しくは以下の記事でまとめていますのであわせてチェックしてみてください。
ただ、統計学ってどうしても小難しい数式で挫折してしまうことが多いんです。
僕自身大学3年生の頃に論文とか読んで吐き気もよおしてましたから・・・
特に推測統計の部分は、分かれば簡単なのになんだか複雑に解説したがるんですよねー不思議・・・
無理やり読み込んでじっくり理解するという方法もあるんですが、個人的にはなるべく早く手を動かす方がよいと思います。
ここでは、おすすめの教材をいくつか取り上げていきつつどのようにPythonを統計と絡めて勉強していくか見ていきます。
基本は以下の2つのステップを反復することです。
・手を動かして数式を理解
・Pythonで実装
まずは手を動かして数式を理解
小難しいギリシャ文字を使った数式の理解は半ばにして、まずは具体数字を当てはめて数式が成り立つか手計算で確認してみるのが大事です。
なんとなーく概念的でよくわからない数式も具体的な数字を代入することでイメージが湧きやすくなるんです。
推測統計で大事な検定については以下の記事でできるだけ分かりやすく解説しているのでチェックしてみてください!
ちょっと難しい部分もありますが、以下の書籍がおすすめです!
この書籍と共に学部時代を過ごした思い出があります。
また、書籍が苦手だーという方にはUdemyの以下のコースをおすすめします!
【初学者向け】統計学の基礎をアニメーションを通じてビジネス観点で理解していこう!
【オススメ度】 | |
---|---|
【講師】 | 僕自身!今なら購入時に「VGRBCQDF」という講師クーポンコードを入れると94%OFFになりますのでぜひご受講ください! |
【時間】 | 3時間 |
【レベル】 | 初級 |
手前味噌ですが、僕自身がUdemyにて統計学を網羅的に学べる講座を作っています。
そんな方に向けてアニメーションで統計学を簡単に理解してもらう講座を作りました!
ビジネス観点で必要な統計学の知識だけを抽出してまとめています。
アニメーションで学ぶ概要編とPythonで実際に手を動かしながら学んでいく実践編に分かれています。
まず、統計学の全体像とビジネスに必要な知識を学んでいきます。
そして多変量解析の領域に入りよく使われる手法を中心に学んでいきます。
ビジネスに活かせる統計学について網羅的にしっかり学ぶことが可能ですので是非受講してみてください!
Pythonで実装
さて、手計算でなんとなーく理論の理解ができたらそれをPythonで実装していきましょうー!
Pythonを学んでいく上でぜひオススメしたいのがPyQ!
PyQはとにかくPython特化のオンライン学習プラットフォームで3か月ほど利用してだいぶPythonコーディングが上達しました。
もともとR使っていたので、飛ばし飛ばし受講しましたが、その人のレベルにあわせて最適なコースをレコメンドしてくれるのでプログラミング初心者の方でも安心して受講できます。
価格も月々書籍1冊ほどなのでリーズナブルでオススメです。
ただPyQは完全独学になってしまうのでPythonの学習を本気でやるならあまりオススメしません。
もし本気で集中的に取り組むのであればプログラミングスクールをおすすめします。
実際に僕自身テックアカデミーというプログラミングスクールで現役 AIエンジニアに指導してもらった経験があります。
ただプログラミングスクールは価格が高くなりがちです・・・そこでオススメなのが当メディアが運営するAIデータサイエンス特化スクールの「スタアカ(スタビジアカデミー)」
公式サイト:https://toukei-lab.com/achademy/
【価格】 | ライトプラン:1280円/月 プレミアムプラン:149,800円 |
---|---|
【オススメ度】 | |
【サポート体制】 | |
【受講形式】 | オンライン形式 |
【学習範囲】 | データサイエンスを網羅的に学ぶ 実践的なビジネスフレームワークを学ぶ SQLとPythonを組みあわせて実データを使った様々なワークを行う マーケティングの実行プラン策定 マーケティングとデータ分析の掛け合わせで集客マネタイズ |
24時間以内の質問対応と現役データサイエンティストによる1週間に1回のメンタリングを実施します!
カリキュラム自体は、他のスクールと比較して圧倒的に良い自信があるのでぜひ受講してみてください!
他のスクールのカリキュラムはPythonでの機械学習実装だけに焦点が当たっているものが多く、実務に即した内容になっていないものが多いです。
そんな課題感に対して、実務で使うことの多いSQLや機械学習のビジネス導入プロセスの理解などもあわせて学べるボリューム満点のコースになっています!
ウォルマートのデータを使って商品の予測分析をしたり、実務で使うことの多いGoogleプロダクトのBigQueryを使って投球分析をしたり、データサイエンティストに必要なビジネス・マーケティングの基礎を学んでマーケティングプランを作ってもらったり・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践してもらったりする盛りだくさんの内容になってます!
・BigQuery上でSQL、Google Colab上でPythonを使い野球の投球分析
・世界最大手小売企業のウォルマートの実データを用いた需要予測
・ビジネス・マーケティングの基礎を学んで実際の企業を題材にしたマーケティングプランの策定
・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践して稼ぐ
Pythonを勉強できるプログラミングスクールは他にもたくさんあります。以下にまとめていますので是非チェックしてみてください!
またPythonの勉強法については以下の記事も参考にしてみてください!
Pythonを使ったいくつかの実装例に関しては当ブログでも紹介していますのでぜひマネしてみてくださいね!
ちょっと統計学の範囲を超える部分もあります。
まとめ
統計学をどのように勉強したらよい?と聞かれた悩まずにPythonで実装しながら勉強した方がいい!と答えます!
書籍の数式とにらめっこしていては、キリがありません。
まずは具体的な数字を入れてみて、「ほー確かにそうなるなー」となんとなーく理解する。
それでPythonで実装してみる。
そうやって手計算でもプログラミングによる実装でもなんとなーく手を動かすことで理解がすすみ、最初は分からなかった数式に意味合いというものが理解しやすくなってくるものです。
ぜひ、統計学をPythonで勉強していきましょうー!
統計学やPythonの学習方法は以下の記事でまとめています。
データサイエンスや機械学習については以下の記事でもまとめていますので是非チェックしてみてください!