統計学

確率分布について離散型・連続型を分かりやすく解説!

確率分布 アイキャッチ
記事内に商品プロモーションを含む場合があります
ウマたん
ウマたん
当サイト【スタビジ】の本記事では、確率分布について解説してきます。確率分布は確率変数がとる値とそれに対応する確率を示したものです。確率分布は多岐にわたるので、しっかりと基本を押さえましょう!今回は確率分布の定義を解説しつつ、これらの関係性について分かりやすく解説していきます!

こんにちは!

データサイエンティストのウマたん(@statistics1012)です!

今回は確率分布について解説していきます!特に正規分布・二項分布といった具体的な確率分布の解説ではなく、そもそも確率分布とは?といった疑問を解消していきます。

確率分布とは「確率変数がとる値とそれに対応する確率を表した分布」と定義されています。特に確率分布には連続変数の連続型確率分布と離散変数の離散型確率分布の2つがあります!

この記事では、そんな確率分布の定義と関係性について解説していきます!

・確率分布の定義について解説!
・確率分布の性質について解説!

確率分布についてザックリ理解するには以下のYoutube動画も是非参考にしてみてください!

確率変数について解説!

Analytics
ロボたん
ロボたん
確率分布の定義が分かったけど、そもそも確率変数とは何だろう?
ウマたん
ウマたん
確率変数とは確率を持つ変数と言われているよ!これだけだと分からないので、具体例を示しながら説明していこう。

確率変数とは「色々な値をとる事象が存在しており、それらの値をとる確率が決まっている変数」と定義されています!

確率変数

初めに6つの目を持ったサイコロを考えていきましょう。この時、確率変数は「サイコロの目」であると考えられますね!先程の定義に当てはめてみると、サイコロの目は「1~6の値を持ち,それぞれに\(\frac{1}{6}\)の確率が対応している変数」だからです!

またコインも考えていきましょう。この時の確率変数は「コインの表裏」であると考えられますね!表裏の確率が\(\frac{1}{2}\)に対応しているからです!

確率分布について解説!

Data Trends

次は確率分布について解説していきます!

確率分布とは「確率変数とそれに対応した確率を表した分布」と定義されています!

先程のサイコロを例に考えてみると、サイコロの目(確率変数)をXとしたとき、確率変数がどの値をとっても確率は\(\frac{1}{6}\)となるので、以下の式で表すことができます!

\(P(X=1) = \frac{1}{6}\), \(P(X=2) = \frac{1}{6}\),…,\(P(X=6) = \frac{1}{6}\)

さて、確率変数と確率が分かったのでグラフで見ていきましょう!このグラフが一般的に確率分布と呼ばれています。

離散一様分布

確率分布の種類・具体例について解説!

Data
ロボたん
ロボたん
確率分布についてわかったけど、他にはどんなものがあるのだろうか…
ウマたん
ウマたん
確率分布は大きく分けて離散型確率分布と連続型確率分布となります。これらの説明と具体例について見ていこう!

確率分布には離散型確率分布と連続型確率分布があります!これらの違いを表で見てみましょう!

離散型確率分布確率変数が離散である。棒グラフで示す。
連続型確率分布確率変数が連続である。線グラフで示す。

この表から、先程のサイコロの分布は離散型確率分布です!Xは1,2,3,4,5,6で示すことができ、棒グラフで示していましたからね!

次に連続型確率分布の例として身長を見ていきましょう!身長は170cmもあれば170.5cmや170.556といった連続的に示すことができますね。(170cm、180cmといった値が離れているのなら離散型ですが…)

次は実際に連続型確率分布を見ていきましょう!これは平均160cm、標準偏差が5の正規分布を表しています!

正規分布

ここで注意したいのが縦軸は確率ではなく「確率密度」である点です。確率密度は確率とは違って「相対的な出やすさ」と覚えておきましょう。

確率変数が連続である場合取る値が無限に存在するので、ある値だけの確率は0になります。例えば身長が166cmである確率は\(P(X=166)=\frac{1}{∞}=0\)となりますね!

したがって、このグラフは一般的に確率密度関数\(f(x) = f(X=x(ある値))\)と呼ばれています!

では確率はどのように表すかというと、「確率密度と確率変数の範囲をかけた面積」で示します!身長の例から、ある値\(x\)が160cmから170cmに存在する確率を知りたいときに使えますね!

\(P(a <= X <= b) = \displaystyle \int_{a}^{b} f(x) dx\)

ロボたん
ロボたん
なるほど!確率変数の種類で示される確率分布も変わるし、確率の求め方も変わるんだね!
ウマたん
ウマたん
その通り!そして確率分布の具体例は以下の記事が分かりやすいので是非見ておきましょう!

離散型確率分布の例はこちらを見ると良いでしょう!

一様分布 アイキャッチ
一様分布について解説!定義と平均・分散の導出について!当サイト【スタビジ】の本記事では、一様分布について解説していきます!一様分布は代表的な離散的分布の一つでもあり、連続的分布の一つでもある基本的な分布です。今回は一様分布の定義を解説しつつ、平均・分散といった基本的な要素も解説していきます。...
二項分布 アイキャッチ
二項分布について解説!定義と期待値・分散の計算、正規分布への近似について!当サイト【スタビジ】の本記事では、二項分布について解説していきます!二項分布は代表的な離散的分布の一つです。今回は二項分布の定義を解説しつつ、平均・分散といった基本的な要素も解説していきます。...
ポアソン分布
ポアソン分布について図で分かりやすく解説!二項分布から平均と分散の計算方法は?当サイト【スタビジ】の本記事では、ポアソン分布について解説していきます!ポアソン分布とは、ある事象が一定の時間に発生する回数を示す離散的な分布の1つであり、単位時間当たり平均λ回起こるような事象が単位時間にk回発生する分布を表しています!今回はポアソン分布の定義を解説しつつ、平均・分散といった基本的な要素も解説していきます。...
負の二項分布 アイキャッチ
負の二項分布・幾何分布について解説!~期待値・分散について~当サイト【スタビジ】の本記事では、負の二項分布・幾何分布について解説していきます!負の二項分布は離散的分布の一つで、通常の二項分布とは異なる定義と性質を持っているため,かなり難しい分布です。また負の二項分布は幾何分布を一般化したものと考えられています。今回は負の二項分布・幾何分布の定義を解説しつつ、平均・分散といった基本的な要素について解説していきます。...

連続型分布の例はこちらの記事を見てみましょう!

正規分布 アイキャッチ
正規分布について解説!基礎的な知識から標準化まで!当サイト【スタビジ】の本記事では、正規分布について解説していきます!正規分布は連続的分布の一つでもある基本的な分布であり、統計学・機械学習において非常に重要な役割を持ちます。今回は正規分布の定義を解説しつつ、平均・分散といった基本的な要素と標準化について解説していきます。...
ガンマ分布 アイキャッチ
ガンマ分布と指数分布について解説!期待値・分散の基本的な性質について!当サイト【スタビジ】の本記事では、ガンマ分布と指数分布について解説していきます!ガンマ分布・指数分布は連続的分布の一つでもある基本的な分布であり、ガンマ分布は指数分布を一般化させた分布です!今回はガンマ分布・指数分布の定義を解説しつつ、平均・分散といった基本的な要素について解説していきます。...

確率分布 まとめ

Happy
本記事では確率分布についてまとめました!

今回の内容について理解できた方は、離散型分布の代表である一様分布二項分布ポアソン分布,そして連続型分布である正規分布ガンマ分布と指数分布を勉強すると良いでしょう!

確率分布は様々なものがあり、データや目的によって適切に使うことで初めて効果が表れる非常に優れたツールであると考えられます!確率分布だけでなく、統計学の知識やデータサイエンスの知識を得ることで、今までにない知見を身に付けることができます!

そうしたデータサイエンスの力を身に付けるためにはスタビジの記事やスクールを活用すると良いでしょう。

そして僕の経験を詰め込んだデータサイエンス特化のスクール「スタアカ(スタビジアカデミー)」を運営していますので,興味のある方はぜひチェックしてみてください!

ウマたん
ウマたん
目指せデータサイエンスマスター!

AIデータサイエンス特化スクール「スタアカ」

スタアカトップ
【価格】ライトプラン:980円/月
プレミアムプラン:98,000円
【オススメ度】
【サポート体制】
【受講形式】オンライン形式
【学習範囲】データサイエンスを網羅的に学ぶ
実践的なビジネスフレームワークを学ぶ
SQLとPythonを組みあわせて実データを使った様々なワークを行う
マーケティングの実行プラン策定
マーケティングとデータ分析の掛け合わせで集客マネタイズ

データサイエンティストとしての自分の経験をふまえてエッセンスを詰め込んだのがこちらのスタビジアカデミー、略して「スタアカ」!!

当メディアが運営するスクールです。

24時間以内の質問対応と現役データサイエンティストによる複数回のメンタリングを実施します!

カリキュラム自体は、他のスクールと比較して圧倒的に良い自信があるのでぜひ受講してみてください!

他のスクールのカリキュラムはPythonでの機械学習実装だけに焦点が当たっているものが多く、実務に即した内容になっていないものが多いです。

そんな課題感に対して、実務で使うことの多いSQLや機械学習のビジネス導入プロセスの理解などもあわせて学べるボリューム満点のコースになっています!

Pythonが初めての人でも学べるようなカリキュラムしておりますので是非チェックしてみてください!

ウォルマートのデータを使って商品の予測分析をしたり、実務で使うことの多いGoogleプロダクトのBigQueryを使って投球分析をしたり、データサイエンティストに必要なビジネス・マーケティングの基礎を学んでマーケティングプランを作ってもらったり・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践してもらったりする盛りだくさんの内容になってます!

・BigQuery上でSQL、Google Colab上でPythonを使い野球の投球分析
・世界最大手小売企業のウォルマートの実データを用いた需要予測
・ビジネス・マーケティングの基礎を学んで実際の企業を題材にしたマーケティングプランの策定
・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践して稼ぐ

データサイエンスに関する記事はこちら!

統計学入門に必要な知識と独学勉強方法を簡単に学ぼう!当ブログ【スタビジ】の本記事では、統計学入門に必要な知識をカンタンにまとめ、それらをどのように効率的に独学で勉強していけばよいかをお話ししていきます。統計学は難しいイメージが少しありますが、学び方をしっかり考えれば大丈夫!...
デーサイエンス本
【データサイエンティスト厳選18冊】データサイエンスを学ぶ上でオススメな本・教材!当ブログ【スタビジ】の本記事では、データサイエンスを学ぶ上でオススメできる本を厳選して紹介していきます。ここではデータサイエンティストになるために習得するスキルをデータサイエンスと称しております。いくつかの観点に切り分けて見ていきます。...

データサイエンスを勉強できるスクールやサイトは、ぜひこちらを参考にしてみてください!

データサイエンティスト スクール
【徹底比較】データサイエンティストのための学習ができるスクール9選! スクール名 オススメ度 価格の安さ サポート体制 公式サイト テックアカデミー ...
スタビジアカデミーでデータサイエンスをさらに深く学ぼう!

スタアカサービスバナースタビジのコンテンツをさらに深堀りしたコンテンツが動画と一緒に学べるスクールです。

プレミアムプランでは私がマンツーマンで伴走させていただきます!ご受講お待ちしております!

スタビジアカデミーはこちら