Python

一様分布について解説!定義と平均・分散の導出について!

一様分布 アイキャッチ
記事内に商品プロモーションを含む場合があります
ウマたん
ウマたん
当サイト【スタビジ】の本記事では、一様分布について解説していきます!一様分布は代表的な離散的分布の一つでもあり、連続的分布の一つでもある基本的な分布です。今回は一様分布の定義を解説しつつ、平均・分散といった基本的な要素も解説していきます。

こんにちは!

デジタルマーケター兼データサイエンティストのウマたん(@statistics1012)です!

確率分布といっても多種多様にありますが、一様分布は離散的・連続的両方の分布を持っています!

一様分布は「全ての事象が等確率で現れる確率分布」を表しています。具体例を出すとサイコロの目1~6は等確率、6分の1なのでサイコロを振る確率分布は一様分布に従っているとも言えるでしょう!

ウマたん
ウマたん
この性質は離散的な値や連続的な値両方に適用できるんだ!今回は二つの性質を見比べながらしっかり理解していこう!

この記事では、そんな一様分布の定義を解説をしながらもその性質について解説していきます。またPythonで一様分布を確認してみましょう!

・一様分布の定義について解説!
・一様分布の性質について解説!
・Pythonで一様分布を見てみよう!

一様分布について以下のYoutube動画でも解説しているのであわせてチェックしてみてください!

離散型一様分布の定義について解説!

Stories
ロボたん
ロボたん
早速離散型の一様分布の解説だね!確認だけど離散型っていうのはどんな意味なの?
ウマたん
ウマたん
離散型は確率変数がとびとびの値を示す場合を指すよ!例えばサイコロは1,2,3,4,5,6の目があるけど1.2や5.5といった目はないし、人数は1人2人と数えるけど1.5人と数えることもないことが分かるよね!このような場合は確率変数が離散型であると言うんだ!
離散型確率変数

これを踏まえると、離散型一様分布は「確率変数が離散型である場合の全ての事象が等確率で現れる確率分布」と定義できるね!

ウマたん
ウマたん
離散型一様分布の式はこちら!かなりシンプルで分かりやすい式であることが分かるね。そして離散型一様分布の図はこのような形になるんだ!

\(P(X=k)\) = \(\frac{1}{N}\) \((k=1,…,N)\)

離散一様分布

次に期待値と分散の算出を解説します!

\(E(X)\) = \(\sum_{k=1}^{N}k\frac{1}{N}\) = \(\frac{1}{N} \frac{N(N+1)}{2}\) = \(\frac{N+1}{2}\)

\(V(X)\) = \(E(X^{2}) – E(X)^{2}\) = \(\sum_{k=1}^{N}k^{2}\frac{1}{N}\) – \((\frac{N+1}{2})^{2}\)

= \(\frac{1}{N}\frac{N(N+1)(2N+1)}{6} – \frac{(N+1)(N+1)}{4}\) = \(\frac{(4N^{2}+6N+2)-(3N^{2}+6N+3)}{12}\)

= \(\frac{N^{2}-1}{12}\)

連続型離散分布について解説!

Stories
ロボたん
ロボたん
次は連続型の一様分布の解説だね!ちなみに連続型はどんな確率変数になるの?
ウマたん
ウマたん
連続型は離散型とは違って、値が連続的に続くものなんだ!例えば重さは50kgや50.0000001kgといったところまで表すことができるし、気温も35℃から35.5℃と細かく表すことができると分かるね!このような場合は確率変数が連続型であると言うんだ!
連続型確率変数

これを踏まえると、連続型一様分布は「確率変数が連続型である場合の全ての事象が等確率で現れる確率分布」と定義できるね!

ウマたん
ウマたん
連続型一様分布の式はこちら!離散型一様分布と同じくらいシンプルだけど、少し異なる部分もあることに注意だ!そして連続型一様分布の図は以下の通り!

\(f(X)\) = \(\frac{1}{b-a}\) \((a<=X<=b)\)

\(f(X)\) = \(0\) \((X<a, X>b)\)

連続型一様分布

次に期待値と分散の算出を解説します!

\(E(X)\)=\(\int_a^b \frac{1}{b-a}x dx\)=\(\frac{1}{b-a} \left[\frac{x^{2}}{2} \right]_a^b\) = \(\frac{b+a}{2}\)

\(V(X)\)=\(E(X^{2}) – E(X)^{2}\)=\(\int_a^b \frac{1}{b-a}x^{2} dx\) – \((\frac{b+a}{2})^{2}\) = \(\frac{1}{b-a} \left[\frac{x^{3}}{3} \right]_a^b\)-\((\frac{b+a}{2})^{2}\)

=\(\frac{1}{b-a}\frac{(b-a)(a^{2}+ab+b^{2})}{3}\)-\(\frac{a^{2}+2ab+b^{2}}{4}\)=\(\frac{a^{2}-2ab+b^{2}}{12}\)

=\(\frac{(b-a)^{2}}{12}\)

実際に一様分布をPythonで実装!

stories pc

それでは実際に一様分布をPythonで実装していきましょう!

離散型一様分布はNumpy.randomのrandint関数、連続型一様分布はNumpy.randomのuniform関数で実装できます!

from numpy.random import randint,uniform
import matplotlib.pyplot as plt
%matplotlib inline

#データ生成
X = randint(0,100,100000)
Y = uniform(0,100,100000)
print(X)
print(Y)

#描画
fig,ax = plt.subplots(1,2,figsize=(10,3))
ax[0].hist(X)
ax[1].hist(Y)
plt.show()
ウマたん
ウマたん
実行結果はこちら!確率変数が離散型、連続型両方の乱数を生成できていることが分かるね!
一様分布 python

一様分布 まとめ

stories data

本記事では一様分布についてまとめました!

一様分布について理解できた方は、離散型分布の代表である二項分布ポアソン分布を勉強すると良いでしょう!

二項分布 アイキャッチ
二項分布について解説!定義と期待値・分散の計算、正規分布への近似について!当サイト【スタビジ】の本記事では、二項分布について解説していきます!二項分布は代表的な離散的分布の一つです。今回は二項分布の定義を解説しつつ、平均・分散といった基本的な要素も解説していきます。...
ポアソン分布
ポアソン分布について図で分かりやすく解説!二項分布から平均と分散の計算方法は?当サイト【スタビジ】の本記事では、ポアソン分布について解説していきます!ポアソン分布とは、ある事象が一定の時間に発生する回数を示す離散的な分布の1つであり、単位時間当たり平均λ回起こるような事象が単位時間にk回発生する分布を表しています!今回はポアソン分布の定義を解説しつつ、平均・分散といった基本的な要素も解説していきます。...

確率分布は様々なものがあり、データや目的によって適切に使うことで初めて効果が表れる非常に優れたツールであると考えられます!確率分布だけでなく、統計学の知識やデータサイエンスの知識を得ることで、今までにない知見を身に付けることができます!

そうしたデータサイエンスの力を身に付けるためにはスタビジの記事やスクールを活用すると良いでしょう。

そして僕の経験を詰め込んだデータサイエンス特化のスクール「スタアカ(スタビジアカデミー)」を運営していますので,興味のある方はぜひチェックしてみてください!

ウマたん
ウマたん
目指せデータサイエンスマスター!

AIデータサイエンス特化スクール「スタアカ」

スタアカトップ
【価格】ライトプラン:1280円/月
プレミアムプラン:149,800円
【オススメ度】
【サポート体制】
【受講形式】オンライン形式
【学習範囲】データサイエンスを網羅的に学ぶ
実践的なビジネスフレームワークを学ぶ
SQLとPythonを組みあわせて実データを使った様々なワークを行う
マーケティングの実行プラン策定
マーケティングとデータ分析の掛け合わせで集客マネタイズ

データサイエンティストとしての自分の経験をふまえてエッセンスを詰め込んだのがこちらのスタビジアカデミー、略して「スタアカ」!!

当メディアが運営するスクールです。

24時間以内の質問対応と現役データサイエンティストによる複数回のメンタリングを実施します!

カリキュラム自体は、他のスクールと比較して圧倒的に良い自信があるのでぜひ受講してみてください!

他のスクールのカリキュラムはPythonでの機械学習実装だけに焦点が当たっているものが多く、実務に即した内容になっていないものが多いです。

そんな課題感に対して、実務で使うことの多いSQLや機械学習のビジネス導入プロセスの理解などもあわせて学べるボリューム満点のコースになっています!

Pythonが初めての人でも学べるようなカリキュラムしておりますので是非チェックしてみてください!

ウォルマートのデータを使って商品の予測分析をしたり、実務で使うことの多いGoogleプロダクトのBigQueryを使って投球分析をしたり、データサイエンティストに必要なビジネス・マーケティングの基礎を学んでマーケティングプランを作ってもらったり・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践してもらったりする盛りだくさんの内容になってます!

・BigQuery上でSQL、Google Colab上でPythonを使い野球の投球分析
・世界最大手小売企業のウォルマートの実データを用いた需要予測
・ビジネス・マーケティングの基礎を学んで実際の企業を題材にしたマーケティングプランの策定
・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践して稼ぐ

データサイエンスに関する記事はこちら!

【初心者必見】統計学入門に必要な知識と独学勉強方法を簡単に学ぼう!当ブログ【スタビジ】の本記事では、統計学入門に必要な知識をカンタンにまとめ、それらをどのように効率的に独学で勉強していけばよいかをお話ししていきます。統計学は難しいイメージが少しありますが、学び方をしっかり考えれば大丈夫!...
デーサイエンス本
【データサイエンティスト厳選18冊】データサイエンスを学ぶ上でオススメな本・教材!当ブログ【スタビジ】の本記事では、データサイエンスを学ぶ上でオススメできる本を厳選して紹介していきます。ここではデータサイエンティストになるために習得するスキルをデータサイエンスと称しております。いくつかの観点に切り分けて見ていきます。...

データサイエンスを勉強できるスクールやサイトは、ぜひこちらを参考にしてみてください!

データサイエンティスト スクール
【徹底比較】データサイエンティストのための学習ができるスクール9選! スクール名 オススメ度 価格の安さ サポート体制 公式サイト テックアカデミー ...
スタビジアカデミーでデータサイエンスをさらに深く学ぼう!

スタアカサービスバナースタビジのコンテンツをさらに深堀りしたコンテンツが動画と一緒に学べるスクールです。

プレミアムプランでは私がマンツーマンで伴走させていただきます!ご受講お待ちしております!

スタビジアカデミーはこちら