こんにちは!
デジタルマーケター兼データサイエンティストのウマたん(@statistics1012)です!
確率分布といっても多種多様にありますが、一様分布は離散的・連続的両方の分布を持っています!
一様分布は「全ての事象が等確率で現れる確率分布」を表しています。具体例を出すとサイコロの目1~6は等確率、6分の1なのでサイコロを振る確率分布は一様分布に従っているとも言えるでしょう!
この記事では、そんな一様分布の定義を解説をしながらもその性質について解説していきます。またPythonで一様分布を確認してみましょう!
・一様分布の定義について解説!
・一様分布の性質について解説!
・Pythonで一様分布を見てみよう!
一様分布について以下のYoutube動画でも解説しているのであわせてチェックしてみてください!
離散型一様分布の定義について解説!
これを踏まえると、離散型一様分布は「確率変数が離散型である場合の全ての事象が等確率で現れる確率分布」と定義できるね!
\(P(X=k)\) = \(\frac{1}{N}\) \((k=1,…,N)\)
次に期待値と分散の算出を解説します!
\(E(X)\) = \(\sum_{k=1}^{N}k\frac{1}{N}\) = \(\frac{1}{N} \frac{N(N+1)}{2}\) = \(\frac{N+1}{2}\)
\(V(X)\) = \(E(X^{2}) – E(X)^{2}\) = \(\sum_{k=1}^{N}k^{2}\frac{1}{N}\) – \((\frac{N+1}{2})^{2}\)
= \(\frac{1}{N}\frac{N(N+1)(2N+1)}{6} – \frac{(N+1)(N+1)}{4}\) = \(\frac{(4N^{2}+6N+2)-(3N^{2}+6N+3)}{12}\)
= \(\frac{N^{2}-1}{12}\)
連続型離散分布について解説!
これを踏まえると、連続型一様分布は「確率変数が連続型である場合の全ての事象が等確率で現れる確率分布」と定義できるね!
\(f(X)\) = \(\frac{1}{b-a}\) \((a<=X<=b)\)
\(f(X)\) = \(0\) \((X<a, X>b)\)
次に期待値と分散の算出を解説します!
\(E(X)\)=\(\int_a^b \frac{1}{b-a}x dx\)=\(\frac{1}{b-a} \left[\frac{x^{2}}{2} \right]_a^b\) = \(\frac{b+a}{2}\)
\(V(X)\)=\(E(X^{2}) – E(X)^{2}\)=\(\int_a^b \frac{1}{b-a}x^{2} dx\) – \((\frac{b+a}{2})^{2}\) = \(\frac{1}{b-a} \left[\frac{x^{3}}{3} \right]_a^b\)-\((\frac{b+a}{2})^{2}\)
=\(\frac{1}{b-a}\frac{(b-a)(a^{2}+ab+b^{2})}{3}\)-\(\frac{a^{2}+2ab+b^{2}}{4}\)=\(\frac{a^{2}-2ab+b^{2}}{12}\)
=\(\frac{(b-a)^{2}}{12}\)
実際に一様分布をPythonで実装!
それでは実際に一様分布をPythonで実装していきましょう!
離散型一様分布はNumpy.randomのrandint関数、連続型一様分布はNumpy.randomのuniform関数で実装できます!
from numpy.random import randint,uniform
import matplotlib.pyplot as plt
%matplotlib inline
#データ生成
X = randint(0,100,100000)
Y = uniform(0,100,100000)
print(X)
print(Y)
#描画
fig,ax = plt.subplots(1,2,figsize=(10,3))
ax[0].hist(X)
ax[1].hist(Y)
plt.show()
一様分布 まとめ
本記事では一様分布についてまとめました!
一様分布について理解できた方は、離散型分布の代表である二項分布とポアソン分布を勉強すると良いでしょう!
確率分布は様々なものがあり、データや目的によって適切に使うことで初めて効果が表れる非常に優れたツールであると考えられます!確率分布だけでなく、統計学の知識やデータサイエンスの知識を得ることで、今までにない知見を身に付けることができます!
そうしたデータサイエンスの力を身に付けるためにはスタビジの記事やスクールを活用すると良いでしょう。
そして僕の経験を詰め込んだデータサイエンス特化のスクール「スタアカ(スタビジアカデミー)」を運営していますので,興味のある方はぜひチェックしてみてください!
AIデータサイエンス特化スクール「スタアカ」
【価格】 | ライトプラン:1280円/月 プレミアムプラン:149,800円 |
---|---|
【オススメ度】 | |
【サポート体制】 | |
【受講形式】 | オンライン形式 |
【学習範囲】 | データサイエンスを網羅的に学ぶ 実践的なビジネスフレームワークを学ぶ SQLとPythonを組みあわせて実データを使った様々なワークを行う マーケティングの実行プラン策定 マーケティングとデータ分析の掛け合わせで集客マネタイズ |
データサイエンティストとしての自分の経験をふまえてエッセンスを詰め込んだのがこちらのスタビジアカデミー、略して「スタアカ」!!
当メディアが運営するスクールです。
24時間以内の質問対応と現役データサイエンティストによる複数回のメンタリングを実施します!
カリキュラム自体は、他のスクールと比較して圧倒的に良い自信があるのでぜひ受講してみてください!
他のスクールのカリキュラムはPythonでの機械学習実装だけに焦点が当たっているものが多く、実務に即した内容になっていないものが多いです。
そんな課題感に対して、実務で使うことの多いSQLや機械学習のビジネス導入プロセスの理解などもあわせて学べるボリューム満点のコースになっています!
Pythonが初めての人でも学べるようなカリキュラムしておりますので是非チェックしてみてください!
ウォルマートのデータを使って商品の予測分析をしたり、実務で使うことの多いGoogleプロダクトのBigQueryを使って投球分析をしたり、データサイエンティストに必要なビジネス・マーケティングの基礎を学んでマーケティングプランを作ってもらったり・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践してもらったりする盛りだくさんの内容になってます!
・BigQuery上でSQL、Google Colab上でPythonを使い野球の投球分析
・世界最大手小売企業のウォルマートの実データを用いた需要予測
・ビジネス・マーケティングの基礎を学んで実際の企業を題材にしたマーケティングプランの策定
・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践して稼ぐ
データサイエンスに関する記事はこちら!
データサイエンスを勉強できるスクールやサイトは、ぜひこちらを参考にしてみてください!