統計学

標準偏差と分散の違い・求め方を分かりやすく図で解説!

標準偏差・分散
記事内に商品プロモーションを含む場合があります
ウマたん
ウマたん
当サイト【スタビジ】の本記事では、標準偏差と分散について解説していきます!標準偏差と分散は「データの散らばり具合を示す」重要な指標となっています。今回は標準偏差と分散の求め方と違いについて解説しつつ、Pythonで実装していきます!

こんにちは!

デジタルマーケター兼データサイエンティストのウマたん(@statistics1012)です!

データの傾向・性質を見る指標はたくさんありますが、「データの散らばり具合を見る」指標である標準偏差と分散は非常に重要です!

具体的には「データが平均からどれだけ散らばっているか」示しており、データのばらつきが大きいと標準偏差と分散が大きくなり、ばらつきが小さくなると0に近づく特徴を持っています!

この記事では、分散と標準偏差の求め方と違いについて解説していきます!

・分散と標準偏差の求め方について解説!
・分散と標準偏差の違いについて解説!
・Pythonで実装してみよう!

以下の動画でも解説していますのであわせてチェックしてみてください!

分散・標準偏差の求め方

stories Data-pana

分散とは「データのばらつきを示す指標」と定義されています。分散の値が分かることで、データの分布が予想でき、データの比較が行うことができます!

ウマたん
ウマたん
分散の式は以下の通りに示せるよ!

\(s^{2}\) = \(\frac{1}{n}\)\(\sum_{i=1}^{n}\) \((x_i – \bar{ x })^{2}\)

これらの式では、\(n\)がサンプルサイズ,\(x_i\)が各サンプルごとの値、\(\bar{ x }\)が平均値を表しています!特に\((x_i – \bar{ x })\)を偏差と呼びます!

ロボたん
ロボたん
それじゃ偏差は各サンプルの値から平均値を引いた値なんだね!
ウマたん
ウマたん
その通り!偏差は「各サンプルの値が平均からどれだけ離れているか」を示しているんだ。そして分散は偏差の2乗平均でもあるんだ!

そして分散には標本分散と不偏分散の2種類があります!標本分散は標本内の分散、不偏分散は母集団の分散を推定したものです。その違いについてはこちらの記事で解説しています!

分散の求め方!不偏分散と標本分散の違い当サイト【スタビジ】の本記事では、分散について解説していきます!分散とは「データの散らばり具合を示す」重要な指標となっています。今回は分散の定義について解説しつつ、分散のなかでも標本分散と不偏分散の違いについて解説してPythonで実装していきます!...

次に標準偏差について解説します!標準偏差も分散と同様、「データのばらつきを示す指標」と定義できます。

ウマたん
ウマたん
標準偏差の式は以下の通りだよ!

\(s\) = \(\sqrt{s^{2}}\)

= \(\sqrt{\frac{1}{n}\sum_{i=1}^{n} (x_i – \bar{ x })^{2}}\)

ロボたん
ロボたん
これを見ると、分散は標準偏差の2乗を表していることがわかるね!…でもどちらも「データのばらつきを表す指標」ならどちらの方を使ったらいいのかな?
ウマたん
ウマたん
そこで次は分散と標準偏差の違いについて解説していくよ!

標準偏差と分散の違い

Visual data
ロボたん
ロボたん
式だけで見ると分散は標準偏差の2乗なので、意味が同じならどっちを使ってもいいような…?
ウマたん
ウマたん
確かにどちらも「データのばらつきを示す指標」だけど、見やすさという点では標準偏差の方が優れているんだ!

例として、以下のような問題設定を考えましょう!

標準偏差・分散の問題設定

工場でネジ[単位:㎜]を10個作って、データのばらつきを見たいと考えます。

この時、分散「平方和の2乗」なので、単位はであることが分かります。

そして標準偏差は「分散の平方根」なので、単位はであることが分かりますね!

ロボたん
ロボたん
そうすると標準偏差は元のデータと同じ単位で示していることになるね!
ウマたん
ウマたん
その通り!元のデータの単位は㎜なのに、データのばらつきの単位が㎟だと違和感があるよね。この違和感を解消したものが標準偏差なんだ!

実際に標準偏差・分散をPythonで実装してみよう!

stories pc

最後にPythonで標準偏差・分散を実装しましょう!

標準偏差・分散はNumpyライブラリのstd関数・var関数で実装できます!

問題の設定は、先程の工場のネジの問題を使いましょう!

import numpy as np

#工場のネジ10本のデータ
A = [76,89,100,21,30,35,21,56,49,44]

#分散
print("分散:"+str(np.var(A)))

#標準偏差
print("標準偏差:"+str(np.std(A)))

 

実行してみると,ちゃんと標準偏差・分散が算出していることが分かります!

標準偏差・分散の結果

標準偏差・分散のまとめ

Stories

本記事では標準偏差・分散の求め方と違いについてまとめました!

データの性質・傾向を見るために、データのばらつきを表す分散は非常に重要な指標でした。さらに分散だけでなく平均値を見たり、ヒストグラムからデータの分布を見る癖をつけると、データに対する理解が深まること間違いなしでしょう!

ウマたん
ウマたん
基本統計量を見ることで、データからたくさんのことがわかるんだ!

また、そうしたデータサイエンスの力を身に付けるためにはスタビジの記事やスクールを活用すると良いでしょう。

そして僕の経験を詰め込んだデータサイエンス特化のスクール「スタアカ(スタビジアカデミー)」を運営していますので,興味のある方はぜひチェックしてみてください!

AIデータサイエンス特化スクール「スタアカ」

スタアカトップ
【価格】ライトプラン:1280円/月
プレミアムプラン:149,800円
【オススメ度】
【サポート体制】
【受講形式】オンライン形式
【学習範囲】データサイエンスを網羅的に学ぶ
実践的なビジネスフレームワークを学ぶ
SQLとPythonを組みあわせて実データを使った様々なワークを行う
マーケティングの実行プラン策定
マーケティングとデータ分析の掛け合わせで集客マネタイズ

データサイエンティストとしての自分の経験をふまえてエッセンスを詰め込んだのがこちらのスタビジアカデミー、略して「スタアカ」!!

当メディアが運営するスクールです。

24時間以内の質問対応と現役データサイエンティストによる複数回のメンタリングを実施します!

カリキュラム自体は、他のスクールと比較して圧倒的に良い自信があるのでぜひ受講してみてください!

他のスクールのカリキュラムはPythonでの機械学習実装だけに焦点が当たっているものが多く、実務に即した内容になっていないものが多いです。

そんな課題感に対して、実務で使うことの多いSQLや機械学習のビジネス導入プロセスの理解などもあわせて学べるボリューム満点のコースになっています!

Pythonが初めての人でも学べるようなカリキュラムしておりますので是非チェックしてみてください!

ウォルマートのデータを使って商品の予測分析をしたり、実務で使うことの多いGoogleプロダクトのBigQueryを使って投球分析をしたり、データサイエンティストに必要なビジネス・マーケティングの基礎を学んでマーケティングプランを作ってもらったり・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践してもらったりする盛りだくさんの内容になってます!

・BigQuery上でSQL、Google Colab上でPythonを使い野球の投球分析
・世界最大手小売企業のウォルマートの実データを用いた需要予測
・ビジネス・マーケティングの基礎を学んで実際の企業を題材にしたマーケティングプランの策定
・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践して稼ぐ

データサイエンスに関する記事はこちら!

【初心者必見】統計学入門に必要な知識と独学勉強方法を簡単に学ぼう!当ブログ【スタビジ】の本記事では、統計学入門に必要な知識をカンタンにまとめ、それらをどのように効率的に独学で勉強していけばよいかをお話ししていきます。統計学は難しいイメージが少しありますが、学び方をしっかり考えれば大丈夫!...
デーサイエンス本
【データサイエンティスト厳選18冊】データサイエンスを学ぶ上でオススメな本・教材!当ブログ【スタビジ】の本記事では、データサイエンスを学ぶ上でオススメできる本を厳選して紹介していきます。ここではデータサイエンティストになるために習得するスキルをデータサイエンスと称しております。いくつかの観点に切り分けて見ていきます。...

データサイエンスを勉強できるスクールやサイトは、ぜひこちらを参考にしてみてください!

データサイエンティスト スクール
【徹底比較】データサイエンティストのための学習ができるスクール9選! スクール名 オススメ度 価格の安さ サポート体制 公式サイト テックアカデミー ...
スタビジアカデミーでデータサイエンスをさらに深く学ぼう!

スタアカサービスバナースタビジのコンテンツをさらに深堀りしたコンテンツが動画と一緒に学べるスクールです。

プレミアムプランでは私がマンツーマンで伴走させていただきます!ご受講お待ちしております!

スタビジアカデミーはこちら