統計学

パラメトリックとノンパラメトリックについて分かりやすく解説!

記事内に商品プロモーションを含む場合があります
ウマたん
ウマたん
当サイト【スタビジ】の本記事では、統計学の世界でよくきくパラメトリックモデルとノンパラメトリックモデルの違いについて解説していきます。統計モデリングの世界へとつながっていくので統計学を学ぶ人にはぜひおさえておいて欲しい概念です。

こんにちは!

データサイエンティストのウマたん(@statistics1012)です。

ロボたん
ロボたん
統計について勉強しているとノンパラメトリックとかパラメトリックという言葉を聞くことがあるけど、イマイチどういうことなのか分かっていないんだよなー!
ウマたん
ウマたん
パラメトリック・ノンパラメトリックの概念は統計学において非常に重要だからしっかり理解しておこう!

この記事では、パラメトリック手法とノンパラメトリック手法について詳しくかつ分かりやすくまとめていきたいと思います!

パラメトリックとは?

parametric

まずは、パラメトリックについて押さえておきましょう!

そうすればノンパラメトリックについても簡単に理解できるはず!

パラメトリックは英語で「parametric」。

ウマたん
ウマたん
英語の字面を眺めているとなんだか分かってこない?
ロボたん
ロボたん
parameterと関係があるってこと・・・?
ウマたん
ウマたん
その通り!パラメトリックとは、parameter(パラメータ)に基づくデータを想定して行う手法群のことを指すんだ!

パラメトリックとは、その名の通りパラメータに基づくデータを表しています。

パラメータに基づくというのは、特定の分布を背後に想定しているということ。

正規分布

主に統計的検定の文脈で使われることが多く、t検定は正規分布を仮定しているのでパラメトリック検定の一種になります。

ノンパラメトリックとは?

parametric

パラメトリックが分かれば、ノンパラメトリックはもう分かりますよね!

すなわちパラメータに基づくか分からないデータを想定した手法群。

パラメータに基づかないので特定の分布を明確に定義できません。

ノンパラメトリック検定として有名なのはやカイ二乗検定やウィルコクソンの順位和検定など!

変数データが正規分布(データの分布が平均値に近い値の対象者が一番多く,平均値から離れるにしたがって左右対称に対象者が少なくなる釣り鐘型の分布)であるかどうかによって検定の種類が変わってくる.分布が正規分布であればパラメトリック検定を用い,正規分布でなければノンパラメトリック検定を用いる.
引用元:Google-“J School Health”

広義ではパラメトリック手法はパラメータに基づく手法でありノンパラメトリック手法はパラメータに基づかない手法なのですが、統計的検定の場面では正規分布かそうでないかと定義づけられることが多いです。

パラメトリックとノンパラメトリックの違い

parametric

さて、ここまでで何となくパラメトリックとノンパラメトリックの概念について分かっていただけたと思いますが、両者を使うことによる違いはどこにあるのでしょうか?

ロボたん
ロボたん
なんでもかんでもノンパラメトリック手法を使ってはいけないの?そもそもどうやってノンパラメトリック手法を使うべきかパラメトリック手法を使うべきか判断するの?
ウマたん
ウマたん
確かにパラメトリック検定とノンパラメトリック検定の定義は分かってもそれだけじゃイマイチ違いや使いどころが分からないよね!違いを明確にしておこうか!

検出力の違い

パラメトリック検定はデータの分布が正規分布であることを想定しているため,正規分布であれば正しい結果を導くことができ,ノンパラメトリック検定はデータの分布は想定しないため,データの分布がどのような形でも結果にそれほど影響を与えない検定方法となる.
引用元:Google-“J School Health”

パラメトリック手法を用いるとやはり特定の分布が想定されている分、検出力が高くなります。

パラメトリック手法が使える状況でノンパラメトリック手法を使ってしまうと、有意差を出せる場面なのに有意と言えないという結果に帰着してしまう可能性があります。

サンプル数が少ない時の信頼性

一方で、サンプル数が少ない場合は無理にパラメトリック手法を使わずにノンパラメトリック手法を使うことが推奨されています。

ロボたん
ロボたん
ノンパラメトリックは便利な反面、なんでもかんでも使ってしまってはダメなんだね!
ウマたん
ウマたん
まずはパラメトリック検定を適用できるかどうか考えてみるとよいよ!

セミパラメトリックという考え方

parametric

パラメトリックとノンパラメトリックの2つの考え方を組み合わせたセミパラメトリック手法があります。

これは、一部データに分布を仮定できるのですが、完全に特定の分布に沿わないという部分がミソです。

混合分布モデルが代表例です。

詳しくは以下を参照ください!

パラメトリックとノンパラメトリックの考え方 まとめ

パラメトリックやノンパラメトリックという考え方は必ず押さえておかなくてはいけない内容ではありませんが、統計学を語る上で非常に重要な考え方なので覚えておくとよいでしょう!

最後にパラメトリックとノンパラメトリックに関してまとめておきましょう!

■パラメトリックとは、パラメータに基づく特定の分布を背後に想定しているということ
■ノンパラメトリックとは、特定の分布を背後に想定していないということ

ウマたん
ウマたん
状況にあわせて使い分けできるといいね!

機械学習やデータサイエンスや統計学の勉強法は以下の記事でまとめているのでもっとより深く学びたい!という方はチェックしてみてください!

機械学習独学勉強ロードマップ
【5分で分かる】機械学習の独学勉強ロードマップを徹底的にまとめていく!当サイト【スタビジ】の本記事では、機械学習の独学勉強ロードマップについて徹底的にまとめていきます。機械学習をいきなり理論からしっかり勉強しようとすると挫折しかねません。そこで、この記事ではなるべく挫折しないロードマップをお伝えしてきますよ!...
【5分で分かる】データサイエンティストに必要なスキルと独学勉強ロードマップ!当サイト【スタビジ】の本記事では、データサイエンティストに求められるスキルとそれを身に付けるための勉強法について徹底的にまとめていきます!入門者でも、しっかりデータサイエンティストについて理解しある程度独学で駆け出しの状態までいけることを目指します。...
統計学入門に必要な知識と独学勉強方法を簡単に学ぼう!当ブログ【スタビジ】の本記事では、統計学入門に必要な知識をカンタンにまとめ、それらをどのように効率的に独学で勉強していけばよいかをお話ししていきます。統計学は難しいイメージが少しありますが、学び方をしっかり考えれば大丈夫!...

また、これらを一通り学べる「スタアカ(スタビジアカデミー)」というスクールを当メディアが運営していますので興味のある方は是非チェックしてみてください!

AIデータサイエンス特化スクール「スタアカ」

スタアカトップ
【価格】ライトプラン:1280円/月
プレミアムプラン:149,800円
【オススメ度】
【サポート体制】
【受講形式】オンライン形式
【学習範囲】データサイエンスを網羅的に学ぶ
実践的なビジネスフレームワークを学ぶ
SQLとPythonを組みあわせて実データを使った様々なワークを行う
マーケティングの実行プラン策定
マーケティングとデータ分析の掛け合わせで集客マネタイズ

データサイエンティストとしての自分の経験をふまえてエッセンスを詰め込んだのがこちらのスタビジアカデミー、略して「スタアカ」!!

当メディアが運営するスクールです。

24時間以内の質問対応と現役データサイエンティストによる複数回のメンタリングを実施します!

カリキュラム自体は、他のスクールと比較して圧倒的に良い自信があるのでぜひ受講してみてください!

他のスクールのカリキュラムはPythonでの機械学習実装だけに焦点が当たっているものが多く、実務に即した内容になっていないものが多いです。

そんな課題感に対して、実務で使うことの多いSQLや機械学習のビジネス導入プロセスの理解などもあわせて学べるボリューム満点のコースになっています!

Pythonが初めての人でも学べるようなカリキュラムしておりますので是非チェックしてみてください!

ウォルマートのデータを使って商品の予測分析をしたり、実務で使うことの多いGoogleプロダクトのBigQueryを使って投球分析をしたり、データサイエンティストに必要なビジネス・マーケティングの基礎を学んでマーケティングプランを作ってもらったり・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践してもらったりする盛りだくさんの内容になってます!

・BigQuery上でSQL、Google Colab上でPythonを使い野球の投球分析
・世界最大手小売企業のウォルマートの実データを用いた需要予測
・ビジネス・マーケティングの基礎を学んで実際の企業を題材にしたマーケティングプランの策定
・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践して稼ぐ

スタビジアカデミーでデータサイエンスをさらに深く学ぼう!

スタアカサービスバナースタビジのコンテンツをさらに深堀りしたコンテンツが動画と一緒に学べるスクールです。

プレミアムプランでは私がマンツーマンで伴走させていただきます!ご受講お待ちしております!

スタビジアカデミーはこちら