こんにちは!
消費財メーカーでデジタルマーケティングやらデータサイエンスやらをやっているウマたん(@statistics1012)です。
この記事では、パラメトリック手法とノンパラメトリック手法について詳しくかつ分かりやすくまとめていきたいと思います!
目次
パラメトリックとは?

まずは、パラメトリックについて押さえておきましょう!
そうすればノンパラメトリックについても簡単に理解できるはず!
パラメトリックは英語で「parametric」。
パラメトリックとは、その名の通りパラメータに基づくデータを表しています。
パラメータに基づくというのは、特定の分布を背後に想定しているということ。
主に統計的検定の文脈で使われることが多く、t検定は正規分布を仮定しているのでパラメトリック検定の一種になります。
ノンパラメトリックとは?

パラメトリックが分かれば、ノンパラメトリックはもう分かりますよね!
すなわちパラメータに基づくか分からないデータを想定した手法群。
パラメータに基づかないので特定の分布を明確に定義できません。
ノンパラメトリック検定として有名なのはやカイ二乗検定やウィルコクソンの順位和検定など!
変数データが正規分布(データの分布が平均値に近い値の対象者が一番多く,平均値から離れるにしたがって左右対称に対象者が少なくなる釣り鐘型の分布)であるかどうかによって検定の種類が変わってくる.分布が正規分布であればパラメトリック検定を用い,正規分布でなければノンパラメトリック検定を用いる.
引用元:Google-“J School Health”
広義ではパラメトリック手法はパラメータに基づく手法でありノンパラメトリック手法はパラメータに基づかない手法なのですが、統計的検定の場面では正規分布かそうでないかと定義づけられることが多いです。
パラメトリックとノンパラメトリックの違い

さて、ここまでで何となくパラメトリックとノンパラメトリックの概念について分かっていただけたと思いますが、両者を使うことによる違いはどこにあるのでしょうか?
検出力の違い
パラメトリック検定はデータの分布が正規分布であることを想定しているため,正規分布であれば正しい結果を導くことができ,ノンパラメトリック検定はデータの分布は想定しないため,データの分布がどのような形でも結果にそれほど影響を与えない検定方法となる.
引用元:Google-“J School Health”
パラメトリック手法を用いるとやはり特定の分布が想定されている分、検出力が高くなります。
パラメトリック手法が使える状況でノンパラメトリック手法を使ってしまうと、有意差を出せる場面なのに有意と言えないという結果に帰着してしまう可能性があります。
サンプル数が少ない時の信頼性
一方で、サンプル数が少ない場合は無理にパラメトリック手法を使わずにノンパラメトリック手法を使うことが推奨されています。
セミパラメトリックという考え方

パラメトリックとノンパラメトリックの2つの考え方を組み合わせたセミパラメトリック手法があります。
これは、一部データに分布を仮定できるのですが、完全に特定の分布に沿わないという部分がミソです。
混合分布モデルが代表例です。
詳しくは以下を参照ください!
パラメトリックとノンパラメトリックの考え方 まとめ
パラメトリックやノンパラメトリックという考え方は必ず押さえておかなくてはいけない内容ではありませんが、統計学を語る上で非常に重要な考え方なので覚えておくとよいでしょう!
最後にパラメトリックとノンパラメトリックに関してまとめておきましょう!
■パラメトリックとは、パラメータに基づく特定の分布を背後に想定しているということ
■ノンパラメトリックとは、特定の分布を背後に想定していないということ
統計学についてより詳しく学びたい方は、以下の記事にジャンル別書籍をまとめていますのでよければご覧ください!
統計学について詳しく学びたい方は、ぜひ以下の記事を見てみてください!
