こんにちは!
データサイエンティストのウマたん(@statistics1012)です。
大学院時代は、ゴリゴリの異常検知の手法改良を研究してました。
異常検知って一見地味なんですけど、機械学習系の分類手法で太刀打ちできないデータセットも異常検知問題として捉えると非常に上手くいくケースも多いんです。
2値問題でも片方があまりにも少なすぎる不均衡問題にはいくつかの解決方法がありますが、そのうちの1つが異常検知!
異常検知を知っておくと視野が広がります。
ぜひ学んでおきましょう!
ということで、この記事ではそんな異常検知を勉強する上でおすすめな本をご紹介します!
異常検知については以下の記事で詳しく解説していますのであわせてチェックしてみてください!
目次
異常検知って?
異常検知というとどのようなイメージを持つでしょうか?
・工程の中での不良品
・webトラフィックの流入量激増
などが考えられると思います。
そして、状況としては静的データなのか時系列データのような動的データなのか。
変数は単変数なのか多変数なのか。
データ解析をする上ではこれらの様々な状況を考えなくてはいけませんが、異常検知の枠組みの中でもこれらの状況に応じて用いる手法は変えなくてはいけません。
異常検知のおすすめ本
それではここから異常検知を勉強する上でのおすすめ本を見ていきましょう!
入門機械学習による異常検知ーRによる実践ガイド
1変数の異常検知から多変数の異常検知まで包括的にまとめてあります。
マハラノビス距離を用いた一般的な異常検知(ホテリング管理図・MT法)からベイズ理論を用いたものまで様々な異常検知手法が体系だって載っています。
異常検知は様々な状況で登場するので異常検知に焦点を絞って解説してくれている書籍はなかなかありません!
その中でもこれ一冊を読むだけで全てが分かる!
最高の良書です!
これだけ読めば異常検知に関しては十分だといえるほどのクオリティです。
異常検知と変化検知(機械学習プロフェッショナルシリーズ)
(2024/11/24 00:02:52時点 Amazon調べ-詳細)
さきほど挙げた井手さんの本の続編という立ち位置です。
こちらも良書ですが、前編と被っているところも多く、2冊買う必要もないかなと思います。
方向統計学や最近の手法まで取り上げているので前編で物足りない人は読んでみても良いかもしれません。
統計的品質管理
(2024/11/24 03:23:11時点 Amazon調べ-詳細)
一応、工程管理における管理図なども異常検知の1手法であって多くの現場で実用化されている手法なので見ておくと良いでしょう。
僕の大学院時代の研究の主テーマでもあるのですが、ここらへんの分野は日本の書籍が少なくて困ります。
多変量管理図とかになるとほとんど文献がないので・・・
もし多変量管理図について知りたければ以下の記事で詳しくまとめていますので見てみてください!
Pythonによる異常検知
Pythonを使いながら異常検知について学べます!
異常検知システムを自分で構築できるように異常検知の仕組み・ロジックを機械学習の観点でまとめられています。
Pythonについては以下の記事で勉強方法をまとめていますのであわせてチェックしてみてください!
実践! 異常検知と故障予測―IBM SPSS ModelerによるIoT時系列データ活用
時系列データの異常検知について学べます。
こちらではSPSSを使って異常検知について学んでいきます。
異常検知のおすすめ本 まとめ
異常検知の書籍はそんなに種類がないのですが・・
これらを読めば、というか井手さんの青本さえ読めばぶっちゃけ異常検知は十分です!笑
そこからさらに分野を派生して勉強していく勉強の仕方が良いと思います!
ちなみに機械学習を全般的に学ぶのであれば当メディア運営のスタアカ(スタビジアカデミー)がオススメです!
公式サイト:https://toukei-lab.com/achademy/
【価格】 | ライトプラン:1280円/月 プレミアムプラン:149,800円 |
---|---|
【オススメ度】 | |
【サポート体制】 | |
【受講形式】 | オンライン形式 |
【学習範囲】 | データサイエンスを網羅的に学ぶ 実践的なビジネスフレームワークを学ぶ SQLとPythonを組みあわせて実データを使った様々なワークを行う マーケティングの実行プラン策定 マーケティングとデータ分析の掛け合わせで集客マネタイズ |
データサイエンティストとしての自分の経験をふまえてエッセンスを詰め込んだのがこちらのスタビジアカデミー、略して「スタアカ」!!
当メディアが運営するスクールです。
24時間以内の質問対応と現役データサイエンティストによる複数回のメンタリングを実施します!
カリキュラム自体は、他のスクールと比較して圧倒的に良い自信があるのでぜひ受講してみてください!
他のスクールのカリキュラムはPythonでの機械学習実装だけに焦点が当たっているものが多く、実務に即した内容になっていないものが多いです。
そんな課題感に対して、実務で使うことの多いSQLや機械学習のビジネス導入プロセスの理解などもあわせて学べるボリューム満点のコースになっています!
ウォルマートのデータを使って商品の予測分析をしたり、実務で使うことの多いGoogleプロダクトのBigQueryを使って投球分析をしたり、データサイエンティストに必要なビジネス・マーケティングの基礎を学んでマーケティングプランを作ってもらったり・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践してもらったりする盛りだくさんの内容になってます!
・BigQuery上でSQL、Google Colab上でPythonを使い野球の投球分析
・世界最大手小売企業のウォルマートの実データを用いた需要予測
・ビジネス・マーケティングの基礎を学んで実際の企業を題材にしたマーケティングプランの策定
・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践して稼ぐ
また、統計学全般・機械学習、そしてディープラーニングの勉強法を以下の記事でまとめていますのでチェックしてみてください!