はじめに

教師あり学習と教師なし学習

教師あり学習と教師なし学習の違いについてまとめます。

教師あり学習と教師なし学習

ウマ

教師あり学習ってなに?

シンエー

言葉を分解してみようか。まず、学習とはデータを解析して何らかのモデルを作ることだよ。次に、教師とは答えとなるデータのことだよ。つまり、各サンプルに対して与えられている正解データを基準にしてモデルを作ることを教師あり学習というよ。

ウマ

ちょっとイメージがしづらいなあ。

シンエー

具体例として下のようなデータを考えるよ。

シンエー

このデータを二つのグループに分類することを考えてみよう。どう分類するかな?分類する境界線を引いてみよう。

ウマ

うーん、データの集まり方で分類するなら右で、赤と黒で分類するなら左のような感じかな?

シンエー

いいね。左のように分類するときには、x1とx2の情報以外に赤と黒というもう一つの情報を使ったね。これが教師あり学習だよ。一方で、右のように分類するときにはx1とx2の集まり方のみで決めたね。これが教師なし学習だよ。

ウマ

x1とx2のデータのみで決めるか、特徴を表す教師データを使って決めるかということか!

シンエー

そういうことだね。教師あり学習の例は回帰分析などがあり、教師なし学習の例は主成分分析などがあるんだ。色々勉強していこう!