ファインチューニングと転移学習の違いやChatGPTをPythonでファインチューニングする方法！

ウマたん

当サイト【スタビジ】の本記事では、話題のAIで重要なファインチューニングについて解説していきます。ファインチューニングと同じく色々なところで聞かれる転移学習と混同されていることが多いのでそちらについても言及していきます！またPythonを使って実際にChatGPTのファインチューニングも行います。

こんにちは！

データサイエンティストのウマたん(@statistics1012)です！

この記事ではAIや機械学習領域において非常に重要なファインチューニングについて解説していきたいと思います！

ファインチューニングは今後上手くAIと付き合っていく上でぜひ身につけておきたい知識ですのでしっかり理解しておきましょう。

以下の動画でも解説しているのであわせてチェックしてみてください！

ファインチューニングとは
ファインチューニングと転移学習の違い
ChatGPTをPythonでファインチューニングしてみよう！
ファインチューニング　まとめ

ファインチューニングとは

ファインチューニングというアプローチは以前からあったのですが、ChatGPTをはじめとした生成系AIのブームで様々なところでよく聞かれるようになりました。

ファインチューニングとはザックリ言うと、「事前に学習されたモデルに対して手元のデータセットを元に再学習させてモデルのパラメータを調整して特定のタスクに適用させるようなモデルを生成する」アプローチを指します。

AIの学習には大量のデータセットが必要ですが、一般にそこまでデータセットを用意するのは難しいことが多いですし、用意できたとしても多大な費用と時間がかかってしまいます。

そこで元々誰かが用意してくれている事前学習済みモデルを利用して、費用と時間を削減した上で自分の解きたい特定のタスクに合わせたモデルを作成していくのです。

ファインチューニングでは既存モデルのパラメータを調整しますが、一般的には下位層（低レベルな特徴）は固定し、上位層（高レベルな特徴）の一部または全部を再学習します。

例えばニューラルネットワークで日本人の顔を分類するモデルを作ったとしましょう！その際に下位層は顔の輪郭などの一般的な特徴を学習しており、上位層は顔の特定のパーツなどの細かい特徴を学習する場合が多いです。

そしてこのモデルを元にファインチューニングをしてアメリカ人の顔を分類するモデルを作るとしましょう！

この際、下位層で学習した大まかな顔の輪郭などは日本でもアメリカでも同じなのでパラメータを変えずに固定のままでよいでしょう。

一方で上位層で学習していた顔のパーツなどは日本人とアメリカ人で変わってくる可能性が高いので新しいデータセットでパラメータをチューニングします。

ファインチューニングはこのようなイメージなんです！

ファインチューニングと転移学習の違い

それではファインチューニングと同じくよく色んなところで聞かれる転移学習とはどんな手法なのでしょうか？

実はファインチューニングは転移学習の一種の手法であり、転移学習自体は「他のタスクで得た知識を他のタスクに適用させる」アプローチ全体を指します。

ロボたん

え！？転移学習とファインチューニングって同じじゃないの？

ウマたん

転移学習のアプローチの1つであるファインチューニングの方が色んなところで聞かれるし、転移学習の中でもファインチューニングが最も使われるから転移学習＝ファインチューニングみたいな感じで思われることが多いんだ！

結構分かりにくく違いも曖昧で混乱を招きやすいのですが、、、あくまで転移学習の方が広い概念なのです。

海外のサイトで以下のサイトに転移学習の手法のいくつかが取り上げられています。

ChatGPTをPythonでファインチューニングしてみよう！

それでは、最後にChatGPTをPythonでファインチューニングする方法について見ていきましょう！

正確にはChatGPTのベースとなっているGPTのモデルをファインチューニングする方法になります。

まずはOpenAIのAPIを取得する必要があります。

OpenAIのサイトからsign upしてください。

登録できたら右上のプロフィールの箇所からView API keysを選びましょう。

そして、API Keysを選択しCreate new secret keyを押下して自分のAPIキーをメモしておいてください。

これでOpenAIへの登録とAPIの取得は完了です。

それでは実際にPythonを使っていきましょう！ご自身のPCでPythonの環境が整っていない場合はGoogle Colabなどを使うとよいでしょう！

まず今回ファインチューニングする際にAIに食わせる学習データを用意していきます。

以下のようなJSON形式で用意してあげてください。

{"prompt": "<prompt text>", "completion": "<ideal generated text>"}
{"prompt": "<prompt text>", "completion": "<ideal generated text>"}
{"prompt": "<prompt text>", "completion": "<ideal generated text>"}
...

プロンプトと回答が対になるようなJSON形式のファイルです。

今回は以下のようにシンプルなプロンプトと回答をJSON形式で用意しました。

{"prompt": "スタビジとはどんなサービスですか？", "completion": "スタビジは、ビジネスに活かせるデータサイエンスに関して実務を通して学んだことを発信するメディアです。データサイエンスって本当は面白いんだよ！ってことを知ってもらうためにどこよりも分かりやすく発信しています！"}

準備が完了したのでPythonでコードを書いていきましょう！

まずはライブラリをインポートし、先ほど取得したAPIキーをセットします。

import openai
import json

openai.api_key = "<OpenAIのAPIキー>"

続いて先ほど用意したJSON形式のファイルをインポートしていきます。

path = "<JSONファイルのパス>"
training_file = openai.File.create(file=open(path, "rb"), purpose="fine-tune")

print(training_file)

続いて

# ファインチューニング
FineTune = openai.FineTune.create(training_file = training_file.id, model = "davinci")

これでファインチューニングは完了です。

あとはファインチューニングの結果を待つだけ。以下のように記載してあげるとファインチューニングの経過が出力されます。

import datetime

job_id = FineTune["id"]

events = openai.FineTune.stream_events(job_id)
for event in events:
  print(f'{datetime.datetime.fromtimestamp(event["created_at"])} {event["message"]}')

以下のように出力されます。

ここで得られたUploaded modelを指定して呼び出してあげるとファインチューニング後のモデルにプロンプトを投げて回答を得ることができます！

response = openai.Completion.create(
  model="<ファインチューニング後のモデル>",
  prompt="スタビジとはどんなサービスですか？"
)

print(response['choices'][0]['text'])

非常に簡単にファインチューニングが出来るのがわかったと思います！ぜひ自分のデータを色々と食わせてファインチューニングを試してみましょう！

ファインチューニング　まとめ

ここまでで、AIを学ぶ上でおさえておきたいファインチューニングについて見てきました！

ちなみにファインチューニングと一緒に比較されることの多いzero shot, one shot , few shot learningについては以下の記事を参考にしてみてください！

zero shot, one shot , few shot learning について解説！ファインチューニングとの違いとは？当サイト【スタビジ】の本記事では、zero shot, one shot , few shot learningについて解説していきます！違いの若干分かりにくいファインチューニングとの違いについても解説していきますので合わせて学んでいきましょう！...

最近話題のAIについてより詳しくは当メディアが運営するスタアカの以下のコースを是非チェックしてみてください！

・スタアカ「13.大規模言語モデル（LLM）・生成系AIコース」
・スタアカ「プロンプトエンジニアリングコース」

スタアカは業界最安級のAIデータサイエンススクールです。

【価格】	ライトプラン：1280円/月プレミアムプラン：149,800円
【オススメ度】
【サポート体制】
【受講形式】	オンライン形式
【学習範囲】	データサイエンスを網羅的に学ぶ実践的なビジネスフレームワークを学ぶ SQLとPythonを組みあわせて実データを使った様々なワークを行うマーケティングの実行プラン策定マーケティングとデータ分析の掛け合わせで集客マネタイズ

・BigQuery上でSQL、Google Colab上でPythonを使い野球の投球分析
・世界最大手小売企業のウォルマートの実データを用いた需要予測
・ビジネス・マーケティングの基礎を学んで実際の企業を題材にしたマーケティングプランの策定
・Webサイト構築してデータ基盤構築してWebマーケ×データ分析実践して稼ぐ

＼今すぐ試す／スタアカの受講はこちら

AIデータサイエンスを学んで市場価値の高い人材になりましょう！

データサイエンスやAIの勉強方法は以下の記事でまとめています。