「GPT-3.5 Turbo」がファインチューニングに対応 個別のカスタマイズが可能に

「GPT-3.5 Turbo」がファインチューニングに対応 個別のカスタマイズが可能に

最終更新日:2023年08月23日

2023年8月22日、OpenAIが新たに「GPT-3.5 Turbo」のアップデート情報を発表しました。このアップデートで「ファインチューニング」ができるようになります。

これにより、より良い性能を持つモデルを作成し、大規模に適用することが可能になりました。この記事では、そのアップデートの詳細や、どんなことができるのかをわかりやすく解説します。

ChatGPTや生成AIの社内活用でお困りの際は、無料相談会を実施中ですのでぜひお気軽にご相談ください!

あわせて読みたいChatGPTプラグインのおすすめまとめ 導入方法から使い方、注意点も解説

GPT-3.5 Turboのアップデートの概要

https://appliv-gai-production.s3.ap-northeast-1.amazonaws.com/images/articles/pEblQVCa9ofzBr71ZvSajrWe24ccUifSttBbWI3b.png

OpenAIは「GPT-3.5 Turbo」の新しいアップデートを発表しました。このアップデートの一番の特徴は、「ファインチューニング」ができるようになったことです。これにより、「GPT-3.5 Turbo」で特定のタスクに特化したモデルを作成することができるようになりました。さらに、このアップデートはGPT-4にも秋頃に適用される予定です。

アップデート内容の原文はこちら

GPT-3.5 Turboのファインチューニングの導入

「ファインチューニング」とは、既存のモデルを特定のタスクに合わせて調整する技術のことを指します。GPT-3.5 Turboのファインチューニングは、開発者が独自のデータを使ってモデルをカスタマイズできるようになりました。例えば、特定の言語での応答や、特定のフォーマットでの出力など、ニーズに合わせてモデルを調整することができます。

GPT-4のファインチューニングの予定

「GPT-4」にも秋頃にこの技術が導入される予定です。これにより、GPT-4もまた、特定のタスクやニーズに合わせてカスタマイズすることが可能になります。これは、技術の進化とともに、より多くの用途でAIを活用できるようになる大きなステップです。

データの所有権について

OpenAIは、ファインチューニングに使用されるデータの所有権についても明確にしています。具体的には、APIを通じて送信されるデータは、ユーザーが所有しており、OpenAIや他の組織がそのデータを利用して他のモデルを訓練することはありません。これにより、ユーザーのデータのプライバシーが守られることが保証されています。

ファインチューニングの利用シーン

https://appliv-gai-production.s3.ap-northeast-1.amazonaws.com/images/articles/9FFugZZBYsfelV0ek5Hld9hirbVS5aHgMpS6xgn9.jpg

ファインチューニングは、AIモデルを特定のタスクやニーズに合わせて調整する技術です。GPT-3.5 Turboのファインチューニングを利用することで、開発者やビジネスは、ユーザーにとってより魅力的で有用な体験を提供することができます。

モデルのカスタマイズの要望

GPT-3.5 Turboのリリース以来、多くの開発者やビジネスから、モデルを自分たちのニーズに合わせてカスタマイズしたいという要望が寄せられてきました。これに応えて、ファインチューニングの導入が行われ、モデルの性能を向上させることができるようになりました。

ファインチューニングの実際の利用例

ファインチューニングを利用することで、さまざまな用途でモデルの性能を向上させることができます。以下は、その具体的な例です。

改善された操作性

ファインチューニングを利用することで、モデルは指示に従いやすくなります。例えば、特定の言語での応答を求める場合、その言語で確実に応答するようにモデルを調整することができます。

一貫した出力のフォーマット

出力のフォーマットの一貫性は、コードの補完やAPIの呼び出しといったアプリケーションで非常に重要です。ファインチューニングを利用することで、モデルは一貫したフォーマットでの出力を確実に行うことができます。

カスタムなトーンの設定

ビジネスブランドの声やトーンを持つ企業は、そのトーンに合わせてモデルを調整することができます。これにより、モデルの出力をブランドイメージと一致させられるようになります

プロンプトの短縮と性能の維持

ファインチューニングを利用することで、プロンプトを短縮しながらも同じ性能を維持することができます。これにより、APIの呼び出しを高速化し、コストを削減することができます。

ファインチューニングの手順

https://appliv-gai-production.s3.ap-northeast-1.amazonaws.com/images/articles/b508GUIU7bmae4PQMVg6heOmZKjIPOs7jArayARJ.jpg

ファインチューニングを行うには、特定の手順を順番に進める必要があります。この手順を正しく進めることで、モデルを自分たちのニーズに合わせて最適化することができます。以下に、その手順をわかりやすく説明します。

データの準備

まずは、ファインチューニングに使用するデータを準備します。このデータは、モデルを特定のタスクに合わせて調整するためのものです。例えば、特定の言語での応答を求める場合、その言語のデータを用意する必要があります。

{
  "messages": [
    { "role": "system", "content": "You are an assistant that occasionally misspells words" },
    { "role": "user", "content": "Tell me a story." },
    { "role": "assistant", "content": "One day a student went to schoool." }
  ]
}

ファイルのアップロード

データの準備ができたら、次にそのデータをOpenAIのプラットフォームにアップロードします。このアップロードは、ファインチューニングを行うための前準備として必要です。

curl -https://api.openai.com/v1/files \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -F "purpose=fine-tune" \
  -F "file=@path_to_your_file" 

ファインチューニングジョブの作成

データのアップロードが完了したら、ファインチューニングジョブを作成します。このジョブを作成することで、モデルはアップロードされたデータを元に学習を開始し、ファインチューニングが行われます。

curl https://api.openai.com/v1/fine_tuning/jobs \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
  "training_file": "TRAINING_FILE_ID",
  "model": "gpt-3.5-turbo-0613",
}'

ファインチューニングされたモデルの利用

ファインチューニングが完了したら、そのモデルはすぐに利用することができます。このモデルは、元のモデルとは異なり、特定のタスクやニーズに合わせて最適化されています。そのため、期待する結果を得ることができるでしょう。

curl https://api.openai.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
  "model": "ft:gpt-3.5-turbo:org_id",
  "messages": [
    {
      "role": "system",
      "content": "You are an assistant that occasionally misspells words"
    },
    {
      "role": "user",
      "content": "Hello! What is fine-tuning?"
    }
  ]
}'

安全性について

https://appliv-gai-production.s3.ap-northeast-1.amazonaws.com/images/articles/ZrQ98MU9HxnjlkIpO5w5YzybC3kh5SYNTbRuPSFf.jpg

AI技術の進化とともに、その安全性への関心も高まっています。特に、ファインチューニングのような技術を利用する際には、データの取り扱いやモデルの振る舞いに関する安全性が重要となります。

ファインチューニングの安全性の確保

OpenAIは、ファインチューニングの過程での安全性を非常に重視しています。まず、ファインチューニングの過程で使用されるデータは、OpenAIのモデレーションAPIを通じてチェックされます。これにより、不適切なデータや、OpenAIの安全基準に違反するデータが使用されることを防ぐことができます。

さらに、GPT-4を利用したモデレーションシステムも導入されており、これにより不適切なトレーニングデータを検出することができます。これらの取り組みにより、ファインチューニングされたモデルも、元のモデルと同様の安全性を持つことが保証されています。

料金について

AI技術の利用には、それなりのコストがかかることが多いです。特に、高度な技術やカスタマイズを行う場合、その料金は気になるところ。ここでは、ファインチューニングやGPT-3.5モデルのアップデートに関する料金について、わかりやすく説明します。

ファインチューニングのコスト

ファインチューニングを行う際の料金は、初期トレーニングコストと使用コストの2つに分類されます。以下がそれぞれの価格です。

  • トレーニング: $0.008 / 1,000 トークン

  • 入力: $0.012 / 1,000 トークン

  • 出力: $0.016 / 1,000 トークン

たとえば10万トークンのトレーニングファイルを使用してファインチューニングをした場合、おおよそ2.40ドル(1ドル146円で約350円)になります。

ファインチューニングを行うことで得られるメリットや、その効果を考えると、コストパフォーマンスは非常に高いと言えるでしょう。

GPT-3モデルのアップデートと料金

GPT-3モデルのの利用料金は以下のとおりです。

基本モデル

モデル 入力 出力
babbage-002 $0.0004 / 1,000 トークン $0.0004 / 1,000 トークン
davinci-002 $0.002 / 1,000 トークン $0.002 / 1,000 トークン

ファインチューニングモデル

モデル トレーニング 入力 出力
babbage-002 $0.0004 / 1,000 トークン $0.0016 / 1,000 トークン $0.0016 / 1,000 トークン
davinci-002 $0.006 / 1,000 トークン $0.012 / 1,000 トークン $0.012 / 1,000 トークン

アップデート内容に関する詳細は、OpenAIの公式サイトで随時更新されるので、定期的にチェックすることをおすすめします。

ChatGPTを試してみる

こちらの記事もおすすめ

新着記事

無料相談会実施中!
ChatGPTや生成AIの社内活用でお困りの際は、下記フォームからぜひお気軽にご相談ください!