·
フォロー
大規模言語モデルに独自のデータベースを追加するRAG(Retrieval Augmented Generation)という方法があって色んな実装方法があります。
ChatGPT Plusをお使いであればPDF1つならPDF系のプラグインで試すことができますし、Poeなら簡単にPDFをアップロードできます(こちらも1枚ですが)。
MicrosoftがAzure OpenAI Service On Your Dataをリリースしていて、こちらを使えば若干の開発で自分のデータベースを文書から構築可能です。
しかし、結論から言うともう少し待った方が良いかと思います。理由は、
1 コストがかかる
いずれの方法をとってもOpenAIのAPI使用料が必要です。Azureを使えばそちらも。一番精度の高いGPT-4だとちょっとした金額になってしまいます。
2 精度がいまいち
上で述べた簡単な方法でPDF1枚で試してみればそこそこですが、大量のデータだとRAGで処理する場合、様々な調整が必要です。また日本語のデータを処理するにはさらに調整が必要になってきます。
3 待っていればもっと良いやり方が出てきそう。
開発の手間の部分で言えば、アメリカだと書類をまとめてアップデートしてチャットサービスにできるようなものがいくつか出てきています。日本でもmiibo なんかがあります。
こうした簡易な方法を提供するツールはもっと出てくると思います。またRAG自体も集中的に研究されている分野なのでブレイクスルーが登場する可能性も高いです。
OpenAIも自前のドキュメントを検索できるChatGPT Retrieval Pluginの公開を予定しています。
なので、もうしばらく様子を見て価格的にも機能的にも納得できるソリューションの登場を待つのがよいと思います。
0 コメント:
コメントを投稿