現在、LLM講座の受講者からの質問を回答するGPTsを開発中です。
講座の内容について回答ができるように事前に講座のセリフを
knowledge にアップロードする必要があります。
しかし、実際のセリフとセリフではないものを区別する必要があると考えました。
セリフでないものの例としては、Google Colab などで実行するプログラムコードや
読込対象となるファイルなどが該当します。
どのようにして、GPTs に認識させるかは、直接GPTsの構築画面で聞いてみました。
以下の方法が有効とのことでした。
・コメントブロックを活用
<!--
GPTへの注釈: ここにセリフでない情報を記述します
-->
・MarkDown の使用 ※こちらはセリフなどを整理するために使えそうでした
強調
**強調したい単語**
リスト
- リスト
- リスト
- リスト
番号リスト
1. 番号1
1. 番号2
1. 番号3
という事で以下のように knowledge をアップロードしてみました。
例
chatgpt に以下の質問をしてみましょう。
「test.csvというCSVから2023-12-10の最低気温を答えて。」
<!--
GPTへの注釈: 以下がtest.csvの情報となります
```csv
Date,Max Temperature,Min Temperature
2023-12-10,12,5
2023-12-11,13,7
2023-12-12,15,6
2023-12-13,14,5
2023-12-14,16,8
2023-12-15,17,10
2023-12-16,15,7
```
-->
以下のようにchatgpt から回答が出力されましたね。
「2023-12-10の最適気温は5度です。」
これでGPTsを構築後、質問してみました。
質問
「講座扱った最低気温を求めるためのcsvの内容を教えて下さい」
回答
講座で扱った最低気温を求めるためのCSVファイルの内容は以下の通りです:
Date,Max Temperature,Min Temperature
2023-12-10,12,5
2023-12-11,13,7
2023-12-12,15,6
2023-12-13,14,5
2023-12-14,16,8
2023-12-15,17,10
2023-12-16,15,7
以上のように、それらしい回答は返ってきましたので
とりあえず、この方針で knowledge を作成することに致しました。
とは言っても、この結果だけでは本当に充分であるかはわからないので
今後の開発状況に応じて fix していく可能性もあるかと思います。