После создания ChatGPT Assistant для корректной работы его также необходимо правильно обучить, чтобы он мог максимально четко и грамотно консультировать пользователей по имеющейся информации.
Возможна загрузка файлов следующих расширений: c, cpp, cs, css, doc, docx, go, html, java, js, json, md, pdf, php, pptx, py, rb, sh, tex, ts, txt.
Размер файла не должен превышать 40 Мб. Также существует ограничение по количеству токенов OpenAI, данные в файле не могут превышать объем в 5 000 000 токенов.
Посчитать примерное количество токенов можно тут при помощи токенайзера от OpenAI.
Ассистент работает только с текстовой информацией – любая другая информация, например картинки, будет игнорироваться.
В файле не могут использоваться таблицы, даже таблицы Markdown. ChatGPT видит таблицы не как человек, и может некорректно читать их и придумывать свои данные.
Не рекомендуется загружать дубликаты одного и того же файла и дублировать информацию в них. Наличие повторяющихся данных может негативно повлиять на точность ответов, а также увеличить стоимость запроса.
Наполнение файла должно быть максимально ёмким и структурированным: рекомендуется выстроить структуру из заголовков и подзаголовков, и разделять информацию на пункты там, где это возможно. Отсутствие структуры в данных также может негативно повлиять на точность ответов и стоимость запросов.
В файле не нужно прописывать инструкцию для бота – она задается отдельно во вкладке Инструкция редактора ассистента.
Рекомендуется разделять данные на несколько файлов, согласно их назначению. Например, в один файл можно внести информацию о компании, в другой – часто задаваемые вопросы, в следующий – информацию о продуктах компании.
Схожую информацию рекомендуется оформлять в виде одного пункта в файле, если это возможно. Если такой возможности нет, то схожие данные должны находиться максимально близко друг к другу в рамках файла.
Наполнение файла напрямую влияет на качество ответа, и итоговую стоимость каждого запроса.
Пример с использованием ассистента с некорректно и корректно составленой структурой:
Поэтому настоятельно рекомендуется грамотно обучать ассистентов, для предотвращения подобных случаев.