В рамках основной деятельности недавно написал программу для категоризации контента. Задачей было просмотреть несколько сотен статей, составить их краткое содержание, присвоить тэги и категории. Это отличный пример интеграции творчески мыслящей языковой модели и чётко исполняемого программного кода.



Ключевой элемент — правильно сформулированное системное сообщение. Я указываю модели ChatGPT отвечать в формате JSON и предоставляю два примера правильных ответов. Посмотреть моё системное сообщение можно здесь.



При первом запуске программа успешно классифицировала 255 статей за 15 минут, не выдав ни одного некорректного JSON. Общая стоимость запросов к ChatGPT 3.5 составила $0.77. В ручном режиме на прочтение этих статей ушло бы около 12 часов, не считая времени на составление кратких аннотаций. На данный момент я классифицировал уже несколько тысяч статей.



Полный код программы доступен на моем GitHub, а более подробное описание процесса есть в посте на английском языке. Видео демонстрирует, как программа работает в терминале, а результаты автоматически заносятся в Airtable.



Напоминаю что ПРОСТОБОТ тоже позволяет использовать системные сообщения при работе с ним.