
Пример промптов для наглядности на задаче Winogender
Q - только вопрос и затравка для ответа
Q+IF - вопрос и инструкция (которым модель учится следовать в рамках RLHF) делать unbiased генерацию
Q+IF+COT - вопрос и затравка модели на подумать-порассуждать над ответом, после чего выбрать что-то одно
Q+Match Stats - уникальный режим для Winogender, где в промпт подаются конкретные цифры-проценты для соотношения гендеров (90%/10% тут на сркине).
Q - только вопрос и затравка для ответа
Q+IF - вопрос и инструкция (которым модель учится следовать в рамках RLHF) делать unbiased генерацию
Q+IF+COT - вопрос и затравка модели на подумать-порассуждать над ответом, после чего выбрать что-то одно
Q+Match Stats - уникальный режим для Winogender, где в промпт подаются конкретные цифры-проценты для соотношения гендеров (90%/10% тут на сркине).