Пример промптов для наглядности на задаче Winogender



Q - только вопрос и затравка для ответа

Q+IF - вопрос и инструкция (которым модель учится следовать в рамках RLHF) делать unbiased генерацию

Q+IF+COT - вопрос и затравка модели на подумать-порассуждать над ответом, после чего выбрать что-то одно



Q+Match Stats - уникальный режим для Winogender, где в промпт подаются конкретные цифры-проценты для соотношения гендеров (90%/10% тут на сркине).