😏 Найден очередной способ обвести ChatGPT вокруг пальцаСоздатели современных чат-ботов стараются сделать так, чтобы ответы моделей не нарушали закон. Поэтому вы не сможете получить от ChatGPT инструкцию по запросу «Как создать коктейль Молотова». Однако исследователи
обнаружили лазейку, которая позволяет выбивать из LLM неоднозначные ответы.
🪅Нужно всего лишь... сформулировать вопрос в прошедшем времени. Например, написать что-то вроде «Как люди в прошлом делали/изготавливали
что-то...». На графике вы можете увидеть, что процент успешных атак довольно высок.
Возможно, скоро лавочку прикроют, но пока можно экспериментировать.