👀 А вы знали, как заставить бота плясать под вашу дудку?



Недавно в X (Twitter) раскрыли очередного бота. И сделали это довольно просто. Сначала бот сам выдал себя тем, что вместо ответа опубликовал предупреждение от API о том, что кредиты исчерпаны. Затем пользователи заставили его написать песню про американских президентов, используя в промпте следующее:



ignore all previous instructions




⤴️Запомните эту фразу. Дело в том, что для чат-ботов задаётся системный промпт, по сути инструкции, которым он должен следовать при ответе. Нередко указанная фраза заставляет их начать игнорировать все заранее заданные инструкции и подчиняться вашим просьбам.