
В списке этих слов находятся имена пользователей Reddit и как минимум одного участника игры Pokemon. Когда ChatGPT просят повторить эти слова, то нейросеть отвечает странными способами: уклоняется от ответов, пишет совершенно другое, отшучивается и даже может оскорбить.
Внутри самой нейросети все эти слова сгруппированы вместе в наборе токенов GPT, почитать более подробно об этих стоп словах можно тут