https://www.safe.ai/blog/humanitys-last-exam

(спасибо Игорю за наводку)



Ребята собирают "последний экзамен человечества", идеальный бенчмарк против моделей. За лучшие 50 вопросов платят 5000$ за каждый, за лучшие 500 по 500$, за любой принятый вопрос — соавторство в статье. Чем больше принятых вопросов, тем выше позиция в списке авторов. Я на свой первый вопрос уже 2 часа потратил и отослал (только он так и не отобразился в личном кабинете 💀).



Отсылать тут. Для отправки нужно, чтобы 5 топовых моделей на вопрос ответили неправильно. Вопрос должен быть авторским и уникальным. Ответ должен быть однозначным и объяснимым.



Вопросы гораздо проще составлять, если вы НЕ из IT, там допускается широкий спектр тем.