Пользователь сравнил GPT-4o и Claude 3.5 Sonnet в... Майнкрафте.



Слева — постройка GPT-4o, справа — Claude 3.5 Sonnet. Обе модели получили одинаковый промт: построить яркий и красивый парящий город.



По словам пользователя, он придумал Mcbench - первый бенчмарк, измеряющий креативность, изобретательность и, самое главное, «вайб» ИИ-модели.



За объективность теста не ручаемся.



@typespace