
Пользователь сравнил GPT-4o и Claude 3.5 Sonnet в... Майнкрафте.
Слева — постройка GPT-4o, справа — Claude 3.5 Sonnet. Обе модели получили одинаковый промт: построить яркий и красивый парящий город.
По словам пользователя, он придумал Mcbench - первый бенчмарк, измеряющий креативность, изобретательность и, самое главное, «вайб» ИИ-модели.
За объективность теста не ручаемся.
@typespace
Слева — постройка GPT-4o, справа — Claude 3.5 Sonnet. Обе модели получили одинаковый промт: построить яркий и красивый парящий город.
По словам пользователя, он придумал Mcbench - первый бенчмарк, измеряющий креативность, изобретательность и, самое главное, «вайб» ИИ-модели.
За объективность теста не ручаемся.
@typespace