IT.net ©️

xAI представила новую модель Grok-1.5 Vision Preview

Компания xAI Илона Маска сегодня представила свою первую мультимодальную модель. Она способна не только понимать текст, но и обрабатывать информацию в документах, диаграммах, графиках, скриншотах и фотографиях.

Grok-1.5 Vision скоро станет доступна для существующих пользователей Grok.

Модель может написать код по нарисованной от руки диаграмме, объяснить мем или сочинить сказку по детскому рисунку.

👀

Главной особенностью новой модели разработчики считают лучшее понимание реального мира. Например, можно отправить изображение ситуации на дороге и уточнить, надо повернуть или ехать прямо (не рекомендуем, правда, делать это за рулем).