xAI представила новую модель Grok-1.5 Vision Preview



Компания xAI Илона Маска сегодня представила свою первую мультимодальную модель. Она способна не только понимать текст, но и обрабатывать информацию в документах, диаграммах, графиках, скриншотах и фотографиях.



Grok-1.5 Vision скоро станет доступна для существующих пользователей Grok.



Модель может написать код по нарисованной от руки диаграмме, объяснить мем или сочинить сказку по детскому рисунку.



👀 Главной особенностью новой модели разработчики считают лучшее понимание реального мира. Например, можно отправить изображение ситуации на дороге и уточнить, надо повернуть или ехать прямо (не рекомендуем, правда, делать это за рулем).