
Alibaba выпустиили модель Qwen2.5-VL — она умеет анализировать видео и изображения, писать код, а также конвертировать документы в HTML. Кроме того, модель может работать в роле ИИ-агента как Operator от OpenAI.
Согласно результатам бенчмарков, Qwen2.5-VL превосходит большинство популярных моделей в понимании видео, математике, анализе документов и ответах на общие вопросы.
Весь функционал бесплатный. Протестировать можно тут.
@typespace
Согласно результатам бенчмарков, Qwen2.5-VL превосходит большинство популярных моделей в понимании видео, математике, анализе документов и ответах на общие вопросы.
Весь функционал бесплатный. Протестировать можно тут.
@typespace