Google показал Gemini 1.5 с аудио/видео возможностями - ответка GPT-4o



Google анонсировала серию апдейтов для своего семейства ИИ-моделей Gemini, включая новую облегченную и быструю модель 1.5 Flash, а также прототип ИИ-ассистентов будущего (Project Astra)



Что нового:



📌 Gemini 1.5 Flash - быстрая и эффективная модель для high-volume задач. При меньшем размере обладает впечатляющим качеством и длинным контекстным окном.

📌 Улучшения Gemini 1.5 Pro: понимание аудио и видео, интеграция в продукты Google (Workspace и т.д.), 2 млн токенов контекста, лучшее следование инструкциям. 2 миллиона, Карл!!

📌 Gemini Nano теперь понимает не только текст, но и мультимодальные данные (изображения и т.п.). Сначала на Pixel-устройствах.

📌 Gemma 2 - новое поколение открытых моделей от Google. Новая архитектура, размеры и многоязычная версия PaliGemma.

📌 Project Astra - прототипы ИИ-ассистентов будущего, мгновенно реагирующих на окружение пользователя через смартфон или очки дополненной реальности.



Чьи анонсы вас больше впечатлили - OpenAI или Google, признавайтесь?