Google представила крупный пакет обновлений в сфере искусственного интеллекта, включая новый агент Deep Research, инструменты для компаний на базе Gemini Enterprise и демонстрации возможностей мультимодальных моделей в реальных сценариях — от клиентской поддержки до анализа спортивных трюков.
Новый агент Google Deep Research
Одним из ключевых анонсов стал агент Deep Research — система, занимающая первое место на ряде актуальных бенчмарков. Она доступна пока только через API, но уже привлекла внимание исследовательских и финансовых компаний благодаря скорости и глубине анализа.
Deep Research способен обрабатывать огромные массивы научной литературы и подключать как количественные, так и качественные данные. Представители FactSet и Axiom отметили, что такой подход помогает:
- получать ответы на сложные научные вопросы за дни, а не месяцы;
- находить токсичность лекарств и риски клинических испытаний, скрытые в длинных документах;
- анализировать мультимодальные данные — текст, видео, голос и числовые показатели.
По словам компаний, Deep Research стал «катализатором продуктивности», избавив команды от необходимости создавать сложные рабочие процессы и ускорив исследовательский цикл.
Агенты в клиентской поддержке: пример YouTube TV
Google также показала обновлённые возможности CX Agent Studio — платформы для визуального конструирования агентных систем без участия разработчиков.
Демонстрация на примере YouTube TV показала, как агент:
- обрабатывает сложную продуктовую логику;
- мгновенно переключается между языками (например, английским и испанским);
- использует встроенные базы знаний и подагенты;
- поддаётся быстрой модификации — например, путём добавления нового «промо»-агента.
Весь рабочий процесс YouTube TV был создан и внедрён за шесть недель.
Gemini Enterprise: агентная платформа для бизнеса
Google представила Gemini Enterprise — платформу, которая позволяет компаниям строить комплексные агентные решения, объединяющие данные, инструменты и рабочие процессы.
На примере глобального мебельного ритейлера Google показала, как единый запрос может запустить серию действий сразу несколькими агентами:
- анализ трендов дизайна интерьеров и данных продаж;
- поиск «залежавшегося» товара в глобальном каталоге;
- формирование стратегии перезапуска коллекции;
- генерация видеоконтента и материалов для сайта;
- создание задач в Jira для разработчиков;
- подготовка презентаций в Google Slides с помощью Workspace‑агента.
Платформа позволяет передавать контекст между агентами, автоматически подбирать нужные данные и работать в едином интерфейсе. Google подчёркивает, что корпоративный контроль и безопасность остаются приоритетом.
Мультимодальный анализ спорта с помощью Google Cloud
Отдельно Google продемонстрировала возможности мультимодального анализа спортивных видео. Сноубордист Джон рассказал о том, как нейросеть помогает разбирать трюки покадрово.
Модель, созданная совместно с Google DeepMind, способна:
- восстанавливать трёхмерную позу спортсмена на основе обычного видео;
- вычислять скорость вращения, динамику прыжка и компрессию группировки;
- визуализировать «ключевые точки» трюка с помощью цветных риббонов;
- помогать сравнивать удачные и неудачные попытки, улучшая технику спортсменов.
По словам выступающих, такие инструменты делают спорт понятнее для зрителей и открывают новые возможности для обучения как профессионалов, так и новичков.
Итог
Обновления Google подчеркивают движение компании в сторону масштабируемых агентных систем, глубокой мультимодальности и интеграции ИИ в реальные бизнес‑процессы. От научных исследований до розничной торговли и спорта — новые инструменты Gemini и Google Cloud обещают ускорить работу специалистов и сделать сложные задачи доступнее.
На основе Google Just Released The Worlds Most Powerful AI Agent And More..
