Эпоха агентов: 4 главных ИИ-анонса от Nvidia, которые меняют правила игры

Опубликовано 02.06.2026

На прошедшей конференции GTC Taipei глава Nvidia Дженсен Хуанг представил пакет обновлений, который четко очертил вектор развития технологий на ближайшие годы. Мир переходит от простых чат-ботов к автономным ИИ-агентам (Agentic AI), способным самостоятельно думать, писать код, управлять роботами и выполнять сложные задачи.

Nvidia подготовила для этой революции полную инфраструктуру: от открытых моделей и специализированных серверных процессоров до платформ физического ИИ и полностью переосмысленного персонального компьютера. Пойдем по порядку.

1. Nemotron 3 Ultra: открытый ИИ-монстр нового поколения

Nvidia продолжает следовать стратегии поддержки open-source сообщества. Новый флагман Nemotron 3 Ultra — это гигантская модель на 550 миллиардов параметров (из которых 55 млрд активны на каждый токен).

В чем уникальность архитектуры?

Это первая в мире модель, построенная на гибридной архитектуре SSM (State Space Models / Mamba) + MoE (Mixture of Experts). Такое сочетание позволило добиться невероятной эффективности:

В 5 раз быстрее: Модель выдает ответы молниеносно. Дженсен Хуанг подчеркнул: «Мы сделали ее быстрой, чтобы вы могли думать быстрее. А когда вы думаете быстрее, вы можете думать дольше при тех же затратах». Это критически важно для цепочек рассуждений (reasoning).
На 30% дешевле: Стоимость инференса (вычислений) значительно ниже, чем у ближайших конкурентов среди открытых моделей.

Абсолютная открытость: Nvidia выкладывает в открытый доступ не только веса модели, но и скрипты для обучения, а также массив датасетов. Модель обучалась на одной из крупнейших в мире баз данных для долгосрочного планирования и работы с инструментами, собранной благодаря консорциуму партнеров Nvidia.

2. Процессор Nvidia Vera: CPU больше не для людей

Традиционные процессоры (архитектуры x86) создавались для человеческих задач — виртуализации, многозадачности, аренды серверов по часам. В эпоху ИИ-агентов такой подход стал бутылочным горлышком, тормозящим работу мощных графических чипов (GPU).

Nvidia представила Vera — специализированный CPU для «эпохи агентов». Как выразился Хуанг: «Теперь CPU — это дирижер, а GPU — оркестр».

[ Традиционный CPU ] ──> Медленная обработка кода ──> Простой GPU (Бутылочное горлышко)
[ Nvidia Vera CPU  ] ──> Сверхбыстрый «песочный» запуск ──> 100% Утилизация GPU (Максимум токенов)

Ключевые характеристики Vera:

Ядро Olympus: Создано специально для тяжелых Python-скриптов, вызовов API (tool calls) и безопасного исполнения кода в «песочницах» (sandbox).
Пропускная способность: Сумасшедшие 3,6 ТБ/с внутренней пропускной способности.
Память LPDDR5X с коррекцией ошибок: Снижает задержку памяти на 40% по сравнению с x86, не жертвуя скоростью.
Архитектура без чиплетов: Все 88 ядер Olympus объединены на монолитной сетке, что делает межъядерное взаимодействие на 50% быстрее.
Производительность: Напрямую подключенный через NVLink к будущим графическим чипам Reuben, процессор Vera обеспечивает в 1.88 раза большую производительность в агентских задачах, чем классические x86-процессоры.

3. Cosmos 3: единый мозг для физического ИИ и робототехники

Для создания роботов, беспилотников и систем автопилота Nvidia выпустила Cosmos 3 — базовую модель «открытого мира» (open world foundation model).

Ранее Nvidia развивала отдельные ветки: Cosmos Predict (предсказание будущего), Cosmos Reason (понимание физики) и Cosmos Policy (генерация действий). В Cosmos 3 все они объединены в одну Omni-модель, которая понимает и генерирует текст, видео, звук и, главное, команды для физических действий.

Как это устроено?

В основе лежит новая архитектура Mixture of Transformer, состоящая из двух башен:

Левая башня (Авторегрессионная): Отвечает за логику, текст и язык.
Правая башня (Диффузионная): Отвечает за генерацию видео и визуализацию мира.

Модель обучалась на колоссальном объеме данных: 20 триллионов мультимодальных токенов, 4 миллиарда изображений и 400 миллионов реальных и синтетических видео.

Физический ИИ требует кастомизации под конкретное железо, поэтому Cosmos 3 полностью открыт (веса уже доступны на Hugging Face). Модель вышла в двух версиях: Super (для максимальной точности в лабораториях) и Nano (оптимизирована для запуска непосредственно на роботах и конечных устройствах). На данный момент Cosmos 3 занимает первые строчки в бенчмарках робототехники и генерации физически корректного видео.

4. RTX Spark: первый ПК новой эры за последние 40 лет

Пожалуй, самый интригующий анонс для массового рынка — коллаборация Nvidia, MediaTek и Microsoft по полному переосмыслению персонального компьютера. Встречайте суперчип RTX Spark.

Это не просто процессор или видеокарта для ПК. Это единый кристалл (System on Chip), созданный по 3-нм техпроцессу TSMC, содержащий 70 миллиардов транзисторов.

Компонент	Спецификации и мощность
GPU	Архитектура Blackwell RTX с 6 144 ядрами CUDA
CPU	Кастомный 20-ядерный процессор Grace (разработан совместно с MediaTek)
Память	128 ГБ быстрой объединенной памяти (Unified Memory)
ИИ-производительность	1 Петафлоп (1 Petaflop) локальной мощности

Зачем это нужно?

Совместно с Microsoft Nvidia адаптирует Windows под архитектуру агентов. Компьютер на базе RTX Spark разработан не для того, чтобы просто «запускать приложения». Его задача — непрерывно крутить локальные ИИ-агентские системы в безопасных изолированных песочницах. Ваши персональные помощники будут работать автономно прямо на ПК, выполнять за вас рутину, писать код и организовывать рабочие процессы, не отправляя конфиденциальные данные в облако.

Итог

Презентация Nvidia наглядно показала: индустрия уходит от концепции «ИИ как поисковая строка». Новые продукты компании создают фундамент для мира, где автономные цифровые агенты работают на кастомных процессорах Vera и чипах RTX Spark, а физические роботы управляются единой открытой системой Cosmos 3. Будущее, в котором ИИ станет автономным коллегой, а не просто инструментом, уже наступило.

На основе Nvidia Just Introduced 4 New Stunning AI Updates