На прошедшей конференции GTC Taipei глава Nvidia Дженсен Хуанг представил пакет обновлений, который четко очертил вектор развития технологий на ближайшие годы. Мир переходит от простых чат-ботов к автономным ИИ-агентам (Agentic AI), способным самостоятельно думать, писать код, управлять роботами и выполнять сложные задачи.
Nvidia подготовила для этой революции полную инфраструктуру: от открытых моделей и специализированных серверных процессоров до платформ физического ИИ и полностью переосмысленного персонального компьютера. Пойдем по порядку.
1. Nemotron 3 Ultra: открытый ИИ-монстр нового поколения
Nvidia продолжает следовать стратегии поддержки open-source сообщества. Новый флагман Nemotron 3 Ultra — это гигантская модель на 550 миллиардов параметров (из которых 55 млрд активны на каждый токен).
В чем уникальность архитектуры?
Это первая в мире модель, построенная на гибридной архитектуре SSM (State Space Models / Mamba) + MoE (Mixture of Experts). Такое сочетание позволило добиться невероятной эффективности:
- В 5 раз быстрее: Модель выдает ответы молниеносно. Дженсен Хуанг подчеркнул: «Мы сделали ее быстрой, чтобы вы могли думать быстрее. А когда вы думаете быстрее, вы можете думать дольше при тех же затратах». Это критически важно для цепочек рассуждений (reasoning).
- На 30% дешевле: Стоимость инференса (вычислений) значительно ниже, чем у ближайших конкурентов среди открытых моделей.
Абсолютная открытость: Nvidia выкладывает в открытый доступ не только веса модели, но и скрипты для обучения, а также массив датасетов. Модель обучалась на одной из крупнейших в мире баз данных для долгосрочного планирования и работы с инструментами, собранной благодаря консорциуму партнеров Nvidia.
2. Процессор Nvidia Vera: CPU больше не для людей
Традиционные процессоры (архитектуры x86) создавались для человеческих задач — виртуализации, многозадачности, аренды серверов по часам. В эпоху ИИ-агентов такой подход стал бутылочным горлышком, тормозящим работу мощных графических чипов (GPU).
Nvidia представила Vera — специализированный CPU для «эпохи агентов». Как выразился Хуанг: «Теперь CPU — это дирижер, а GPU — оркестр».
[ Традиционный CPU ] ──> Медленная обработка кода ──> Простой GPU (Бутылочное горлышко) [ Nvidia Vera CPU ] ──> Сверхбыстрый «песочный» запуск ──> 100% Утилизация GPU (Максимум токенов)
Ключевые характеристики Vera:
- Ядро Olympus: Создано специально для тяжелых Python-скриптов, вызовов API (tool calls) и безопасного исполнения кода в «песочницах» (sandbox).
- Пропускная способность: Сумасшедшие 3,6 ТБ/с внутренней пропускной способности.
- Память LPDDR5X с коррекцией ошибок: Снижает задержку памяти на 40% по сравнению с x86, не жертвуя скоростью.
- Архитектура без чиплетов: Все 88 ядер Olympus объединены на монолитной сетке, что делает межъядерное взаимодействие на 50% быстрее.
- Производительность: Напрямую подключенный через NVLink к будущим графическим чипам Reuben, процессор Vera обеспечивает в 1.88 раза большую производительность в агентских задачах, чем классические x86-процессоры.
3. Cosmos 3: единый мозг для физического ИИ и робототехники
Для создания роботов, беспилотников и систем автопилота Nvidia выпустила Cosmos 3 — базовую модель «открытого мира» (open world foundation model).
Ранее Nvidia развивала отдельные ветки: Cosmos Predict (предсказание будущего), Cosmos Reason (понимание физики) и Cosmos Policy (генерация действий). В Cosmos 3 все они объединены в одну Omni-модель, которая понимает и генерирует текст, видео, звук и, главное, команды для физических действий.
Как это устроено?
В основе лежит новая архитектура Mixture of Transformer, состоящая из двух башен:
- Левая башня (Авторегрессионная): Отвечает за логику, текст и язык.
- Правая башня (Диффузионная): Отвечает за генерацию видео и визуализацию мира.
Модель обучалась на колоссальном объеме данных: 20 триллионов мультимодальных токенов, 4 миллиарда изображений и 400 миллионов реальных и синтетических видео.
Физический ИИ требует кастомизации под конкретное железо, поэтому Cosmos 3 полностью открыт (веса уже доступны на Hugging Face). Модель вышла в двух версиях: Super (для максимальной точности в лабораториях) и Nano (оптимизирована для запуска непосредственно на роботах и конечных устройствах). На данный момент Cosmos 3 занимает первые строчки в бенчмарках робототехники и генерации физически корректного видео.
4. RTX Spark: первый ПК новой эры за последние 40 лет
Пожалуй, самый интригующий анонс для массового рынка — коллаборация Nvidia, MediaTek и Microsoft по полному переосмыслению персонального компьютера. Встречайте суперчип RTX Spark.
Это не просто процессор или видеокарта для ПК. Это единый кристалл (System on Chip), созданный по 3-нм техпроцессу TSMC, содержащий 70 миллиардов транзисторов.
| Компонент | Спецификации и мощность |
| GPU | Архитектура Blackwell RTX с 6 144 ядрами CUDA |
| CPU | Кастомный 20-ядерный процессор Grace (разработан совместно с MediaTek) |
| Память | 128 ГБ быстрой объединенной памяти (Unified Memory) |
| ИИ-производительность | 1 Петафлоп (1 Petaflop) локальной мощности |
Зачем это нужно?
Совместно с Microsoft Nvidia адаптирует Windows под архитектуру агентов. Компьютер на базе RTX Spark разработан не для того, чтобы просто «запускать приложения». Его задача — непрерывно крутить локальные ИИ-агентские системы в безопасных изолированных песочницах. Ваши персональные помощники будут работать автономно прямо на ПК, выполнять за вас рутину, писать код и организовывать рабочие процессы, не отправляя конфиденциальные данные в облако.
Итог
Презентация Nvidia наглядно показала: индустрия уходит от концепции «ИИ как поисковая строка». Новые продукты компании создают фундамент для мира, где автономные цифровые агенты работают на кастомных процессорах Vera и чипах RTX Spark, а физические роботы управляются единой открытой системой Cosmos 3. Будущее, в котором ИИ станет автономным коллегой, а не просто инструментом, уже наступило.
