Moonshot представила новую модель в линейке открытых Kimmy — Kimi K2.6. Разработчики называют её передовой open‑source моделью для программирования, агентных рабочих процессов и задач с визуальными компонентами. Автор видео провёл подробный первый обзор, сравнил модель с конкурентами и протестировал её на нескольких практических заданиях.
Ключевые особенности модели Kimi K2.6
Kimi K2.6 — это модель с общей архитектурой на 1 трлн параметров. Благодаря схеме Mixture of Experts модель задействует только около 32 млрд параметров на один токен, что позволяет удерживать стоимость работы на приемлемом уровне. Несмотря на открытый исходный код, локально модель запустить нельзя: для размещения всех параметров требуется около 2 ТБ видеопамяти.
Разработчики подчёркивают, что K2.6 делает ставку не только на увеличение мощности, но и на массовый параллелизм. В версии реализована система «рой агентов» — до 300 параллельно работающих копий модели (в предыдущей версии было 100). Эта функция доступна только через фирменный оркестрационный слой Moonshot и работает на платформе kim.com.
Автономные агентные возможности
Каждый агент обладает собственной постоянной памятью, что позволяет вести длинные инженерные циклы. В техническом блоге Moonshot приводятся два примера:
- Создание локального интерфейсного движка для Qwen 3.5 — 12 часов автономной работы, более 4 тыс. вызовов инструментов, 14 итераций, повышение пропускной способности с 15 до 193 токенов в секунду.
- Оптимизация ядра биржевого движка — 13 часов работы, около 3 тыс. вызовов инструментов, более 4 тыс. строк изменённого кода, улучшение средней пропускной способности на 125%.
Сравнение с ведущими моделями
В бенчмарках Kimi K2.6 показывает конкурентные результаты в задачах агентоориентированного поиска, программирования и мультимодальной обработки:
- В некоторых агентных тестах модель опережает Opus 4.6 и GPT‑4.6.
- В тестах SWE‑pro K2.6 вышла впереди Opus 4.6 и GPT‑5.4.
- В задаках рассуждений немного уступает GPT‑5.4, но находится в одном диапазоне.
- В задачах компьютерного зрения размещается между GPT‑5.4 (ниже) и Opus 4.6 (выше).
Практические испытания: фронтенд с 3D‑графикой
Автор проверил способность модели генерировать сложный HTML‑интерфейс: страницу с полноэкранным хиро-блоком, 3D‑сферой на Three.js, пользовательским GLSL‑шейдером, анимациями при скролле и эффектами GSAP. Задача выполнена за минуту и стоила около 8 центов через OpenRouter.
Результат оказался корректным: вращающаяся сфера отрисовалась, эффекты работали, а при прокрутке сфера уменьшалась и исчезала, уступая место заголовку. В сравнении с Claude Opus 4.7 модель Kimmy показала лучшее соответствие инструкции и более эстетичный результат.
Глубокий ресёрч и планирование эксперимента
Второе испытание — многоступенчатый исследовательский запрос: найти и обобщить свежие научные работы о looped transformers и recurrent depth transformers, оценить воспроизводимость на видеокарте RTX 3060, составить план эксперимента и сгенерировать код.
Kimi K2.6 выполнила:
- поиск и анализ научных публикаций за последние шесть месяцев,
- ранжирование по воспроизводимости,
- подготовку детального плана эксперимента,
- генерацию структуры проекта — модели, данных, скриптов обучения, README.
Работа заняла около 10 минут и стоила примерно 46 центов. При запуске созданных скриптов потребовались небольшие корректировки, но итоговый тестовый прогон прошёл успешно.
Итоги: действительно ли Kimi K2.6 впечатляет?
Автор отмечает, что это один из самых сильных и продуманных релизов среди открытых моделей за последнее время. Kimi K2.6 уверенно конкурирует с коммерческими флагманами в задачах кода, мультимодальности и агентных систем, при этом оставаясь значительно дешевле.
Модель рекомендована для исследований, сложной разработки, автономных агентов и визуально насыщённых фронтенд‑задач.
Полный вывод автора: модель действительно впечатляет и задаёт высокую планку для будущих open‑source систем.
