Индустрия программного обеспечения столкнулась с неожиданным парадоксом. Компании, массово увольнявшие разработчиков ради оптимизации расходов и полной замены их искусственным интеллектом, обнаружили себя в ловушке: содержание продвинутых ИИ-агентов обходится кратно дороже, чем оплата труда высококлассных специалистов.
Парадокс Microsoft и реальная стоимость токенов
До недавнего времени ИТ-гиганты и стартапы транслировали единый нарратив: генеративный ИИ снизит себестоимость разработки до минимума. Однако практика внесла жесткие коррективы. Отрезвляющим сигналом для рынка стало решение корпорации Microsoft начать отказ от фиксированных подписок на ИИ-инструменты написания кода (Claude Code, Copilot и др.) из-за их экстремальной убыточности для самого провайдера.
Чтобы осознать масштабы затрат, достаточно взглянуть на внутренние метрики лидеров индустрии. Питер Швайнберг, создатель Open Cloud, ныне работающий в OpenAI, поделился шокирующими данными: только его относительно небольшая команда инженеров тратит на токены порядка $1 300 000 в месяц. Генерация кода силами ИИ перестала быть дешевой альтернативой; она превратилась в одну из главных статей расходов крупных технологических компаний.
Почему ИИ-агенты «проедают» бюджет: Анатомия оверхеда
Китайские исследователи и независимые аналитики детально разобрали структуру затрат и назвали главного виновника бюджетного кризиса — продвинутых автономных ИИ-агентов (таких как Claude Code, AntiGravity, Cursor, Cognition Codex и их аналоги).
Существует фундаментальная технологическая и экономическая разница между обычным запросом в чат-бот и работой специализированного ИИ-агента для программирования:
- Линейный запрос (Chat GPT): Пользователь отправляет короткий промт, модель учитывает небольшой системный контекст и выдает один ответ. Расход токенов минимален, предсказуем и дешев.
- Автономный ИИ-агент (AI Agent): Для выполнения одной задачи (например, «исправить баг в модуле авторизации») агент совершает десятки и сотни итераций. Каждое действие — чтение локального файла, запуск скрипта, переход по ссылке в документацию, тестирование — выполняется обычным кодом на компьютере, но координируется нейросетью. Между каждым шагом происходит повторный вызов большой языковой модели (LLM).
Главная проблема кроется в передаче контекста. При каждом из сотен итерационных вызовов ИИ-редактор вынужден заново отправлять в модель колоссальный объем данных: весь внутренний системный промт, кастомные макдаун-файлы (инструкции пользователя), специфические навыки (skills) агента, дерево проекта и огромные куски кодовой базы.
По этой причине продвинутые агенты тратят в тысячи раз больше токенов на одну задачу, чем простой текстовый запрос.
Сравнительный анализ расхода ресурсов
| Параметр сравнения | Традиционный Chat-интерфейс | Автономный ИИ-агент разработки |
| Механика взаимодействия | Один запрос — один ответ | Десятки и сотни циклических вызовов |
| Объем контекста на шаг | Минимальный (только текст вопроса) | Максимальный (код, инструкции, логи, файлы) |
| Множитель потребления токенов | 1х (базовый тариф) | В 1 000 — 10 000 раз больше на задачу |
| Экономическая модель | Рентабельна при фиксированной подписке | Убыточна для вендора при flat-rate тарифах |
С ценообразованием на рынке сейчас происходит аномалия. Постепенно объявляются увеличения цен (например, в Copilot изменения вступают в силу уже с июня 2026 года). При этом технологически токены должны были бы дешеветь.
Глобальное обучение больших языковых моделей существенно замедлилось из-за дефицита качественных данных в интернете. Компании тратят меньше денег на первичную закупку и подготовку датасетов, что снижает себестоимость разработки самих моделей. Но конечная цена генерации для пользователя не падает по одной причине: сейчас токены продаются дешевле их реальной себестоимости. Провайдеры искусственного интеллекта демпинговали ради захвата рынка, но экономика агентов заставила их пересмотреть политику.
Итог: Конец иллюзии «бесплатной разработки»
Бизнес, рассчитывавший уволить программистов и оставить горстку джуниоров под управлением ИИ, просчитался в долгосрочном финансовом планировании. Эффективность оставшихся разработчиков действительно выросла, но счета за использование ИИ-инструментов в ближайшей перспективе могут превысить фонд оплаты труда уволенных сотрудников.
Безусловно, нейросети пришли в индустрию навсегда. Они крайне полезны, и будущее программирования неразрывно связано с ними. Тем не менее, эйфория бесплатной или копеечной автоматизации ИТ-сектора подошла к концу. Ключевые вопросы — какие архитектурные модели окажутся экономически жизнеспособными, кому они будут принадлежать и сколько бизнес готов платить за «мыслительные процессы» алгоритмов — остаются открытыми.
На основе Нейросети дороже программистов
