Передовые автономные ИИ-агенты (Frontier AI Agents) сегодня демонстрируют впечатляющие возможности. Они способны самостоятельно планировать сложные задачи, писать рабочий код и выполнять длинные цепочки действий с минимальным участием человека.
Однако за этой автономностью стоит четко структурированная архитектура. Сама по себе большая языковая модель (LLM) является лишь продвинутым собеседником. Что превращает её в полноценного агента? Это инструктивный слой (instruction layer), который оборачивается вокруг модели и управляет её поведением.
В этой статье мы подробно разберем пять главных технологий, концепций и протоколов, которые определяют логику работы современных агентных систем (Agentic AI).
1. Управление внутренним поведением и контекстом
Первые два термина описывают то, что находится «внутри» агента и напрямую влияет на его поведение, фокус внимания и использование оперативной памяти (контекстного окна).
Термин 1: agents.md (или claude.md)
Что это такое: Текстовый файл конфигурации в формате Markdown, который располагается в корневом каталоге проекта. Когда ИИ-агент начинает работу над задачей в этом репозитории, он в первую очередь считывает этот файл.
- Назначение: Его можно представить как классический файл
README, но написанный специально для искусственного интеллекта, а не для человека. - Содержимое: Файл сообщает агенту контекстные правила игры: какие команды запускать для тестов (например, обязательно выполнять
pnpm testперед фиксацией изменений), каких стандартов кодирования придерживаться в этой базе знаний и как именно должен быть отформатирован заголовок для Pull Request (PR). - Иерархия и вложенность: Файлы
agents.mdмогут быть вложенными. Вы можете разместить один глобальный файл в корне проекта, и несколько других — в поддиректориях (субпроектах). Правила из файлов, которые находятся ближе к рабочей директории, будут переопределять глобальные правила. - Стандартизация: Эта концепция изначально была предложена компанией OpenAI, а затем передана в качестве открытого стандарта в Фонд агентного ИИ (AAIF — Agentic AI Foundation), функционирующий под эгидой Linux Foundation.
- Нюанс: Некоторые платформы используют свои уникальные имена для аналогичного функционала. Например, у Anthropic этот файл называется
claude.md, но суть и принципы его работы остаются теми же.
Термин 2: Agent Skill (Навык агента)
Что это такое: Изолированный модуль или папка, содержащая инструкции и ресурсы для выполнения узкоспециализированной, периодической задачи.
- Проблема, которую он решает: Проблему переполнения контекстного окна. Представьте, что агенту иногда нужно сгенерировать презентацию в PowerPoint. Если загружать детальные инструкции по созданию слайдов, разметке и стилям абсолютно каждый раз, когда агент запускается, это мгновенно «засорит» его контекстное окно. И это при том, что текущая задача пользователя может быть вообще не связана с презентациями.
- Структура навыка: Навык оформляется в виде отдельной папки. Внутри неё лежит файл
skill.mdс метаданными и текстовым описанием (например: «Вызывай меня, когда пользователь просит создать презентацию PowerPoint»), а также необходимые для этого скрипты и шаблоны. - Принцип работы: Агент сканирует описания навыков. Если текущий запрос пользователя совпадает с триггером в
skill.md, агент динамически подтягивает этот навык в свою память. Если совпадения нет — навык просто лежит на диске, не занимая драгоценное контекстное окно модели. Это также открытый стандарт, поддерживаемый многими агентными платформами.
2. Взаимодействие со внешним миром
Следующие два термина описывают протоколы, которые позволяют ИИ-агенту выходить за рамки своего «цифрового разума» и взаимодействовать с внешними экосистемами.
Термин 3: MCP (Model Context Protocol)
Что это такое: Открытый протокол, предназначенный для унифицированного подключения ИИ-приложений к инструментам, источникам данных и рабочим процессам.
- Проблема, которую он решает: Без единого стандарта разработчикам ИИ-систем пришлось бы писать кастомный интеграционный коннектор для каждого внешнего инструмента. Чтобы агент мог прочитать данные из Notion, отправить ссылку на оплату в Stripe или заглянуть в базу данных SQL, под каждый чих требовался бы свой уникальный код. Это привело бы к архитектурному хаосу.
- Архитектура MCP Server: Протокол вводит понятие MCP-сервера. Этот сервер выступает универсальным переводчиком. Он «оборачивает» любое внешнее API или базу данных в стандартный интерфейс.
- Принцип работы: Агент общается с MCP-сервером на одном стандартизированном языке. А уже сам сервер берет на себя всю специфику работы с конечным бэкендом (будь то API Notion или запросы к БД).
- Статус стандарта: Инициатива была запущена компанией Anthropic, но на сегодняшний день протокол передан под управление фонда AAIF в Linux Foundation и имеет мощную поддержку со стороны крупнейших технологических игроков.
Термин 4: A2A (Agent-to-Agent / Межагентское взаимодействие)
Что это такое: Открытый протокол коммуникации, который позволяет разным ИИ-агентам напрямую общаться, координировать действия и делегировать задачи друг другу.
- Бизнес-контекст: Представьте крупную компанию, где работают специализированные ИИ-сотрудники. У вас есть Агент по закупкам, который ведет переговоры по контрактам с поставщиками, и Финансовый агент, который утверждает денежные траты. Агенту по закупкам необходимо согласовать бюджет на новый контракт с финансовым коллегой. Без протокола A2A им потребовалась бы сложная кастомная интеграция.
- Agent Cart (Карточка агента): В рамках протокола A2A каждый агент публикует свою «карточку». Это структурированный манифест с описанием того, что этот агент умеет делать (его зона ответственности) и как именно к нему нужно обращаться.
- Принцип работы: Агент по закупкам сканирует доступные в системе карточки, находит
Agent Cartфинансового агента, понимает, в каком формате передать ему данные, и автоматически перенаправляет контракт на утверждение. - Статус стандарта: Данная технология изначально была разработана компанией Google, но, как и предыдущие стандарты, сейчас является открытым проектом под эгидой Linux Foundation.
3. Масштабирование и параллельные вычисления
Последний термин описывает фундаментальный паттерн проектирования, который помогает ИИ-системам справляться с колоссальными объемами информации.
Термин 5: Subagents (Субагенты)
Что это такое: Архитектурный паттерн, при котором главный (родительский) агент динамически создает (спавнит) одного или нескольких дочерних агентов для выполнения конкретных изолированных подзадач.
- Отличие от других терминов: В отличие от
agents.mdилиMCP, у субагентов нет единого жестко задокументированного регламента или консорциума. Это не столько протокол, сколько повсеместно принятый и доказавший свою эффективность паттерн проектирования систем ИИ. - Зачем это нужно:
- Борьба с ограничениями контекста. Если главному агенту поручить проанализировать репозиторий из 5000 файлов, он физически не сможет удержать их все в памяти. Вместо этого он создает несколько десятков субагентов, дает каждому задание изучить по 50 файлов и вернуть назад короткую текстовую выжимку. Главный агент получает лаконичные резюме, а его собственное контекстное окно остается чистым.
- Параллелизм вычислений. Если агенту нужно провести аудит безопасности 20 независимых программных функций, он может проверять их последовательно (что очень долго). Паттерн субагентов позволяет запустить 20 дочерних процессов параллельно. Каждый субагент в своем изолированном контексте мгновенно выполняет проверку, возвращает результат родителю и уничтожается. Скорость работы системы увеличивается в 20 раз.
Сводная таблица: Архитектура Frontier AI Agent
| Категория технологии | Конкретный термин | Какую задачу решает | Кто за этим стоит |
| Внутреннее устройство и фокус | agents.md / claude.md | Задает локальные правила, команды тестирования и стандарты для конкретного проекта. | OpenAI / Anthropic / Linux Foundation |
| Внутреннее устройство и фокус | Agent Skill | Хранит инструкции для редких задач и динамически подключает их, экономя память. | Открытый стандарт (AAIF) |
| Внешние интерфейсы | MCP (Model Context Protocol) | Позволяет агенту общаться с любыми внешними базами данных, инструментами и API через универсальный сервер-переводчик. | Anthropic / Linux Foundation |
| Внешние интерфейсы | A2A (Agent-to-Agent) | Позволяет агентам находить друг друга по «карточкам» (Agent Carts) и передавать задачи по цепочке. | Google / Linux Foundation |
| Масштабирование работы | Subagents (Субагенты) | Разделяет одну огромную задачу на параллельные подзадачи, предотвращая переполнение памяти. | Общепринятый инженерный паттерн |
На основе 5 AI Agent Terms You Need to Know
