Log in to leave a comment
No posts yet
Наступила эра, когда ИИ-агенты пишут код и выстраивают инфраструктуру. Однако разработчики-практики по-прежнему испытывают беспокойство. Это происходит потому, что агент, который еще минуту назад был идеален, внезапно выдает нелепый ответ или игнорирует инструменты, которые ему было четко велено использовать.
Результаты недавнего эксперимента команды Vercel AI SDK шокируют. Когда ИИ-агенту доверяют выбор инструментов, то есть навыки (Skills), процент отказов достигает внушительных 56%. И это не проблема интеллекта модели. Это доказательство того, что способ, которым мы предоставляем информацию ИИ, в корне неверен. Секрет доведения успеха агента до 100% кроется не в добавлении новых инструментов, а в стратегии персистентного контекста на базе agents.md.
Многие разработчики наделяют агентов функциями вызова различных инструментов и ожидают, что ИИ будет сам извлекать и использовать их по мере необходимости. Однако у этого метода есть фатальный недостаток — шум принятия решений.
Контекстное окно ИИ-модели подобно кратковременной памяти человека. После 5 и более циклов диалога инструкции, прописанные в исходном системном промпте, теряют приоритет. Это называется деградацией контекста. Агент в каждый момент времени мучается вопросом: «Должен ли я использовать инструмент сейчас или ответить на основе того, что уже знаю?». Сама эта точка принятия решения становится единой точкой отказа.
Решение, превращающее 56% неудач в 0%, простое. Вместо того чтобы давать агенту право выбора, необходимо зафиксировать ключевые правила и информацию о проекте в системном промпте. Центральным элементом здесь является файл agents.md.
Согласно бенчмаркам Vercel, когда та же информация предоставлялась в виде инструмента, вероятность успеха составляла 79%. Однако, когда она была включена непосредственно в виде индекса в agents.md, показатель успешного выполнения составил 100%.
| Показатель анализа | Метод вызова инструментов (Skills) | Персистентный контекст (agents.md) |
|---|---|---|
| Принятие решений | Агент каждый раз решает, загружать ли данные | Информация всегда присутствует в системе |
| Надежность | Около 53% ~ 79% (нестабильно) | Возможно достижение 100% |
| Нагрузка на логику | Высокая из-за шума принятия решений | Низкая из-за исключения этапа выбора |
| Особенность | Метод «по запросу» (On-demand) | Пассивный метод |
Чтобы максимизировать производительность, agents.md должен проектироваться не как простой текстовый файл, а как README для машины.
Конкретные запреты повышают качество результатов агента мгновенно и эффективнее, чем абстрактные принципы. Нужны четкие команды, например: «Используй MUI v3 и обязательно применяй Jotai для управления состоянием». Указания вроде «Никогда не используй alert() и применяй компоненты только из определенной библиотеки» предотвращают отклонения агента от заданного курса.
Нельзя позволять агенту тратить токены, сканируя весь репозиторий. Необходимо предоставить мини-индекс расположения ключевых файлов. Нужно нарисовать четкую карту: следует ли использовать pnpm при сборке, где находятся файлы роутинга и файлы схем.
Если файл становится слишком объемным, производительность, наоборот, падает. Vercel рекомендует метод сжатия 40 КБ документации до 8 КБ для индексации. Суть не в том, чтобы «разжевывать» знания агенту, а в оптимизации путей доступа к этим знаниям.
Подобно тому, как в коде накапливается технический долг, при использовании ИИ накапливается «долг промптов». Если у каждого члена команды свои инструкции для агента, согласованность результатов рушится. Размещение agents.md в корне проекта и управление им через Git интегрирует контроль версий и позволяет применять единые стандарты команды независимо от используемой модели.
В эпоху ИИ-агентов победа или поражение зависят не от интеллекта модели, а от проектирования контекста (context engineering). Вместо того чтобы ждать, когда агенты станут умнее, создание среды, в которой агент не может совершить ошибку — самый верный способ повысить продуктивность. Начните прямо сейчас с создания agents.md в корне вашего проекта и зафиксируйте правила вашей команды.