Программирование с ИИ: Начало новой эры

AAI LABS
컴퓨터/소프트웨어경영/리더십AI/미래기술

Transcript

00:00:00Был ли Opus 4.6 единственным обновлением от Anthropic?
00:00:03Вы уже знаете о суб-агентах, где каждый агент работает как отдельная единица
00:00:07со своим собственным окном контекста.
00:00:09Но эти суб-агенты не справлялись, когда задача требовала координации между ними.
00:00:13В таких случаях должен был вмешиваться оркестратор, забирая ответы у одного агента
00:00:17и передавая их другому, либо агентам приходилось полагаться на заметки в папке проекта.
00:00:21Из-за этого коммуникационного разрыва простые задачи становились слишком переусложненными.
00:00:25Чтобы решить эту проблему, Anthropic выпустила новое обновление для суб-агентов под названием Agent-Teams.
00:00:30Они были запущены одновременно с Opus 4.6.
00:00:33Хотя это все еще экспериментальная функция, мы внедрили ее в несколько рабочих процессов,
00:00:37и самым большим улучшением стало значительное сокращение времени на выполнение задач.
00:00:41Но она экспериментальная не просто так, в ней есть свои недочеты, и мы нашли
00:00:44небольшие решения для этих проблем.
00:00:47Agent-Teams — это идея использования нескольких инстансов ClodCode, работающих вместе.
00:00:51Каждый член команды работает над изолированными задачами под централизованным
00:00:55управлением одного агента.
00:00:56Вы можете подумать, что это очень похоже на уже существующие суб-агенты Clod,
00:01:00поскольку и те и другие работают параллельно и разделяют задачи, но это не одно и то же.
00:01:03Это потому, что Agent-Teams решили главную проблему фреймворка суб-агентов.
00:01:08Суб-агенты не могут общаться друг с другом напрямую и вынуждены полагаться
00:01:12на агента-оркестратора как на посредника.
00:01:15Члены же команд (Team members) могут общаться друг с другом напрямую.
00:01:18Основная идея Agent-Teams — это совместная работа нескольких сессий ClodCode.
00:01:22Одна сессия выступает в роли лидера команды, координируя работу и распределяя задачи,
00:01:27в то время как напарники работают независимо в своих окнах контекста.
00:01:31У суб-агентов есть свое окно контекста, и они сообщают результат тому, кто их вызвал.
00:01:34Но в командах все работает иначе.
00:01:36Каждый участник команды агентов — это полностью независимая терминальная сессия.
00:01:40Они не ограничены оркестратором, который просто делит задачи.
00:01:43Вместо этого терминальные сессии открываются и закрываются основным лидером команды.
00:01:47Они способны выполнять задачи, требующие обсуждения и сотрудничества,
00:01:52благодаря своей способности общаться.
00:01:54Итак, команда агентов по сути состоит из лидера и участников.
00:01:57Лидер — это основной агент, который создает команду и координирует работу.
00:02:01Участники — это исполнители, которые непосредственно выполняют задачи.
00:02:03Каждый участник получает список задач, который является общим списком пунктов.
00:02:07Каждый член команды определяет, что ему нужно сделать из этого списка, и выполняет это.
00:02:10Для связи у них также есть общий почтовый ящик, позволяющий обмениваться сообщениями.
00:02:15Возникает вопрос: как это работает на деле, если каждый член команды независим?
00:02:19Как они узнают, что делают другие участники?
00:02:21Это работает, потому что вся информация о команде, ее участниках и задачах
00:02:26хранится локально в папке .claud и идентифицируется по названию задачи.
00:02:30Эта функция экспериментальная и отключена по умолчанию, поэтому на этом этапе
00:02:34возможны ошибки в управлении участниками.
00:02:36Чтобы протестировать ее, нам пришлось включить ее вручную.
00:02:38Мы сделали это, установив флаг CLI claud code для экспериментальных команд в значение 1.
00:02:43С этим включенным флагом команды агентов стали доступны для использования в сессиях.
00:02:47Включив этот флаг, мы получили доступ к функции команд в claud code.
00:02:51Так как функция экспериментальная, нам нужно использовать специфические формулировки,
00:02:55чтобы сказать Claud, что мы хотим использовать команду для конкретной работы.
00:02:58Наша команда начала использовать эту функцию для распараллеливания проверки кода,
00:03:02позволяя выявлять и исправлять ошибки одновременно.
00:03:04Для этого мы попросили Claud использовать одного участника для поиска проблем в коде,
00:03:08а другого — для исправления ошибок, найденных первым участником.
00:03:11Нам пришлось детально составить промпт, чтобы направить их в нужное русло.
00:03:15Если бы этим занимались суб-агенты, они бы записывали отчет в какой-то физический
00:03:19файл, чтобы другие агенты знали, что именно нужно исправить.
00:03:21Но здесь мы хотели ускорить процесс ревью, позволив этому происходить
00:03:26без лишних затрат на запись в локальный файл.
00:03:27Когда мы дали промпт в claud code, появились участники команды под управлением
00:03:31лидера команды.
00:03:32Ведущий агент передал промпт отдельным агентам, указав, какую задачу выполнять.
00:03:36Первый агент-ревьюер приступил к работе и после анализа задачи начал
00:03:40передавать сообщения агенту-исправителю по каждой ошибке отдельно.
00:03:42Этот агент приоритизировал критические проблемы безопасности, и как только
00:03:47исправитель получал сообщения от ревьюера, он начинал внедрять правки,
00:03:51пока ревьюер продолжал искать новые баги.
00:03:53Так они продолжали общаться и сообщать о внедренных изменениях.
00:03:57Когда с критическими багами было покончено, оба агента перешли к исправлению
00:04:01ошибок со средним приоритетом.
00:04:02Проверка и исправление кода шли одновременно, что сэкономило кучу времени.
00:04:06Плюс в том, что вы также можете назначать или изменять любую задачу для участника.
00:04:10Благодаря этому вы можете направлять работу конкретного члена команды.
00:04:14Когда агенты закончили, управление вернулось к основному агенту, который
00:04:18отвечает за проверку корректности изменений и за то, чтобы корректно
00:04:22отключить этих агентов, гарантируя отсутствие ошибок в дальнейшем.
00:04:26Вы, вероятно, заметили, что в этих видео мы много чего создаем.
00:04:28Все промпты, код, шаблоны — все то, что обычно приходится ставить на паузу
00:04:32и копировать с экрана, есть в нашем сообществе к этому и всем прошлым видео.
00:04:36Ссылки в описании.
00:04:37Ссылки в описании.
00:04:38Масштабный поиск и исправление — это круто, но часто бывают случаи, когда
00:04:43вы видите ошибки, но не можете понять, что их вызывает.
00:04:45В таких ситуациях можно использовать команду агентов, чтобы проверить приложение
00:04:49с разных сторон и постепенно докопаться до бага.
00:04:51Так участники могут сообщать друг другу о находках и двигаться вперед вместе.
00:04:55Мы попросили Claude найти баг в кодовой базе, указав использование нескольких
00:04:59участников команды, чтобы они подошли к проблеме с разных ракурсов.
00:05:02Затем он создал четырех суб-агентов, каждый из которых сфокусировался на своем аспекте.
00:05:06Они получили похожие инструкции от лидера и исследовали ошибки в своих областях,
00:05:09пока лидер ждал завершения, чтобы затем проанализировать результаты
00:05:14их исследований.
00:05:16Без команд у нас был бы один поток, что заняло бы гораздо больше времени.
00:05:19Но с этими агентами процесс прошел намного быстрее.
00:05:22Расследование завершилось быстро, вся работа агентов заняла примерно
00:05:272-3 минуты, что является значительным улучшением по сравнению с линейной проверкой,
00:05:31которая легко заняла бы от 5 до 10 минут.
00:05:33Нужно учитывать, что такой подход тратит много токенов, так как у каждого
00:05:37агента свое окно контекста, поэтому с этим нужно быть осторожнее.
00:05:40Когда агенты выдали результат и были отключены, лидер команды также
00:05:45перепроверил результаты самостоятельно.
00:05:46Все четыре агента сошлись на одном и том же баге, верно указав на проблему
00:05:50с устаревшим замыканием в use effect.
00:05:52Именно эта часть была отмечена всеми четырьмя агентами.
00:05:54Также, если вам нравится наш контент, не забудьте нажать кнопку «хайпа»,
00:05:59это помогает нам делать больше таких видео и охватывать больше людей.
00:06:02Этот фреймворк изменил то, как мы работаем над долгосрочными задачами,
00:06:07поскольку теперь агентам не нужно полагаться только на документирование прогресса.
00:06:10С Agent-Teams мы можем параллельно обрабатывать разные аспекты приложения
00:06:14и даже выделить отдельного участника для проведения исследований.
00:06:16Когда мы дали Claude промпт, он создал 6 агентов.
00:06:19Двое занимались исследованием и закладкой фундамента, а остальные
00:06:23создавали страницы.
00:06:24Агенты-строители были заблокированы агентом, закладывающим фундамент, так как он
00:06:28отвечал за установку пакетов и подготовку среды со всеми зависимостями.
00:06:32Каждый агент получил конкретный промпт, определяющий его работу.
00:06:35Заблокированные агенты ждали сигнала разблокировки от лидера команды.
00:06:38Как только фундамент был готов, остальные агенты были разблокированы и начали
00:06:43реализовывать свои части приложения бок о бок.
00:06:46Они продолжали общаться друг с другом для обеспечения согласованности компонентов.
00:06:49Лидер координировал их действия, и как только агент заканчивал работу, лидер
00:06:53отправлял сообщение о завершении, корректно закрывая сессию.
00:06:57Весь процесс потребил около 170 тысяч токенов контекста, но в итоге
00:07:02мы получили приложение именно таким, как хотели, всего по одному промпту.
00:07:05Как мы упоминали, пока наша команда тестировала это, мы нашли несколько способов
00:07:09сделать работу команд агентов эффективнее, и эти лучшие практики доступны
00:07:13в AI Labs Pro, чтобы вы могли опробовать их сами.
00:07:16Первая рекомендация применима ко всем агентам вообще, а не только
00:07:20к функции команд агентов.
00:07:21Вам нужно четко указывать область (scope), в которой должен работать агент.
00:07:25Это можно сделать либо в промпте, указав конкретные файлы для анализа,
00:07:29либо создав в проекте документы с описанием отдельных подзадач,
00:07:33как сделали мы, подготовив техническое задание для каждого поручения,
00:07:38чтобы агент мог работать независимо и в нужных рамках.
00:07:41Еще нужно помнить, что агенты должны работать над независимыми задачами,
00:07:45потому что если они будут редактировать один и тот же файл одновременно,
00:07:49это создаст конфликт и может привести к перезаписи контента.
00:07:52Кроме того, иногда основной агент проявлял нетерпение,
00:07:56если кто-то из напарников долго выполнял задачу, и начинал делать ее сам,
00:08:00не дожидаясь завершения. Поэтому важно напоминать лидеру,
00:08:04что нужно дождаться окончания работы коллег.
00:08:06Также нужно правильно подбирать объем задач.
00:08:08Слишком мелкие задачи создают лишние накладные расходы на координацию.
00:08:11Слишком крупные — повышают риск напрасных усилий, так что задачи должны
00:08:16быть сбалансированными и самодостаточными.
00:08:17Наконец, нужно следить за работой агентов.
00:08:19Если какой-то агент работает не так, как ожидалось, вы можете остановить его
00:08:23и дать новые инструкции по поводу того, что ему следует делать.
00:08:25Соблюдение этих правил делает использование этой экспериментальной функции намного эффективнее.
00:08:29На этом мы подошли к концу видео.
00:08:31Если вы хотите поддержать канал и помочь нам выпускать такие ролики,
00:08:35вы можете сделать это с помощью кнопки «Суперспасибо» ниже.
00:08:38Как всегда, спасибо за просмотр, и увидимся в следующем видео.

Key Takeaway

Agent-Teams — это новая эра программирования с ИИ, позволяющая группе автономных агентов напрямую координировать действия и совместно решать сложные задачи разработки в разы быстрее традиционных методов.

Highlights

Anthropic представила обновление Agent-Teams для Claude Code, работающее параллельно с моделью Opus 4.6

Главное отличие Agent-Teams от суб-агентов — возможность прямой коммуникации между участниками без посредничества оркестратора

Система строится на иерархии Лидера и Исполнителей (участников), каждый из которых работает в независимой терминальной сессии

Использование команд позволяет значительно ускорить процессы ревью кода и поиска сложных багов за счет распараллеливания задач

Функция является экспериментальной и требует ручной активации через CLI флаг экспериментальных команд

Для эффективной работы необходимо четко ограничивать область (scope) задач и следить за тем, чтобы агенты не редактировали один и тот же файл одновременно

Несмотря на высокую эффективность, работа Agent-Teams потребляет большое количество токенов контекста

Timeline

Проблема суб-агентов и появление Agent-Teams

В начале видео обсуждается ограничение существующих суб-агентов Anthropic, которые не могут координировать свои действия напрямую. Ранее оркестратор должен был вручную передавать данные между ними, что переусложняло простые рабочие процессы и создавало задержки. Для решения этого коммуникационного разрыва Anthropic выпустила Agent-Teams вместе с обновлением Opus 4.6. Это экспериментальная функция, призванная сократить время выполнения задач за счет устранения посредников. Автор подчеркивает, что это значительный шаг вперед в архитектуре взаимодействия нескольких экземпляров ИИ.

Архитектура и механизмы работы команд агентов

Спикер объясняет внутреннее устройство Agent-Teams, где одна сессия Claude Code выступает лидером, а остальные — участниками. В отличие от суб-агентов, участники команды являются полностью независимыми терминальными сессиями и могут обмениваться сообщениями через общий почтовый ящик. Вся информация о задачах и составе команды хранится локально в папке .claud, что позволяет агентам знать о действиях друг друга. Лидер управляет открытием и закрытием сессий, распределяя задачи из общего списка. Такая структура превращает изолированных помощников в полноценную рабочую группу, способную к обсуждению и сотрудничеству.

Практическое применение: Параллельное ревью кода

В этом разделе демонстрируется реальный пример использования команд для одновременного поиска и исправления ошибок в коде. Чтобы активировать функцию, необходимо установить специальный флаг в CLI Claude Code, так как она отключена по умолчанию. В примере один агент выступает ревьюером, передавая найденные баги напрямую агенту-исправителю в реальном времени. Это исключает необходимость записи промежуточных отчетов в файлы и позволяет исправлять критические уязвимости безопасности мгновенно. Автор отмечает, что такая синхронная работа экономит огромное количество времени по сравнению с последовательным подходом.

Диагностика сложных багов и эффективность по времени

Автор описывает сценарий поиска трудноуловимого бага с помощью четырех агентов, исследующих кодовую базу с разных ракурсов. Команда смогла найти проблему с устаревшим замыканием в use effect всего за 2-3 минуты, в то время как линейная проверка заняла бы до 10 минут. Все участники команды пришли к единому выводу, подтвердив точность коллективного анализа. Однако спикер предупреждает о высоком расходе токенов, так как каждый агент имеет свое собственное окно контекста. Видео призывает пользователей использовать кнопку «хайпа» для поддержки контента о подобных глубоких технических экспериментах.

Создание приложений и лучшие практики

В финальной части показано создание полноценного приложения, где 6 агентов работали над фундаментом и страницами одновременно. Весь процесс потребил около 170 тысяч токенов, но позволил получить готовый результат по одному промпту. Спикер дает важные рекомендации: четко указывать область работы (scope), избегать редактирования одного файла несколькими агентами и напоминать лидеру ждать завершения работы коллег. Также подчеркивается важность балансировки объема задач, чтобы избежать лишних накладных расходов. Видео завершается благодарностью зрителям и предложением поддержать канал через «Суперспасибо».

Community Posts

View all posts