Этот новый дизайнер разблокирует возможности Claude Code

AAI LABS
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00Инженерное дело всегда было процессом тесного взаимодействия из-за масштабов работы и множества вовлеченных ролей.
00:00:05С появлением ИИ ситуация изменилась, но в то же время открылись новые способы совместной работы.
00:00:09У разных моделей свои сильные стороны — будь то их специализация или стоимость использования.
00:00:13Давайте рассмотрим один пример.
00:00:14Общеизвестно, что последние модели Gemini великолепно справляются с дизайном.
00:00:18Они гораздо креативнее любой модели Claude, особенно если давать им минимум инструкций.
00:00:23Но в целом Opus 3.5 — выдающаяся модель,
00:00:26особенно в связке с Claude Code, который является куда более стабильным инструментом, чем Gemini CLI.
00:00:31Однако нет эффективного способа использовать их вместе в рамках единого рабочего процесса.
00:00:35Даже если вы попытаетесь, вам придется выполнять много работы вручную,
00:00:38и нет возможности заставить этих агентов работать автономно.
00:00:41Недавно мы наткнулись на инструмент, который решает эту проблему коммуникации, позволяя разным
00:00:46агентам на базе различных моделей общаться друг с другом напрямую, исключая нас из цепочки.
00:00:50Agent Chatter — это чат-интерфейс для координации ИИ-агентов в реальном времени.
00:00:55Он поддерживает три самых популярных агента: Claude Code, Gemini CLI и Codex,
00:01:00а также открытые модели, такие как Kimi, Qwen и другие.
00:01:03Его также можно использовать для экономии: пусть дорогие агенты вроде Claude занимаются планированием,
00:01:07а Kimi или GLM берут на себя реализацию.
00:01:10Инструмент использует общий чат с несколькими каналами, где агенты могут переговариваться
00:01:14и координированно внедрять новые функции.
00:01:16Наше первое впечатление было таким: стандартный интерфейс выглядел не слишком отполированным.
00:01:20Но так как это проект с открытым кодом, мы сделали форк оригинального репозитория и создали
00:01:24визуальный слой поверх него, который кажется нам гораздо симпатичнее и удобнее в навигации,
00:01:28внеся некоторые правки под наши нужды.
00:01:31Мы запушили эту версию в наш форк, сохранив при этом весь исходный функционал.
00:01:35Но вся заслуга за архитектуру этой платформы принадлежит оригинальному создателю.
00:01:40В этом проекте есть набор скриптов,
00:01:43которые нужно запустить один раз для инициализации агентов.
00:01:46Эти скрипты — точка входа для запуска системы,
00:01:49без них вы не сможете запустить ни одного агента.
00:01:51Чтобы получить доступ к этим скриптам, вам нужно клонировать весь репозиторий.
00:01:54В репозитории собраны скрипты для раздельной инициализации всех агентов.
00:01:58Но прежде чем использовать их на macOS или Linux, убедитесь, что у вас установлен TMUX.
00:02:02TMUX — это, по сути, мультиплексор терминала.
00:02:05Он позволяет создавать несколько терминальных сессий и управлять ими из одной точки.
00:02:09Именно это использует Agent Chatter «под капотом»,
00:02:11чтобы отправлять задачи каждому запущенному терминальному агенту.
00:02:14Пользователи Windows могут запускать скрипты напрямую, всё будет работать.
00:02:18В документации перечислены все команды для запуска скриптов каждого агента.
00:02:21Например, если вы собираетесь использовать Claude Code и Gemini CLI вместе,
00:02:26скопируйте их команды и вставьте в терминал в папке с клонированным репозиторием.
00:02:31Вы можете выбрать команды для любых агентов, которых хотите запустить.
00:02:34Как только вы вставите команду, в сессии TMUX появится окно с агентом.
00:02:38Вы можете добавить в свою систему столько агентов, сколько пожелаете.
00:02:40Например, можно настроить четыре агента: три сессии Claude и одну Gemini.
00:02:44Но сколько бы агентов вы ни использовали, каждый должен работать в отдельном терминале.
00:02:49Так что для четырех сессий вам понадобятся четыре терминала, запущенных параллельно,
00:02:53и вы сможете управлять ими всеми из одной сессии чата в инструменте.
00:02:56Когда всё будет установлено, перейдите на localhost,
00:03:00и вы увидите всех запущенных агентов на панели чата.
00:03:03Чтобы выжать максимум из этого инструмента,
00:03:06нужно предпринять несколько шагов, которые помогут работать эффективнее.
00:03:09Рекомендуется инициализировать фреймворк вашего приложения до начала работы с инструментом,
00:03:14так как именно на этом этапе у агентов часто возникают конфликты, даже при разных ролях.
00:03:20Убедитесь, что ваш проект на Next.js или другом фреймворке уже создан.
00:03:25Во-первых, так как каждый агент работает как отдельная сессия Claude или Gemini,
00:03:29вам придется вручную подтверждать разрешения для каждого из них по отдельности.
00:03:33Хотя есть скрипты для запуска в режиме пропуска разрешений,
00:03:36это не рекомендуется: при работе нескольких агентов риск того, что один удалит работу другого, гораздо выше.
00:03:42Поэтому настройте settings.json для Claude Code и Gemini CLI с нужными правами доступа.
00:03:48Таким образом, команды редактирования файлов или сборки не будут ждать вашего одобрения,
00:03:53но при этом вы сохраните контроль над опасными операциями.
00:03:56Также важно убедиться, что инструменты MCP настроены в файле,
00:04:01иначе их тоже придется подтверждать вручную.
00:04:03Вам также следует создать файл agents.md.
00:04:05Сейчас он служит шаблоном с оптимизированной структурой для агентов,
00:04:09который они позже заполнят сами.
00:04:11Он включает правила ролей, поведение и все принципы, которым должны следовать агенты.
00:04:15Вам также понадобятся файлы планирования: PRD, шаблоны спецификаций для бэкенда и интерфейса,
00:04:20которые сначала будут шаблонами, а затем заполнятся агентом-планировщиком.
00:04:24Суть использования этих шаблонов — задать структуру, чтобы агенты не добавляли лишнего.
00:04:30Все эти шаблоны доступны на AI Labs Pro, откуда вы можете их скачать.
00:04:35Если вам нравится то, что мы делаем, и вы хотите поддержать канал,
00:04:38AI Labs Pro — лучший способ сделать это.
00:04:40Ссылка будет в описании.
00:04:42Еще одна функция инструмента — возможность дать имя каждому агенту и назначить ему роль.
00:04:47Это упрощает идентификацию агента и позволяет ему работать в рамках конкретной специализации.
00:04:52Например, если вы используете Gemini для дизайна интерфейса,
00:04:55вы можете переименовать его и назначить роль эксперта по UI/UX.
00:04:59Имена и роли нужны для того, чтобы агенты действовали строго в соответствии со своей персоной.
00:05:04И наконец, нужно настроить правила, чтобы агенты корректно выполняли задачи.
00:05:09Как упоминалось, стоит использовать agents.md.
00:05:12Но Claude обычно использует claude.md, а Gemini — gemini.md,
00:05:16и они не воспринимают чужие файлы как основные инструкции.
00:05:19Чтобы скоординировать их, используйте agents.md и добавьте правило, чтобы оба агента считали его главным руководством.
00:05:25Вы можете настроить сколько угодно правил под свои нужды.
00:05:29Но помните: когда вы создаете правило, оно сначала попадает в черновики,
00:05:31и его нужно вручную перевести в статус «активно», чтобы агенты его увидели.
00:05:35Правила обновляются каждые 10 триггеров чата, этот параметр можно настроить.
00:05:39Также обратите внимание на Loop Guard, который по умолчанию равен 4.
00:05:43Loop Guard — это максимальное количество «прыжков» в общении между агентами,
00:05:46после которого они приостанавливают работу и ждут ввода от пользователя.
00:05:49Это нужно, чтобы агенты не застревали в бесконечном цикле уточнений друг у друга.
00:05:53По достижении лимита агенты прекращают общение,
00:05:56и вам нужно отправить команду «continue», чтобы продолжить.
00:05:59Если вы хотите, чтобы агенты дольше координировались автономно, увеличьте это значение.
00:06:03Но перед тем как перейти к реализации, пара слов от нашего спонсора — Airtop.
00:06:06Если вы тратите часы каждую неделю на ручной сбор данных
00:06:10или переключение между десятками вкладок, есть способ получше.
00:06:13Airtop — это облачная платформа, где ИИ-агенты взаимодействуют с веб-сайтами как люди,
00:06:19используя шаблоны для решения самых надоедливых рутинных задач.
00:06:23Считайте, что это облачный браузер, который делает всю грязную работу за вас.
00:06:27К примеру, я использую шаблон для анализа цен конкурентов.
00:06:30Я просто даю агенту инструкции на обычном языке, никакой код не нужен,
00:06:33и он сам ходит по сайту, логинится и извлекает данные в удобном формате.
00:06:39Больше всего мне нравится, что он обходит антибот-системы и
00:06:43капчи, на которых обычно ломается стандартная автоматизация,
00:06:46что делает его невероятно надежным для больших объемов работы.
00:06:48Создавайте надежные автоматизации за минуты, регистрируйтесь в Airtop бесплатно прямо сейчас.
00:06:53Ссылка в закрепленном комментарии — начните создавать уже сегодня.
00:06:56Когда все подготовительные шаги пройдены, пора переходить к реализации.
00:07:00Мы всегда подчеркиваем важность планирования, и этот случай не исключение.
00:07:03Здесь тоже нужно начинать с плана.
00:07:05По аналогии с каналами в Slack, вы можете создавать каналы и здесь.
00:07:09Лучше всего создать отдельные каналы для фронтенда и бэкенда.
00:07:12Когда вы описываете идею приложения, система отправляет запрос в сессию Tmux
00:07:16и призывает агента проверить сообщение, так как он был упомянут.
00:07:18Агент-планировщик составляет полный план, уведомляет вас и просит утвердить его или внести правки.
00:07:23Он фиксирует план в PRD на базе того шаблона, который вы добавили ранее.
00:07:28Вы можете вносить изменения, и планировщик тут же обновит PRD.
00:07:32Инструмент использует MCP, чтобы Claude мог отправлять ответы и читать чат прямо в интерфейсе,
00:07:37что делает коммуникацию двусторонней.
00:07:39Как только план подтвержден, вы даете команду двигаться дальше.
00:07:41После одобрения PRD планировщик сам оповещает Gemini
00:07:44и просит подготовить спецификации для интерфейса.
00:07:47Затем дизайнер и планировщик начинают координировать действия,
00:07:51причем планировщик предлагает детали реализации,
00:07:54а дизайнер вносит их в план, и этот процесс идет по кругу.
00:07:59Кстати, хотя мы установили Loop Guard на 8,
00:08:02по какой-то причине это не сработало.
00:08:04Лимит циклов был достигнут уже через 4 итерации, и нам пришлось вручную продолжать диалог.
00:08:08Далее дизайнер сообщает строителю (builder), что планы готовы к реализации,
00:08:13а строитель подтверждает получение и ждет отмашки для начала работы.
00:08:18Агент-дизайнер также сообщает, что готов приступить к верстке,
00:08:22но с этим стоит повременить, пока вы сами не изучите планы.
00:08:25В канале бэкенда можно попросить строителя и планировщика проверить backend.md,
00:08:30который был создан планировщиком на этапе разработки PRD.
00:08:33Вы используете их взаимодействие для валидации документов,
00:08:37но каждый из них может найти пробелы в реализации.
00:08:40В итоге они координируются между собой, привлекая дизайнера для правок в UI-спецификациях,
00:08:44и совместно устраняют все недочеты.
00:08:47После того как всё внедрено, можно попросить планировщика провести финальное ревью.
00:08:50В нашем случае в ходе последней проверки всплыло еще несколько проблем.
00:08:54Когда их устранили, все агенты подтвердили,
00:08:56что вопросы решены и приложение готово к сборке.
00:08:59Но не спешите собирать. Есть еще один важный шаг.
00:09:02Стоит заставить их проверить планы друг друга.
00:09:04В инструменте есть несколько режимов, и вам обязательно нужно протестировать Planner Mode.
00:09:08Также доступны режимы ревью дизайна, критики кода и другие.
00:09:12Они работают в три фазы, где разные модели берут на себя разные роли.
00:09:16Агент-планировщик становится «Докладчиком», излагая проделанную работу,
00:09:20а агент-рецензент — «Оппонентом», который критикует и ставит под сомнение слова Докладчика.
00:09:24Третий агент выступает в роли «Синтезатора», объединяя результаты дискуссии.
00:09:28Сессия начинается с презентации Докладчика, после чего Оппонент критически анализирует
00:09:32выводы и устраивает стресс-тест документам, выявляя массу недочетов.
00:09:36Благодаря тому, что агенты ведут перекрестный допрос,
00:09:38они находят и исправляют кучу ошибок, которые иначе остались бы незамеченными.
00:09:42В итоге вы получаете финальный отточенный план, что завершает трехфазную сессию.
00:09:46Если вам нравится наш контент, не забудьте нажать кнопку «хайпа»,
00:09:50это помогает нам выпускать больше таких видео и охватывать больше людей.
00:09:54После завершения ревью вы просите планировщика стать оркестратором и координировать
00:09:58всех остальных агентов для реализации проекта, используя соответствующие модели.
00:10:03Он принимает задачу и запускает работу дизайнера и строителя параллельно.
00:10:06Он рассылает сообщения в каналы бэкенда и фронтенда, давая строителю
00:10:10зеленый свет на начало работ и разблокируя фронтенд-инженера для верстки дизайна.
00:10:15Работать в таком формате очень интересно: вы просто передаете
00:10:18задачу планировщику и лишь иногда запрашиваете статус выполнения.
00:10:22Наблюдать за взаимодействием агентов любопытно — они указывают друг другу на ошибки.
00:10:26Например, наш дизайнер случайно попытался исправить баг,
00:10:30который входил в зону ответственности строителя.
00:10:32И планировщик, и строитель тут же заметили, что дизайнеру не стоило этого делать,
00:10:37так как он перезаписал файл, над которым в этот момент работал строитель.
00:10:39Этот процесс шел бы куда глаже, если бы каждый агент работал в отдельном рабочем дереве (work tree),
00:10:44а один из них занимался бы общим слиянием и проверкой кода —
00:10:47это исключило бы риск взаимной перезаписи файлов.
00:10:50Имейте это в виду при настройке более сложных систем.
00:10:53Затем планировщик вызывает агента-рецензента, который детально ищет ошибки,
00:10:57составляет подробный отчет и распределяет задачи между агентами.
00:11:01Так как мы заранее установили правило, что агенты должны запрашивать помощь друг у друга,
00:11:04дизайнер попросил доступ к определенной переменной у строителя,
00:11:09и строитель его предоставил.
00:11:10Когда внутренняя проверка окончена, планировщик просит вас провести финальный осмотр фронтенда.
00:11:15Зайдя на сервер разработки,
00:11:17вы увидите, что интерфейс в точности соответствует той «геймифицированной» версии, которую вы хотели.
00:11:20У лендинга высокая контрастность, что придает ему дух видеоигры,
00:11:23а использование громких слов и отсылок делает процесс использования захватывающим.
00:11:26После теста на скорость печати вы получаете отчет о результатах.
00:11:29Данные выводятся в личном кабинете, показывая рекордную скорость,
00:11:33текущие уровни и прогресс, что делает дизайн по-настоящему иммерсивным.
00:11:37На этом наше видео подходит к концу. Если вы хотите поддержать канал и
00:11:40помочь нам выпускать больше подобных роликов, воспользуйтесь кнопкой «суперспасибо» ниже.
00:11:45Как всегда, спасибо за просмотр и до встречи в следующем видео!

Key Takeaway

Agent Chatter позволяет объединить сильные стороны различных ИИ-моделей в единую автономную экосистему для разработки сложных программных проектов без постоянного вмешательства человека.

Highlights

Взаимодействие Claude Code и Gemini CLI через новый инструмент Agent Chatter

Использование TMUX для управления несколькими терминальными сессиями агентов

Роль файла agents.md как единого центра управления правилами и поведением ИИ

Система Loop Guard для предотвращения бесконечных циклов общения между агентами

Трехфазный режим планирования с ролями Докладчика, Оппонента и Синтезатора

Возможность параллельной работы агентов над фронтендом и бэкендом в реальном времени

Timeline

Проблема коммуникации между ИИ-агентами

Автор объясняет, что современная инженерия требует тесного взаимодействия, но разные ИИ-модели имеют свои уникальные специализации. Например, Gemini отлично справляется с креативным дизайном, в то время как Claude 3.5 Opus в связке с Claude Code обеспечивает исключительную стабильность в кодинге. Главная проблема заключается в отсутствии эффективного способа заставить эти модели работать вместе автономно без ручного переноса данных. До настоящего момента пользователям приходилось самим выступать посредниками, что замедляло рабочий процесс. Решением становится инструмент, позволяющий агентам общаться напрямую, исключая человека из цепочки взаимодействий.

Обзор Agent Chatter и технические требования

Представлен Agent Chatter — чат-интерфейс для координации популярных агентов, таких как Claude Code, Gemini CLI и Codex. Инструмент поддерживает открытые модели типа Kimi и Qwen, что позволяет оптимизировать расходы, назначая дешевые модели на простые задачи реализации. Техническая основа системы на macOS и Linux базируется на мультиплексоре TMUX, который создает параллельные терминальные сессии для каждого агента. Пользователи Windows могут запускать скрипты напрямую, но для всех систем критически важно клонировать репозиторий для доступа к инициализирующим скриптам. Автор также демонстрирует собственный форк с улучшенным визуальным интерфейсом для более удобной навигации.

Настройка окружения и файлов конфигурации

Для корректной работы системы необходимо настроить права доступа в файле settings.json, чтобы агенты не запрашивали подтверждение на каждое действие. Автор рекомендует заранее инициализировать фреймворк проекта, например Next.js, чтобы избежать конфликтов между агентами на ранних этапах. Важнейшим элементом является файл agents.md, который служит общим набором правил для всех моделей, преодолевая их склонность читать только специфические инструкции вроде claude.md. Также упоминаются файлы планирования PRD и спецификации для интерфейса, которые задают жесткую структуру будущей разработки. Использование инструментов MCP (Model Context Protocol) позволяет Claude напрямую взаимодействовать с чат-интерфейсом и читать сообщения.

Механизмы контроля и безопасности (Loop Guard)

В этом разделе рассматривается настройка ролей, где каждому агенту можно присвоить имя и специализацию, например «эксперт по UI/UX». Ключевой функцией безопасности является Loop Guard — лимит на количество последовательных сообщений между агентами без участия пользователя. По умолчанию он равен 4, что предотвращает бесконечные циклы уточнений, которые могут быстро расходовать токены и бюджет. Если лимит достигнут, система приостанавливается до ввода команды «continue» со стороны человека. Также в видео представлена интеграция со спонсором Airtop, облачной платформой для автоматизации веб-задач с помощью ИИ-браузеров. Это подчеркивает тренд на использование автономных агентов не только в коде, но и в вебе.

Процесс планирования и координации агентов

Реализация проекта начинается с создания каналов в стиле Slack для разделения задач фронтенда и бэкенда. Агент-планировщик анализирует идею приложения, составляет PRD и просит пользователя утвердить план перед началом активных действий. После одобрения планировщик координирует работу дизайнера и строителя, передавая им необходимые спецификации в реальном времени. В ходе демонстрации возникла ошибка, когда Loop Guard сработал раньше времени, что потребовало ручного вмешательства для продолжения диалога. Этот этап демонстрирует, как ИИ-агенты проводят внутреннюю валидацию документов, находя пробелы в логике и исправляя их до написания первой строки кода.

Трехфазное ревью и перекрестная проверка

Автор описывает продвинутый Planner Mode, который использует трехфазную систему проверки: Докладчик, Оппонент и Синтезатор. Одна модель презентует работу, другая подвергает её жесткой критике и стресс-тесту, а третья объединяет результаты в финальный отточенный план. Такой метод «перекрестного допроса» позволяет выявить множество скрытых ошибок, которые один агент мог бы пропустить. Процесс заканчивается созданием детализированного документа, готового к реализации, что значительно повышает качество конечного продукта. Автор призывает поддерживать канал кнопкой «хайпа», если зрителям нравится такой глубокий разбор автономных рабочих процессов.

Реализация, тестирование и финальный результат

На финальном этапе планировщик становится оркестратором, запуская параллельную работу над фронтендом и бэкендом. Интересным моментом стало столкновение агентов, когда дизайнер случайно перезаписал файл строителя, что привело к выводу о необходимости использования разных рабочих деревьев (work trees). В итоге система успешно создала геймифицированное приложение для теста скорости печати с высокой контрастностью и иммерсивным дизайном. Финальная проверка подтвердила полную работоспособность всех функций и точное соответствие исходному PRD. Видео завершается демонстрацией личного кабинета пользователя и отчетом о прогрессе, подтверждая мощь синергии нескольких ИИ-агентов.

Community Posts

View all posts