Эти циклы отладки находят 90% ошибок в коде

AAI LABS
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00Что на самом деле происходит, когда вы заставляете ИИ-агента для кодинга следовать правилам?
00:00:03Все мы сталкиваемся с одной и той же проблемой при работе с Claude и другими подобными агентами.
00:00:07Они часто не следуют инструкциям и полностью игнорируют файл Claude.md.
00:00:11И даже когда мы пытались навязать TDD, агент просто пытался сам модифицировать файлы тестов.
00:00:15В итоге мы наткнулись на набирающий популярность плагин, который набрал 58 000 звезд всего за 24 часа.
00:00:21Но это лишь наглядно показывает, как работает цикл хайпа вокруг ИИ-инструментов.
00:00:25Этот плагин обещает строгое соблюдение методологий разработки ПО прямо в рабочем процессе.
00:00:30Но вопрос заключался в том, выполняет ли он свои обещания на самом деле.
00:00:33Наша команда уже видела подобные решения, и большинство из них оказались пустышкой.
00:00:37Поэтому мы внедрили этот плагин в реальные рабочие процессы, чтобы проверить, стоит ли он внимания.
00:00:43Superpowers — это плагин, внедряющий традиционные методологии разработки прямо в вашу AI IDE.
00:00:50Кто-то может подумать, что существующие фреймворки вроде BMAD или OpenSpec делают то же самое.
00:00:56Но этот проект отличается: это не просто система агентов для написания спецификаций.
00:01:01Это внедрение agile-методологии прямо в рабочий процесс со строгими проверками на каждом этапе.
00:01:10Эти «ворота» — явные контрольные точки, не дающие Claude отклоняться от инструкций.
00:01:15Основная философия плагина — это TDD и системный процесс вместо догадок.
00:01:20Он проводит верификацию перед завершением проекта, исправляя типичные ошибки нейросетей.
00:01:28Агент не перейдет к следующему шагу, пока не получит подтверждение от пользователя.
00:01:32Вкратце: он нативно использует все лучшие практики, избавляя от необходимости ручной настройки.
00:01:40Плагин делает упор на настоящий TDD и принципы программирования, такие как DRY и YAGNI.
00:01:50Он доступен для всех платформ ИИ.
00:01:52Так как мы работали с Claude Code, мы сначала скопировали команду регистрации и установили плагин.
00:02:02После установки и перезапуска Claude Code плагин Superpowers стал доступен в проекте.
00:02:08Мы дали ему задачу: создать систему управления проектами, похожую на Trello.
00:02:15Он сам активировал навык мозгового штурма и начал с анализа структуры проекта вместо догадок.
00:02:24Он задал много уточняющих вопросов о целевой аудитории и стеке технологий.
00:02:33Например, он указал, что выбранная нами БД может создать проблемы с безопасностью, и мы её заменили.
00:02:44Он продолжал уточнять детали до тех пор, пока нас полностью не устроили все варианты.
00:02:48После подтверждения он предложил три подхода к реализации, из которых нам нужно было выбрать один.
00:02:55Мы выбрали понравившийся вариант и внесли в него свои правки.
00:02:58Как только это было сделано, он предоставил нам архитектурный дизайн.
00:03:02Затем последовал UX-дизайн, где описывалось управление досками.
00:03:06Он также полностью согласовал с нами структуру всего проекта.
00:03:09Когда дизайн был утвержден, он задокументировал все данные в папке docs.
00:03:13Здесь плагин обходит конкурентов, так как он сам делает git-коммиты для каждого изменения.
00:03:22После планирования включился навык написания плана реализации, который был сразу закоммичен.
00:03:29План разбивал большое приложение на простые подзадачи.
00:03:33Вы можете подумать, что встроенный режим планирования Claude и так это делает.
00:03:37Но разница в том, что обычное планирование Claude Code — это лишь общие рекомендации для агента.
00:03:44Там он сам принимает мелкие решения, например, по выбору UI-библиотек.
00:03:52Superpowers же — это жесткий контроль: вы не пройдете дальше, пока текущий этап не завершен.
00:04:01Затем он предложил варианты реализации, и мы выбрали метод на основе субагентов.
00:04:09Этот метод автоматически создает git worktree для каждого субагента, чтобы они не мешали друг другу.
00:04:20Изоляция в рабочих деревьях необходима, иначе агенты будут перезаписывать код друг друга.
00:04:28И это именно то, что плагин берет на себя в нативном режиме.
00:04:31Когда план был финализирован, Claude перешел к фазе реализации.
00:04:34После каждой задачи запускался отдельный процесс проверки на соответствие спецификациям.
00:04:41После коммита в git активировался навык код-ревьюера.
00:04:46К следующей задаче он переходил только после того, как качество кода подтверждали другие агенты.
00:04:54В конце он спросил: объединить изменения в ветку main или создать PR?
00:05:04Мы попросили его быстро влить всё в основную ветку.
00:05:06Он удалил рабочие деревья и закоммитил весь проект в ветку main.
00:05:11Этот процесс сильно расходует контекстное окно: одна итерация заняла почти 50% объема.
00:05:24Получившийся проект был простым, с базовым функционалом.
00:05:27Мы хотели, чтобы списки были упорядочены по статусам: To Do, In Progress и Done.
00:05:32И хотя карточки были на месте, мы хотели сделать сами списки перемещаемыми.
00:05:36Мы вернулись в Claude Code, но сначала он начал работать по старинке, без навыков плагина.
00:05:42Вероятно, из-за нехватки контекста нам пришлось напомнить ему использовать Superpowers.
00:05:48После напоминания он вернулся к структурированному выполнению задач.
00:05:52Агенты в отдельных рабочих деревьях показывают себя лучше, так как нативно используют TDD.
00:06:02Сначала они пишут тесты для каждой части функционала, которую нужно реализовать.
00:06:05Затем агент пишет код, не меняя сами тесты, и добивается их успешного прохождения.
00:06:13Жесткие промпты не дают ему менять тесты или искать оправдания, чтобы пропустить шаги.
00:06:23Эти инструкции звучат как: «даже если шанс использования навыка 1%, используй его».
00:06:29Это гарантирует, что каждая задача выполняется строго по структуре.
00:06:32Стоит отметить, что из-за последовательного выполнения это занимает больше времени, чем обычно.
00:06:41Но строгие правила гарантируют, что приложение работает именно так, как задумано.
00:06:45Как я и говорил, контекст тает быстро: пара задач — и осталось всего 5%.
00:06:53Перед продолжением мы использовали команду compact, чтобы не потерять контекст при обсуждении.
00:07:01После сжатия истории мы дали задачу на следующую фичу, и процесс пошел по той же схеме.
00:07:07Лучшее в этой сессии — отсутствие догадок: агент задавал вопросы под разными углами.
00:07:17Плагин заставлял Claude прояснять даже мелочи, вроде вида пустых колонок, о чем ИИ обычно гадает.
00:07:29Руководство по эффективному использованию плагина доступно в AI Labs Pro.
00:07:33Это наше сообщество, где вы найдете готовые шаблоны для своих проектов.
00:07:42Если вы цените наш труд, это лучший способ поддержать канал. Ссылка в описании.
00:07:48Еще одна сильная сторона — возможность систематической отладки.
00:07:52Мы столкнулись с багом сохранения данных и попросили Claude найти причину через системный дебаг.
00:08:01Он запустил соответствующий навык, работа которого разделена на четыре фазы.
00:08:06На первой фазе он выявил корень проблемы, задавая нам вопросы.
00:08:10Опираясь на наши ответы, он провел расследование и нашел проблемный файл.
00:08:16Вторая фаза была направлена на изоляцию бага, а третья — на поиск точной причины сбоя.
00:08:25Четвертая фаза — само исправление. Весь процесс был структурирован и завершился тестированием.
00:08:35Многие задачи не требуют полного цикла плагина. Например, для правок в UI это было бы излишне.
00:08:47Для таких случаев можно использовать упрощенный подход.
00:08:51Мы попросили его улучшить интерфейс, но ограничиться только мозговым штурмом и планом.
00:09:01Он начал с вопросов о визуальном стиле и дизайне, чтобы понять направление.
00:09:08Затем Claude остановился после планирования, и мы поручили ему реализацию без строгого процесса.
00:09:15UI обновился гораздо быстрее, но изменения все равно были закоммичены в нужном формате.
00:09:25Приложение превратилось из простого макета в стильный продукт с продуманным интерфейсом.
00:09:32Это и делает фреймворк практичным: используйте его там, где Claude обычно ошибается.
00:09:43На этом всё. Если хотите поддержать канал, воспользуйтесь кнопкой «Суперспасибо».
00:09:51Спасибо за просмотр, и до встречи в следующем видео!

Key Takeaway

Плагин Superpowers превращает Claude из склонного к догадкам помощника в дисциплинированного инженера, строго следующего методологиям TDD и Agile через систему принудительных проверок и изоляцию задач.

Highlights

Плагин Superpowers внедряет строгие Agile-методологии и TDD непосредственно в рабочий процесс AI-агентов.

Использование изолированных рабочих деревьев (git worktree) позволяет нескольким субагентам работать одновременно без конфликтов в коде.

Система «контрольных ворот» предотвращает отклонение Claude от инструкций, требуя подтверждения пользователя на каждом этапе.

Автоматизация процесса тестирования гарантирует, что агент не может модифицировать тесты для сокрытия ошибок в коде.

Метод систематической четырехфазной отладки позволяет эффективно находить и устранять сложные баги в архитектуре приложения.

Высокое потребление контекстного окна (до 50% за итерацию) требует использования специальных команд сжатия истории.

Timeline

Проблемы AI-агентов и появление Superpowers

Автор обсуждает распространенную проблему, когда Claude и другие агенты игнорируют файлы инструкций и нарушают принципы TDD. Часто нейросети пытаются подстроить тесты под свой нерабочий код вместо исправления ошибок. В ответ на это появился плагин Superpowers, который стремительно набрал популярность в сообществе разработчиков. Инструмент обещает внедрить жесткие стандарты разработки прямо в IDE. Команда решила протестировать его в реальных условиях, чтобы отличить реальную пользу от маркетингового хайпа вокруг ИИ-инструментов.

Философия и основные функции плагина

Superpowers отличается от обычных генераторов спецификаций тем, что он нативно интегрирует Agile-методологию в Claude Code. Основу системы составляют «ворота» — контрольные точки, которые не дают агенту двигаться дальше без верификации текущего этапа. Плагин делает упор на классические принципы программирования, такие как DRY и YAGNI, исключая элемент угадывания со стороны ИИ. Каждое действие сопровождается автоматическими git-коммитами, что обеспечивает полную прослеживаемость изменений. Это превращает хаотичное написание кода в предсказуемый инженерный процесс с обязательной проверкой качества.

Практическая реализация: от идеи до архитектуры

В качестве тестового задания была выбрана разработка системы управления проектами в стиле Trello. Процесс начался с активации навыка мозгового штурма, где агент задавал глубокие уточняющие вопросы о стеке и безопасности. Вместо того чтобы сразу писать код, система предложила три варианта реализации на выбор пользователя. После утверждения дизайна и UX, плагин автоматически задокументировал все решения в папке docs. Важной деталью является то, что каждое архитектурное решение фиксировалось в системе контроля версий. Такой подход гарантирует, что финальный продукт будет полностью соответствовать ожиданиям заказчика.

Использование субагентов и изоляция задач

Автор объясняет ключевое различие между стандартным режимом Claude и работой под управлением Superpowers в контексте планирования. Плагин разбивает приложение на мелкие подзадачи и делегирует их субагентам, создавая для каждого отдельное рабочее дерево git. Это критически важно, так как предотвращает перезаписывание кода разными агентами в одном контексте. После выполнения задачи запускается процесс код-ревью другими агентами для подтверждения качества. Весь цикл завершается слиянием изменений в основную ветку и удалением временных рабочих пространств. Однако стоит учитывать, что такая тщательность потребляет значительный объем контекстного окна модели.

Строгий TDD и управление контекстом

При доработке функционала перемещения списков автор столкнулся с тем, что Claude иногда забывает использовать навыки плагина без напоминания. После активации Superpowers агент вернулся к строгому циклу TDD: сначала пишутся тесты, затем реализуется функционал. Жесткие системные промпты запрещают ИИ менять файлы тестов, заставляя его добиваться их прохождения честным путем. Для экономии стремительно тающего контекста автор использует специальную команду compact, которая сжимает историю диалога. Несмотря на то что процесс занимает больше времени, он исключает ошибки, связанные с «галлюцинациями» и догадками модели. Для более глубокого изучения этих техник упоминается сообщество AI Labs Pro.

Системная отладка и гибкие рабочие процессы

Заключительная часть видео посвящена уникальному четырехфазному навыку отладки, который находит корень проблемы через серию логических шагов. Первая фаза выявляет проблему через диалог, вторая изолирует баг, третья ищет причину, а четвертая вносит и тестирует исправления. Автор также отмечает, что для простых задач, таких как правки интерфейса, полный цикл может быть избыточным. В таких случаях можно использовать гибридный подход: глубокое планирование с последующей быстрой реализацией без строгих проверок. Это делает фреймворк гибким инструментом, который можно адаптировать под сложность конкретной задачи. В конце видео автор благодарит зрителей и предлагает поддержать канал через функцию «Суперспасибо».

Community Posts

View all posts