Estes Loops de Erros Estão Capturando 90% das Falhas de Programação

AAI LABS
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00O que realmente acontece quando você força um agente de codificação a seguir as regras?
00:00:03Todos nós temos uma dificuldade comum ao trabalhar com o Claude e outros agentes de codificação.
00:00:07Eles tendem a não seguir as instruções e ignoram completamente o arquivo Claude.md.
00:00:11E mesmo quando tentamos forçar o TDD, ele simplesmente tentava modificar os próprios arquivos de teste.
00:00:15Foi então que encontramos este plugin que estava se tornando popular, ganhando 58.000 estrelas em apenas 24 horas.
00:00:21Mas isso apenas mostra como é o ciclo de hype em torno das ferramentas de IA.
00:00:25Este plugin promete a aplicação rigorosa de metodologias de desenvolvimento de software no fluxo de trabalho.
00:00:30Mas a questão era se ele realmente cumpre o que promete.
00:00:33Nossa equipe já viu fluxos de trabalho semelhantes surgirem e a maioria acabou sendo apenas hype.
00:00:37Então, colocamos este plugin em fluxos de trabalho reais para ver se vale a pena implementar em projetos reais ou se é só barulho.
00:00:43O Superpowers é um plugin que impõe a metodologia tradicional de desenvolvimento de software direto na IDE de IA que você está usando.
00:00:50Agora, alguns podem pensar que frameworks ágeis existentes, como BMAD e OpenSpec, já fazem a mesma coisa.
00:00:56Mas este é diferente porque não é apenas um sistema de agente usado para escrever as especificações do projeto.
00:01:01É a imposição da mesma metodologia ágil diretamente no fluxo de trabalho, com bloqueios rigorosos para garantir que o agente não avance até que a etapa atual seja aprovada.
00:01:10Esses bloqueios são checkpoints explícitos para evitar que o Claude se desvie do que foi instruído.
00:01:15A filosofia central por trás da abordagem deste plugin é o TDD e um processo sistemático em vez de suposições.
00:01:20Ele verifica antes de declarar que o projeto foi bem-sucedido, tendo instruções sob medida para atingir as áreas comuns onde a IA costuma falhar e corrigi-las.
00:01:28Ele não avança para a próxima etapa até receber o sinal verde do usuário.
00:01:32Em resumo, ele utiliza todas as melhores práticas que mencionamos em nossos vídeos anteriores, integradas nativamente, eliminando a necessidade de configuração manual.
00:01:40Assim, o plugin enfatiza o verdadeiro desenvolvimento orientado a testes (red-green TDD) e outros princípios como DRY e YAGNI, que aprendemos no desenvolvimento de software.
00:01:50Ele está disponível para todas as plataformas de IA.
00:01:52Mas como nossa equipe estava usando o Claude Code, apenas copiamos o comando de registro do marketplace primeiro, adicionamos ao projeto Claude Code e instalamos o plugin.
00:02:02E uma vez instalado, e com o reinício do Claude Code, este plugin superpowers ficou disponível para uso no projeto.
00:02:08Assim que reiniciamos o Claude Code, demos um prompt dizendo que queríamos construir um software de gerenciamento de projetos semelhante ao Trello.
00:02:15Ele ativou a habilidade de brainstorming por conta própria e, em vez de adivinhar o que precisava ser construído, usou as funcionalidades da habilidade para identificar o projeto.
00:02:24Fez muitas perguntas para esclarecer o app, para quem seria o projeto e a stack tecnológica que queríamos usar, considerando os problemas de cada escolha.
00:02:33Na seleção do banco de dados, sugeriu que nossa escolha poderia não ser a correta por problemas de segurança, já que rodaria no navegador sem acesso pelo servidor, e nós mudamos.
00:02:44Ele continuou esclarecendo todos os detalhes até estarmos satisfeitos com as opções.
00:02:48Depois de confirmar tudo conosco, o próximo passo foi apresentar três abordagens para escolhermos uma a ser implementada.
00:02:55Escolhemos a opção que gostamos e sugerimos mudanças junto com a seleção.
00:02:58Assim que terminou, ele também nos forneceu o design da arquitetura.
00:03:02Em seguida, nos deu o design de UX, mencionando como os quadros seriam manipulados.
00:03:06Ele também confirmou toda a estrutura do projeto conosco.
00:03:09E uma vez que todo o design foi aprovado, ele documentou todos os dados em uma pasta de documentos.
00:03:13É aqui que este plugin vence os outros, pois possui instruções git integradas para commitar cada mudança, o que outros frameworks não faziam e tínhamos que forçar manualmente.
00:03:22Assim, após a habilidade de brainstorming criar os planos, a habilidade de escrita de plano foi invocada, escreveu o plano de implementação e fez o commit.
00:03:29O plano dividiu a aplicação grande em subtarefas que eram mais fáceis de implementar.
00:03:33Você pode pensar que o modo de planejamento integrado do Claude já faz tudo isso sozinho.
00:03:37Mas a principal diferença é que o planejamento do Claude Code serve apenas como orientação para o que o agente precisa fazer.
00:03:44Ele faz apenas perguntas sobre a stack tecnológica que julga necessárias e toma decisões menores, como bibliotecas de UI, por conta própria.
00:03:52Por outro lado, o superpowers é uma imposição, o que significa que você não pode avançar até que a etapa atual seja concluída, garantindo a execução do plano.
00:04:01Assim que a fase de planejamento terminou, ele nos perguntou como gostaríamos de implementar o plano, e escolhemos a implementação baseada em subagentes.
00:04:09O Claude também cria subagentes sozinho, mas as habilidades aqui eram diferentes porque ele configurava automaticamente um git worktree para cada subagente para isolar o trabalho.
00:04:20O agente precisa ser isolado por worktrees para trabalhar melhor; se trabalharem no mesmo diretório, eles sobrescrevem o trabalho um do outro.
00:04:28E esta é a principal coisa que ele gerencia de forma nativa.
00:04:31Com o planejamento finalizado, o Claude passou para a fase de implementação.
00:04:34Ele iniciava uma tarefa e, ao terminar, criava uma sub-tarefa de revisão separada para verificar a implementação em relação às especificações.
00:04:41Após o commit no git, ele usava outra habilidade do superpower, que é o revisor de código (code reviewer).
00:04:46Somente quando a qualidade do código era aprovada pelos agentes anteriores, ele iniciava a próxima tarefa, iterando nas anteriores até atingir a qualidade.
00:04:54Com cada tarefa concluída, revisada e commitada no git, garantindo a ordem sequencial, ele nos perguntava se deveria fazer o merge no main ou criar um PR.
00:05:04Pedimos para ele fazer o merge no main rapidamente.
00:05:06Ele então removeu todas as worktrees e commitou o projeto inteiro diretamente no branch main.
00:05:11Esse processo consome muita janela de contexto devido aos subagentes e múltiplas habilidades; para nós, uma iteração usou quase 50%, exigindo cuidado.
00:05:24O projeto criado era simples e tinha funcionalidades básicas.
00:05:27Queríamos que as listas fossem ordenadas pelos estados atuais: a fazer, em andamento e concluído.
00:05:32E embora houvesse os cards individuais, queríamos que essas listas também fossem móveis.
00:05:36Voltamos ao Claude Code e pedimos para lidar com isso, mas ele começou do jeito normal do Claude, sem as habilidades do plugin.
00:05:42Deve ser porque muito contexto foi consumido, e tivemos que lembrá-lo de usar o plugin superpowers.
00:05:48Após o lembrete, ele começou a realizar as tarefas da mesma forma que fez anteriormente.
00:05:52Após passar pelas etapas, o Claude criou agentes em worktrees separadas, e é aqui que eles se superam, pois usam a abordagem de TDD nativamente.
00:06:02Esses agentes primeiro escrevem testes para cada parte que seria implementada.
00:06:05Com os testes escritos, ele garantia que o agente escrevesse o código sem modificar os casos de teste, assegurando que os testes passassem.
00:06:13As habilidades do plugin usavam comandos fortes que impediam a modificação dos testes, invalidando as desculpas que o Claude costuma dar para pular etapas.
00:06:23Esses comandos são instruções explícitas como “se houver 1% de chance de usar uma habilidade, use-a”.
00:06:29Isso garantiu que cada tarefa fosse realizada de forma estruturada e adequada.
00:06:32Note que esses agentes realizavam as tarefas sequencialmente, então demorava mais para completar uma tarefa do que o Claude nativo.
00:06:41Mas, como impunha diretrizes rígidas, garantia que a aplicação funcionasse conforme o pretendido.
00:06:45Como mencionamos, o contexto é consumido rápido com este plugin, onde apenas algumas tarefas deixam apenas 5% de contexto disponível.
00:06:53Antes de prosseguir, executamos o comando compact para não perder contexto enquanto o Claude fazia o brainstorming para a próxima tarefa.
00:07:01Após compactar a conversa, demos o prompt da próxima funcionalidade e ele começou da mesma maneira.
00:07:07A melhor parte foi que ele não agiu por conta própria adivinhando implementações; continuou fazendo perguntas de vários ângulos para garantir o que queríamos.
00:07:17O plugin desafiou o Claude em tudo, esclarecendo casos extremos no brainstorming, como o visual de colunas vazias—algo que o Claude sozinho poderia ter apenas suposto.
00:07:29As diretrizes para usar melhor este plugin estão disponíveis no AI Labs Pro.
00:07:33Nossa comunidade recém-lançada, onde você obtém templates prontos para usar em seus projetos, tanto para este vídeo quanto para os anteriores.
00:07:42Se você valoriza nosso trabalho e quer apoiar o canal, esta é a melhor forma. O link está na descrição.
00:07:48Outro ponto forte é a habilidade de realizar depuração sistemática.
00:07:52Encontramos um bug no salvamento de dados ao atualizar a página; demos um prompt vago ao Claude e pedimos para usar a depuração sistemática para corrigir.
00:08:01Ele carregou a habilidade de depuração sistemática. O trabalho foi dividido em quatro fases.
00:08:06A primeira fase identificou a causa raiz nos fazendo perguntas sobre o problema.
00:08:10A partir da nossa resposta, ele investigou na direção indicada e encontrou o arquivo que poderia estar com problema.
00:08:16Com a causa identificada, a fase dois focou em isolar o bug, enquanto a fase três detalhou o motivo real do erro para que pudesse ser corrigido.
00:08:25A fase quatro foi a aplicação da correção. O processo tornou a depuração muito mais estruturada do que apenas vasculhar o código, e terminou com testes.
00:08:35Existem muitas tarefas que não exigem o fluxo completo do plugin, onde usá-lo seria excessivo, como mudar a UI do app sem querer esperar 15 minutos.
00:08:47Para esses tipos de tarefas que não precisam de todo o processo, podemos implementá-las de uma forma mais simples.
00:08:51Como não tínhamos um objetivo fixo para o visual, pedimos para melhorar a UI e dissemos para não iniciar a implementação, apenas o brainstorming e planejamento.
00:09:01Ele começou com o brainstorming e nos perguntou qual direção visual queríamos, fazendo perguntas sobre diferentes aspectos do design.
00:09:08O Claude parou após o planejamento, como pedido; depois, solicitamos a implementação do plano sem usar o processo completo.
00:09:15A UI foi alterada em um tempo muito menor e, mesmo assim, ele commitou as mudanças no git seguindo o formato que o processo impunha.
00:09:25O app passou de um layout básico para um com esquema de cores melhorado, estados de hover nos cards e um layout mais funcional.
00:09:32Isso torna o framework prático. Você deixa o Claude agir sem o processo quando ele já é bom nisso e usa o processo completo onde ele tende a falhar.
00:09:43Isso nos traz ao fim deste vídeo. Se quiser apoiar o canal e nos ajudar a continuar fazendo vídeos assim, use o botão de “Valeu demais” abaixo.
00:09:51Como sempre, obrigado por assistir e vejo você no próximo.

Key Takeaway

O plugin Superpowers transforma agentes de IA em desenvolvedores disciplinados ao impor fluxos de trabalho rigorosos de TDD e engenharia de software, eliminando a tendência da IA de ignorar instruções ou pular etapas cruciais.

Highlights

O plugin Superpowers impõe metodologias ágeis e TDD rigoroso diretamente em IDEs de IA como o Claude Code.

A ferramenta utiliza 'checkpoints' obrigatórios e bloqueios que impedem o agente de avançar sem a aprovação do usuário.

Uso nativo de Git worktrees para isolar subagentes, evitando que um sobrescreva o trabalho do outro em tarefas complexas.

Implementação de um ciclo sistemático de depuração dividido em quatro fases para identificar e corrigir a causa raiz de bugs.

Capacidade de alternar entre o fluxo rigoroso para lógica crítica e um fluxo simplificado para tarefas visuais ou de UI.

Consumo elevado de contexto (janela de tokens) devido à complexidade das instruções e do uso de múltiplos agentes.

Timeline

Introdução e o Problema dos Agentes de IA

O vídeo começa abordando uma frustração comum entre desenvolvedores que utilizam o Claude e outros agentes: a tendência dessas ferramentas em ignorar arquivos de configuração e pular etapas de teste. O narrador menciona o surgimento de um novo plugin chamado Superpowers, que ganhou enorme tração na comunidade técnica em pouco tempo. O objetivo principal é testar se essa ferramenta realmente entrega a aplicação rigorosa de metodologias de software ou se é apenas mais um produto do ciclo de hype da IA. A equipe decide colocar o plugin em fluxos de trabalho reais para validar sua utilidade prática em projetos sérios. Este segmento estabelece a necessidade de maior controle sobre a autonomia excessiva e muitas vezes errática dos modelos de linguagem.

O Conceito e a Filosofia do Superpowers

Nesta seção, o Superpowers é detalhado como um plugin que integra metodologias tradicionais de desenvolvimento, como DRY, YAGNI e especialmente o TDD (Red-Green), diretamente na IDE. Diferente de outros frameworks que apenas sugerem especificações, este sistema impõe bloqueios rígidos onde o agente não pode prosseguir sem o sinal verde do usuário em checkpoints específicos. A filosofia central foca na substituição de suposições por processos sistemáticos, visando corrigir as áreas onde a IA geralmente falha por excesso de confiança. O plugin elimina a necessidade de configurações manuais complexas ao trazer essas melhores práticas integradas nativamente. É destacado que o sistema funciona como uma camada de governança sobre a inteligência artificial, garantindo conformidade técnica.

Instalação e Fase de Brainstorming

A equipe demonstra a instalação do plugin no Claude Code através do marketplace e inicia o desenvolvimento de um clone do Trello para testar a ferramenta. O plugin ativa imediatamente uma habilidade de brainstorming que, em vez de adivinhar requisitos, faz perguntas exaustivas sobre a stack tecnológica e segurança do projeto. Durante o processo, a IA desafia as escolhas do usuário, sugerindo mudanças no banco de dados por questões de segurança arquitetural. Após o alinhamento, o sistema gera o design de UX, a arquitetura e documenta tudo em pastas específicas, realizando commits automáticos no Git para cada decisão tomada. Esta fase demonstra como o plugin força uma fundação sólida antes de qualquer linha de código ser escrita.

Implementação com Subagentes e Worktrees

O vídeo explica a diferença crucial entre o planejamento nativo do Claude e a execução via Superpowers, onde o último garante que o plano seja seguido à risca. Para a implementação, o plugin utiliza subagentes isolados em 'Git worktrees' diferentes, o que evita conflitos de código e sobrescritas acidentais entre os agentes. O fluxo inclui um revisor de código automatizado que valida a qualidade da implementação antes de permitir o avanço para a próxima tarefa sequencial. O narrador faz um alerta importante sobre o alto consumo de contexto, mencionando que uma única iteração pode consumir até 50% da janela disponível. Ao final, o sistema gerencia o merge no branch principal e a limpeza do ambiente de trabalho de forma organizada.

Testes de TDD e Gestão de Contexto

Ao tentar adicionar novas funcionalidades, a equipe percebe que o Claude tenta voltar ao comportamento padrão 'preguiçoso', exigindo um lembrete para usar as habilidades do plugin. Uma vez reativado, o Superpowers demonstra sua força no TDD nativo, escrevendo testes primeiro e impedindo que o agente modifique os arquivos de teste para 'trapacear' nos resultados. O uso de comandos fortes e instruções explícitas garante que o agente siga a estrutura correta, mesmo que isso leve mais tempo que o normal. Para gerenciar a falta de memória técnica, o vídeo mostra o uso do comando 'compact' para preservar o contexto essencial durante o brainstorming de novas tarefas. O narrador reforça que essa abordagem sistemática evita que o Claude tome decisões visuais ou lógicas sem consulta prévia.

Depuração Sistemática e Fluxos Flexíveis

A parte final do vídeo destaca a habilidade de depuração sistemática, que divide a correção de bugs em quatro fases distintas: identificação da causa raiz, isolamento, detalhamento e correção final com testes. O processo é exemplificado com a correção de um erro de persistência de dados que foi resolvido de forma estruturada em vez de tentativas aleatórias. O narrador também explica que o plugin é prático por permitir fluxos mais rápidos e simples para tarefas de UI que não exigem o rigor total do TDD. O aplicativo evolui de um visual básico para algo profissional com esquema de cores e estados interativos em poucos minutos através dessa abordagem híbrida. O vídeo encerra incentivando o apoio à comunidade AI Labs Pro para acesso a templates e guias detalhados.

Community Posts

View all posts