Anthropic Lançou Uma Nova Maneira de "Vibe Code"

AAI LABS
Internet TechnologyComputing/Software

Transcript

00:00:00O principal problema com os agentes de IA é a janela de contexto limitada,
00:00:03que restringe o que eles lembram de ações anteriores.
00:00:06Quando damos ao Claude Code uma tarefa maior,
00:00:08ele compacta várias vezes ao tentar uma única funcionalidade,
00:00:11esquecendo a tarefa principal que lhe foi pedida para implementar,
00:00:14tornando-o menos eficaz para tarefas de longa duração.
00:00:17A Anthropic acabou de lançar uma solução baseada em como equipes reais trabalham em um ambiente de engenharia.
00:00:22Eles identificaram duas razões principais para o seu fracasso em tarefas longas.
00:00:26Muitos de nós já tentamos desenvolver aplicações inteiras ou grandes funcionalidades de uma só vez,
00:00:31e fazer demais faz com que o modelo esgote seu contexto.
00:00:34Após compactações repetidas,
00:00:35a janela de contexto é atualizada com a funcionalidade apenas pela metade,
00:00:39sem memória do progresso da funcionalidade,
00:00:41o que leva a uma implementação incompleta.
00:00:43O segundo problema é que,
00:00:44devido às suas capacidades de teste limitadas,
00:00:46o Claude marca funcionalidades não testadas como concluídas.
00:00:49Ele assume que a funcionalidade está completa,
00:00:51mesmo que não funcione corretamente.
00:00:53A solução deles foi usar um agente de inicialização e um agente de codificação em harmonia,
00:00:57inspirados em como equipes de software reais trabalham.
00:00:59Este fluxo de trabalho foi originalmente pensado para agentes que você mesmo constrói,
00:01:03mas percebi que também poderia ser aplicado a instâncias do Claude Code.
00:01:06O primeiro agente foca em inicializar corretamente seu agente de codificação,
00:01:09e você precisa ser paciente aqui porque leva um pouco de tempo.
00:01:12Tenho um projeto Next.js vazio e quero construir um compilador Python online.
00:01:16Antes de começar,
00:01:17crie um arquivo Claude.md usando o comando init.
00:01:20Este arquivo é um documento para sua base de código e fica na raiz do seu projeto,
00:01:24contendo uma visão geral e todas as informações importantes.
00:01:27Em seguida,
00:01:27gere o JSON da lista de funcionalidades na raiz do projeto.
00:01:30Ele deve listar todas as funcionalidades e seus respectivos passos de teste,
00:01:33com todos os testes marcados como falhando inicialmente,
00:01:36para que o Claude seja forçado a testá-los.
00:01:38Usamos JSON em vez de Markdown porque arquivos JSON são mais fáceis de gerenciar no contexto.
00:01:43Como o Claude só pode testar o código,
00:01:45não a interface que vemos no navegador,
00:01:47conectei o Puppeteer para testes de navegador.
00:01:49Depois disso,
00:01:49crie um script de inicialização para guiar o início do servidor de desenvolvimento e um arquivo de acompanhamento de progresso para que o sistema possa monitorar o status de conclusão do projeto.
00:01:57Para as diretrizes,
00:01:58o Claude precisa atualizar o progress.md após cada execução e testar cada funcionalidade após a implementação.
00:02:04A prática mais importante é fazer commits no Git.
00:02:07Subestimamos o quão crucial é fazer commits em um estado mesclável.
00:02:10Commits do Git com logs claros mostram o que foi concluído e permitem reverter se a implementação falhar.
00:02:15Finalmente,
00:02:16o Claude não deve alterar a lista de funcionalidades além de marcá-las como implementadas.
00:02:20Com o ambiente pronto, passamos para a parte da codificação.
00:02:23A ideia era implementar cada funcionalidade uma por uma do JSON de funcionalidades.
00:02:27O Claude também criou mensagens de commit descritivas após cada funcionalidade testada e também iniciou o navegador quando necessário.
00:02:33Assim que verificou que o aplicativo estava funcionando,
00:02:36ele atualizou os campos JSON de falso para verdadeiro e atualizou o progress.md com o que havia sido concluído até então.
00:02:42Finalmente,
00:02:42ele fez o commit das alterações e verificou se o commit foi bem-sucedido.
00:02:45A vantagem dessa abordagem incremental é que,
00:02:47mesmo que a sessão seja encerrada,
00:02:49você pode retomar exatamente de onde parou.
00:02:51Tudo é rastreado nos logs do Git,
00:02:53então você não precisa se preocupar em quebrar o código.
00:02:55O Claude pode entender o projeto pelos logs do Git e pelo arquivo de progresso,
00:02:59não pelo código em si,
00:03:00então você pode retomar a sessão facilmente.
00:03:02Seu próximo prompt é simplesmente implementar a próxima funcionalidade marcada como
00:03:06"Não concluída"
00:03:06.
00:03:06Essa abordagem também reduz a tendência do Claude de marcar funcionalidades como concluídas sem testes adequados.
00:03:11Cada iteração garante que o aplicativo seja construído de ponta a ponta com testes reais,
00:03:15ajudando a identificar bugs que não são óbvios apenas pelo código.
00:03:19Repetimos este ciclo até que todas as funcionalidades sejam marcadas como verdadeiras.
00:03:22Você pode pensar que isso é semelhante ao método BMAD.
00:03:24Compartilha semelhanças,
00:03:25mas acho que o fluxo de trabalho do Claude é melhor em alguns aspectos.
00:03:28Foi mais fácil,
00:03:29já que você não chamava os agentes separadamente,
00:03:31e a utilização do contexto também foi melhor.
00:03:33Depois de implementar tantas funcionalidades,
00:03:35ele usou apenas 84% do contexto,
00:03:37enquanto o BMAD já teria compactado duas vezes por causa das grandes histórias que ele cria.
00:03:42Dito isso,
00:03:42o BMAD ainda é um sistema completo pronto para uso,
00:03:45enquanto esta ainda é uma ideia que precisa ser implementada.
00:03:48Mas o BMAD poderia usar algumas coisas daqui,
00:03:50como o sistema Git.
00:03:51Depois de ensinar milhões de pessoas a construir com IA,
00:03:54começamos a implementar esses fluxos de trabalho nós mesmos.
00:03:57Descobrimos que poderíamos construir produtos melhores e mais rapidamente do que nunca.
00:04:00Ajudamos a dar vida às suas ideias,
00:04:02sejam aplicativos ou sites.
00:04:04Talvez você tenha assistido aos nossos vídeos pensando:
00:04:06"Tenho uma ótima ideia,"
00:04:07mas não tenho uma equipe de tecnologia para construí-la.
00:04:09"É exatamente aí que entramos."
00:04:10Pense em nós como seu copiloto técnico.
00:04:12Aplicamos os mesmos fluxos de trabalho que ensinamos a milhões diretamente ao seu projeto,
00:04:16transformando conceitos em soluções reais e funcionais,
00:04:19sem as dores de cabeça de contratar ou gerenciar uma equipe de desenvolvimento.
00:04:22Pronto para acelerar sua ideia e transformá-la em realidade?
00:04:25Entre em contato em hello@autometer.dev Chegamos ao fim deste vídeo.
00:04:29Se você quiser apoiar o canal e nos ajudar a continuar fazendo vídeos como este,
00:04:33pode fazê-lo usando o botão Super Thanks abaixo.
00:04:36Como sempre, obrigado por assistir, e vejo você no próximo.

Key Takeaway

A Anthropic propõe um novo fluxo de trabalho para agentes de IA como o Claude Code, que supera as limitações de contexto e teste através de uma abordagem incremental e estruturada, inspirada em práticas de engenharia de software, garantindo o desenvolvimento eficaz de funcionalidades complexas.

Highlights

A Anthropic lançou uma solução para a limitação da janela de contexto de agentes de IA, inspirada em equipes de engenharia reais.

O novo fluxo de trabalho utiliza agentes de inicialização e codificação para gerenciar tarefas complexas de desenvolvimento de software de forma incremental.

A metodologia envolve a criação de arquivos de documentação (`Claude.md`), listas de funcionalidades em JSON com testes obrigatórios e integração com ferramentas como Puppeteer para testes de interface do usuário.

A prática de commits incrementais no Git é crucial, permitindo rastreamento de progresso, reversão de falhas e a capacidade de retomar sessões de trabalho de onde pararam.

Essa abordagem melhora significativamente a utilização do contexto do modelo e garante testes abrangentes, reduzindo a chance de funcionalidades incompletas ou não testadas.

A solução é comparada favoravelmente ao método BMAD em termos de eficiência de contexto, embora ainda seja uma ideia em fase de implementação.

A Autometer.dev oferece serviços de desenvolvimento de produtos usando esses fluxos de trabalho baseados em IA, atuando como um copiloto técnico.

Timeline

O Problema da Janela de Contexto Limitada em Agentes de IA

Este segmento introduz o principal desafio dos agentes de IA, como o Claude Code: a janela de contexto limitada. Explica que essa restrição faz com que os modelos esqueçam tarefas principais ao tentar funcionalidades menores, tornando-os ineficazes para projetos de longa duração. O modelo compacta informações repetidamente, perdendo o foco na tarefa original. Isso resulta em implementações incompletas e na necessidade de reiniciar o processo, impactando a eficiência do desenvolvimento.

Identificação das Causas e a Solução da Anthropic

A Anthropic apresenta uma solução inovadora, baseada em como equipes de engenharia reais trabalham, para superar as falhas em tarefas longas. Duas razões principais são destacadas: a tentativa de desenvolver aplicações inteiras de uma só vez, que esgota o contexto do modelo, e as capacidades de teste limitadas, que levam o Claude a marcar funcionalidades não testadas como concluídas. A solução visa abordar esses pontos críticos para melhorar a eficácia dos agentes de IA no desenvolvimento de software.

Preparando o Ambiente com o Agente de Inicialização

Este trecho detalha o papel do agente de inicialização no novo fluxo de trabalho, que visa configurar corretamente o ambiente para o agente de codificação. Os passos incluem a criação de um arquivo `Claude.md` para documentação do projeto e a geração de um JSON com a lista de funcionalidades e seus respectivos passos de teste, inicialmente marcados como falhos para forçar o teste. É mencionada a conexão do Puppeteer para testes de navegador, já que o Claude só pode testar o código, não a interface. Além disso, são estabelecidas diretrizes cruciais como a atualização do `progress.md` e a importância de commits no Git para rastreamento e reversão.

Codificação Incremental e Testes Abrangentes

Aqui, o foco muda para o agente de codificação e a implementação incremental de funcionalidades. O Claude implementa cada funcionalidade uma por uma, criando mensagens de commit descritivas e iniciando o navegador para testes quando necessário. Após verificar o funcionamento do aplicativo, ele atualiza o JSON de funcionalidades e o `progress.md`, fazendo o commit das alterações. A principal vantagem dessa abordagem é a capacidade de retomar o trabalho exatamente de onde parou, com todo o progresso rastreado nos logs do Git, o que também reduz a tendência do Claude de marcar funcionalidades como concluídas sem testes adequados.

Comparação com BMAD e Serviços de Desenvolvimento com IA

O vídeo compara a nova abordagem com o método BMAD, destacando que o fluxo de trabalho do Claude é mais eficiente na utilização do contexto, usando apenas 84% após várias funcionalidades, enquanto o BMAD já teria compactado duas vezes. Embora o BMAD seja um sistema completo e a solução da Anthropic ainda seja uma ideia, elementos como o sistema Git poderiam ser incorporados ao BMAD. Finalmente, a Autometer.dev apresenta-se como um copiloto técnico, aplicando esses fluxos de trabalho baseados em IA para transformar ideias em produtos funcionais, oferecendo serviços de desenvolvimento de aplicativos e sites sem a necessidade de contratar uma equipe. O vídeo termina com um apelo ao apoio e informações de contato.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video