Este Novo Designer Desbloqueia o Claude Code

AAI LABS
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00A engenharia sempre foi um processo muito colaborativo devido à escala do trabalho e aos diferentes papéis envolvidos.
00:00:05Isso mudou por causa da IA, mas ao mesmo tempo ela traz novas formas de colaboração.
00:00:09Modelos diferentes têm pontos fortes diferentes, seja em suas funções ou em seu custo.
00:00:13Vamos pegar um exemplo.
00:00:14É um fato bem conhecido que os modelos Gemini mais recentes são realmente ótimos em design.
00:00:18Eles são muito mais criativos do que qualquer modelo Claude, especialmente se você der menos instruções.
00:00:23Mas, no geral, o Opus 4.6 é um modelo excepcional,
00:00:26especialmente com o Claude Code como ferramenta de suporte, que é muito mais estável que o Gemini CLI.
00:00:31Mas não há uma maneira eficiente de usá-los juntos em um fluxo de trabalho compartilhado.
00:00:35Mesmo que tente usá-los, você terá que fazer muito trabalho manual,
00:00:38e não há como fazer esses agentes trabalharem de forma autônoma.
00:00:41Recentemente, encontramos uma ferramenta que resolve esse problema de comunicação permitindo que diferentes
00:00:46agentes com modelos diferentes conversem entre si, nos removendo do meio do processo.
00:00:50O Agent Chatter é uma interface de chat para coordenação em tempo real de agentes de IA.
00:00:55Ele suporta os três agentes mais populares, como Claude Code, Gemini CLI e Codex,
00:01:00além de modelos de código aberto como Kimi, Qwen e outros.
00:01:03Você também pode usá-lo para economizar custos, deixando agentes caros como o Claude fazerem o planejamento
00:01:07e deixando o Kimi ou o GLM cuidarem da implementação.
00:01:10Ele usa um chat compartilhado com vários canais e permite que os agentes falem entre si
00:01:14e implementem funcionalidades de forma coordenada.
00:01:16Nossa impressão inicial da ferramenta foi que a interface padrão não era tão polida.
00:01:20Mas, como este é um projeto de código aberto, fizemos um fork do repositório original e criamos
00:01:24uma camada visual por cima, que nos parece muito melhor e mais fácil de navegar
00:01:28com certas mudanças que atenderam às nossas necessidades.
00:01:31Enviamos essa versão para o nosso fork, mantendo intacta a funcionalidade original.
00:01:35Mas todo o crédito pela arquitetura subjacente desta plataforma vai para o criador original.
00:01:40Agora, este projeto contém um conjunto de scripts
00:01:43que você precisa executar uma vez para inicializar os agentes para esta ferramenta.
00:01:46Esses scripts são os pontos de entrada para rodar o sistema,
00:01:49e sem eles você não consegue rodar nenhum agente.
00:01:51Para acessar esses scripts, você precisa clonar todo o repositório.
00:01:54O repositório contém basicamente scripts para inicializar todos os agentes separadamente.
00:01:58Mas antes de usar os scripts, se estiver no Mac OS ou Linux, você precisa ter o TMUX instalado.
00:02:02O TMUX é basicamente um multiplexador de terminal.
00:02:05Ele permite criar várias sessões de terminal e controlar todas elas a partir de um único ponto.
00:02:09Isso é o que o chat de agentes usa por baixo,
00:02:11para enviar tarefas para cada agente de terminal que está rodando.
00:02:14Para quem está no Windows, você pode rodar os scripts diretamente e vai funcionar.
00:02:18Eles listaram todos os comandos para rodar os scripts de cada agente.
00:02:21Por exemplo, se você for usar o Claude Code e o Gemini CLI juntos,
00:02:26copie os comandos para eles e cole-os no terminal, na pasta onde clonou o repositório.
00:02:31Você pode selecionar os comandos para os agentes que desejar rodar.
00:02:34Assim que colar o comando, uma sessão de agente surgirá na sessão do TMUX.
00:02:38Você pode usar quantos agentes quiser na sua configuração.
00:02:40Por exemplo, você pode configurar quatro agentes: três sessões do Claude e uma do Gemini.
00:02:44Mas não importa quantos agentes use, cada um precisa rodar em um terminal dedicado.
00:02:49Então, se estiver rodando quatro sessões, precisará de quatro terminais rodando lado a lado,
00:02:53e poderá controlar todos eles a partir da sessão única de chat na ferramenta.
00:02:56Agora, com tudo instalado, ao navegar para localhost,
00:03:00você deverá ver todos os agentes que iniciou exibidos no painel de chat.
00:03:03Para aproveitar ao máximo esta ferramenta,
00:03:06existem certos passos que ajudarão você a trabalhar de forma mais eficiente.
00:03:09Recomenda-se inicializar o framework que você está usando para criar seu app antes de usar a ferramenta,
00:03:14pois este é um ponto que faz com que vários agentes tenham conflitos, mesmo com funções diferentes.
00:03:20Portanto, certifique-se de que seu app Next.js ou qualquer outro framework já esteja inicializado.
00:03:25Primeiro, como cada um dos agentes está rodando como uma sessão separada do Claude ou Gemini,
00:03:29você terá que aprovar manualmente as permissões para cada um individualmente.
00:03:33Embora forneçam scripts para rodar em modo "pular permissões",
00:03:36isso não é recomendado, pois com vários agentes, o risco de um apagar o trabalho do outro é muito maior.
00:03:42Então, você terá que configurar o settings.json tanto do Claude Code quanto do Gemini CLI com as permissões adequadas.
00:03:48Dessa forma, se uma edição de arquivo ou comando de build precisar rodar, não esperará por sua aprovação manual,
00:03:53e ao mesmo tempo você mantém o controle sobre os comandos perigosos.
00:03:56Outra coisa importante é garantir que as ferramentas MCP também estejam configuradas no arquivo,
00:04:01caso contrário, você teria que aprová-las também.
00:04:03Você também deve criar um arquivo agents.md.
00:04:05Atualmente, ele serve como um template contendo uma estrutura otimizada para o uso dos agentes,
00:04:09que posteriormente é preenchido por eles.
00:04:11Ele inclui as regras de função, comportamento e todos os princípios que os agentes devem seguir.
00:04:15Você também precisará de arquivos de planejamento como um PRD, e templates de especificações de back-end e UI,
00:04:20que estávamos usando como modelos e que serão preenchidos depois pelo agente de planejamento.
00:04:24O objetivo de usar esses templates é fornecer estrutura para que os agentes não adicionem conteúdo desnecessário.
00:04:30Todos esses templates estão disponíveis no AI Labs Pro, de onde você pode baixá-los e usá-los.
00:04:35Se você encontrou valor no que fazemos e quer apoiar o canal,
00:04:38o AI Labs Pro é a melhor maneira de fazer isso.
00:04:40O link estará na descrição.
00:04:42Outra coisa que esta ferramenta permite é dar um nome a cada agente e atribuir uma função específica.
00:04:47Isso facilita a identificação do agente e faz com que ele trabalhe de acordo com um papel sob medida.
00:04:52Por exemplo, se estiver usando o Gemini para design de interface,
00:04:55você pode renomeá-lo adequadamente e atribuir a ele a função personalizada de especialista em UI/UX.
00:04:59Você atribui nomes e funções a cada agente para que operem de acordo com a persona definida.
00:05:04E por fim, você precisa estabelecer certas regras para que os agentes sigam as tarefas corretamente.
00:05:09Como mencionado antes, você deve usar o agents.md.
00:05:12Mas o Claude usa o Claude.md e o Gemini usa o Gemini.md,
00:05:16e nenhum deles usa o arquivo do outro como instrução principal.
00:05:19Para coordená-los, você usa o agents.md e adiciona uma regra para que ambos o consultem como o guia principal.
00:05:25Você pode configurar várias regras para atender às suas necessidades e adicionar quantas quiser.
00:05:29Mas ao criar uma regra, ela fica primeiro em rascunho,
00:05:31e você precisa movê-la manualmente para ativa para que os agentes a reconheçam.
00:05:35As regras são atualizadas a cada 10 disparos de chat, o que você pode ajustar conforme necessário.
00:05:39Outro detalhe é o "loop guard", que por padrão vem configurado em 4.
00:05:43O loop guard é o número máximo de interações entre agentes
00:05:46antes que eles pausem suas tarefas e esperem por uma entrada sua.
00:05:49Ele foi adicionado para evitar que os agentes fiquem presos em um loop de perguntas infinitas.
00:05:53Quando o limite do loop guard é atingido, os agentes param de se comunicar
00:05:56e você deve enviar um comando de continuar para retomar.
00:05:59Você deve aumentá-lo se quiser que os agentes se coordenem melhor por mais tempo.
00:06:03Mas antes de planejarmos a implementação, uma palavra do nosso patrocinador, Airtop.
00:06:06Se você gasta horas toda semana extraindo dados manualmente
00:06:10ou navegando por dezenas de abas, existe uma maneira muito melhor de lidar com isso.
00:06:13O Airtop é uma plataforma na nuvem que permite que agentes de IA interajam com a web como um humano faria,
00:06:19usando templates personalizados ou prontos que resolvem as tarefas manuais mais chatas.
00:06:23Pense nele como um navegador na nuvem que cuida de todo o trabalho pesado para você.
00:06:27Por exemplo, estou usando um template para pesquisar preços de concorrentes.
00:06:30Apenas dou instruções ao agente em inglês simples, sem necessidade de código,
00:06:33e ele navega no site, faz o login e extrai exatamente o que preciso em um formato limpo.
00:06:39Minha parte favorita é que ele ignora medidas anti-bot frustrantes e
00:06:43CAPTCHAs que costumam quebrar as automações tradicionais,
00:06:46tornando-o incrivelmente confiável para trabalhos de alto volume.
00:06:48Crie automações confiáveis em minutos e inscreva-se no Airtop gratuitamente agora mesmo.
00:06:53Clique no link no comentário fixado e comece a construir hoje.
00:06:56Agora que todos os passos foram concluídos, é hora de avançar para a implementação.
00:07:00Como sempre enfatizamos a importância de planejar antes de executar,
00:07:03você deve começar pelo planejamento aqui também.
00:07:05Assim como os canais do Slack funcionam, você pode criar canais diferentes aqui também.
00:07:09Você vai querer configurar canais separados para o front-end e o back-end.
00:07:12Assim que você der a ideia do app, ele envia uma solicitação para a sessão do Tmux
00:07:16e a notifica para verificar a mensagem, já que ela foi mencionada.
00:07:18O agente planejador cria um plano completo, notifica você e pede para aprovar ou alterar.
00:07:23Ele documenta o plano no PRD, logo acima do template que você adicionou inicialmente.
00:07:28Você pode fazer as alterações que quiser, e ele atualiza o PRD com essas mudanças.
00:07:32Esta ferramenta usa MCP para permitir que o Claude envie respostas e leia as conversas da interface de chat,
00:07:37tornando possível a comunicação de via dupla.
00:07:39Quando o plano for confirmado, você pede para prosseguir.
00:07:41E assim que o PRD é aprovado, ele alerta o Gemini por conta própria
00:07:44e pede para ele implementar os documentos de especificações de UI.
00:07:47Então, os agentes de UI designer e o planejador começam a se coordenar entre si
00:07:51sobre os detalhes da implementação, com o planejador sugerindo detalhes
00:07:54e o designer incorporando-os ao plano, continuando a revisão nesse vaivém.
00:07:59Um detalhe importante: embora tivéssemos configurado o loop guard para 8,
00:08:02por algum motivo ele não registrou essa alteração.
00:08:04Portanto, atingimos o máximo de loops após apenas 4 iterações e fomos solicitados a continuar a conversa.
00:08:08Agora o construtor é informado pelo designer de UI que os planos estão prontos para implementar,
00:08:13e o construtor confirma o recebimento e aguarda a aprovação para começar.
00:08:18O agente designer também avisa que quer prosseguir com a implementação da interface,
00:08:22o que você deve segurar até que tenha revisado os planos pessoalmente.
00:08:25No canal de backend, você pode pedir ao construtor e ao planejador para verificarem o backend.md,
00:08:30que é criado pelo planejador ao implementar o PRD.
00:08:33Você os utiliza para coordenarem entre si a validação dos documentos,
00:08:37mas cada um deles pode identificar lacunas na implementação.
00:08:40Então, todos se coordenam e envolvem o designer de UI para lidar com as especificações de interface,
00:08:44fazendo-os trabalhar juntos para corrigir os problemas.
00:08:47Você pode então pedir ao planejador uma última revisão quando terminarem a implementação.
00:08:50No nosso caso, eles encontraram alguns problemas adicionais durante a revisão final.
00:08:54Após resolvê-los, todos os agentes confirmaram que
00:08:56os problemas foram sanados e o app estava pronto para ser construído.
00:08:59Mas não queira construir ainda. Há mais um passo que você deve seguir.
00:09:02Você deve fazer com que eles revisem os planos entre si.
00:09:04Esta ferramenta tem vários modos para testar, e você deve experimentar o modo planejador.
00:09:08Você pode testar vários modos para revisão de design, crítica de código e mais.
00:09:12Esses modos funcionam em 3 fases com modelos diferentes desempenhando papéis distintos.
00:09:16Você define o agente planejador como apresentador, que expõe o que foi feito anteriormente,
00:09:20e o agente revisor como o desafiador, que questiona criticamente o que o apresentador diz.
00:09:24O agente de planejamento é o sintetizador, combinando as descobertas de cada um.
00:09:28A sessão começa com a apresentação do apresentador, seguida pela análise crítica do desafiador,
00:09:32que testa os documentos ao limite, identificando muitas falhas.
00:09:36Como os agentes estão se questionando mutuamente,
00:09:38eles conseguem identificar e corrigir muitos problemas que passariam despercebidos de outra forma.
00:09:42Após isso, você terá o plano final, marcando o fim da sessão de 3 fases.
00:09:46Além disso, se estiver gostando do nosso conteúdo, considere clicar no botão de hype,
00:09:50pois isso nos ajuda a criar mais vídeos como este e alcançar mais pessoas.
00:09:54Uma vez terminada a revisão, peça ao planejador para atuar como orquestrador e coordenar
00:09:58com os outros agentes a implementação do projeto, usando os respectivos modelos para suas tarefas.
00:10:03Ele confirma e faz o designer e o construtor trabalharem em paralelo.
00:10:06Ele envia mensagens para os canais de backend e frontend, dando ao construtor
00:10:10sinal verde para começar e liberando o engenheiro frontend para implementar o design.
00:10:15Trabalhar assim é muito interessante porque você essencialmente apenas entrega
00:10:18a tarefa ao agente de planejamento e só precisa pedir atualizações a ele.
00:10:22Ver os agentes trabalhando juntos é fascinante porque eles se corrigem quando ocorrem erros.
00:10:26Por exemplo, no nosso caso, o designer de UI tentou acidentalmente resolver um erro
00:10:30que deveria ser de responsabilidade do construtor.
00:10:32Tanto o planejador quanto o construtor apontaram que ele não deveria implementar o ajuste,
00:10:37porque ele sobrescreveu o arquivo em que o construtor estava trabalhando.
00:10:39Este fluxo seria muito mais suave se você tivesse o trabalho dos agentes em árvores de trabalho dedicadas,
00:10:44com um agente mesclando e revisando tudo como um todo,
00:10:47pois isso eliminaria o problema de agentes sobrescrevendo o trabalho uns dos outros.
00:10:50Portanto, é algo para se ter em mente em configurações mais complexas.
00:10:53O planejador então aciona o agente de revisão, que identifica problemas em detalhes,
00:10:57fornece um relatório minucioso e atribui tarefas aos agentes.
00:11:01Como já tínhamos definido a regra de que, se um agente precisasse de algo de outro,
00:11:04bastaria pedir, o designer de UI solicitou acesso a uma variável específica do construtor,
00:11:09e o construtor concedeu.
00:11:10Terminada a revisão por parte deles, o planejador pede para você fazer a revisão final do front-end.
00:11:15Ao navegar para o servidor de desenvolvimento,
00:11:17você verá que a interface condiz com a versão gamificada que você queria.
00:11:20A landing page tem alto contraste, dando um ar de jogo,
00:11:23e usa palavras de impacto e referências que tornam a experiência empolgante.
00:11:26Após o teste de digitação, você recebe um relatório de desempenho.
00:11:29Os resultados são exibidos no dashboard, mostrando a melhor velocidade até então,
00:11:33junto com os níveis atuais e progresso, tornando o design imersivo.
00:11:37Isso nos traz ao final deste vídeo. Se quiser apoiar o canal e
00:11:40nos ajudar a continuar fazendo vídeos assim, você pode usar o botão de "Valeu demais" abaixo.
00:11:45Como sempre, obrigado por assistir e nos vemos no próximo.

Key Takeaway

O Agent Chatter resolve a fragmentação entre ferramentas de IA ao criar um ecossistema colaborativo onde diferentes modelos, como Gemini e Claude, trabalham juntos de forma autônoma para projetar e codificar aplicações completas.

Highlights

O Agent Chatter permite a coordenação em tempo real entre diferentes agentes de IA, como Claude Code e Gemini CLI.

Modelos Gemini superam o Claude em criatividade e design UI/UX, enquanto o Claude 4.6 destaca-se pela estabilidade na implementação.

A ferramenta utiliza o TMUX para gerenciar múltiplas sessões de terminal e automatizar a comunicação entre agentes.

O uso de arquivos de template (PRD, UI e Backend.md) é essencial para dar estrutura e evitar conteúdos desnecessários dos agentes.

O recurso de 'Loop Guard' evita que os agentes entrem em ciclos infinitos de perguntas, exigindo intervenção humana após certo limite.

Uma sessão de revisão em três fases (Apresentador, Desafiador e Sintetizador) ajuda a identificar falhas críticas antes da construção final.

O fluxo de trabalho permite que o desenvolvedor atue apenas como supervisor, aprovando planos e monitorando a execução coordenada.

Timeline

Introdução à Colaboração Multi-Agente

O vídeo começa discutindo como a engenharia de software evoluiu para um processo colaborativo mediado por IA, onde diferentes modelos possuem forças distintas. O narrador explica que, embora o Gemini seja superior em design criativo, o Claude 4.6 oferece maior estabilidade através do Claude Code. O problema central abordado é a falta de um fluxo de trabalho eficiente para fazer esses agentes trabalharem juntos sem intervenção manual constante. É apresentada a solução: o Agent Chatter, uma interface de chat que coordena múltiplos agentes simultaneamente. Esta ferramenta suporta modelos populares como Codex, Kimi e Qwen, permitindo até a redução de custos ao delegar tarefas pesadas a modelos mais baratos.

Configuração Técnica e Uso do TMUX

Nesta seção, o apresentador detalha a personalização visual feita no fork do repositório original para tornar a navegação mais intuitiva. Para rodar o sistema, é necessário clonar o repositório e executar scripts específicos que servem como pontos de entrada para cada agente. Um requisito técnico fundamental para usuários de Mac e Linux é a instalação do TMUX, um multiplexador de terminal que gerencia as sessões de cada agente. No Windows, os scripts podem ser executados diretamente, mas a lógica permanece a mesma: cada agente precisa de seu próprio terminal dedicado. O controle centralizado ocorre através de uma única interface de chat que se comunica com todas essas instâncias em segundo plano.

Preparação do Ambiente e Regras de Permissão

O processo de inicialização exige que o framework do projeto, como o Next.js, já esteja configurado para evitar conflitos entre os agentes. O narrador enfatiza a importância de configurar o arquivo settings.json para automatizar permissões de edição de arquivos, evitando interrupções manuais constantes. É altamente recomendável criar um arquivo agents.md para servir como guia principal de comportamento e regras para todos os modelos envolvidos. Além disso, o uso de documentos de planejamento como PRD e especificações de UI ajuda a manter a estrutura e o foco dos agentes. O apresentador também menciona o AI Labs Pro como fonte para baixar esses templates otimizados para o fluxo de trabalho.

Definição de Personas e Mecanismos de Controle

A ferramenta permite atribuir nomes e funções específicas a cada agente, como transformar um modelo Gemini em um especialista dedicado em UI/UX. Para garantir a coordenação, o usuário deve configurar uma regra no agents.md que obrigue todos os agentes a consultarem este arquivo como sua fonte da verdade. Um detalhe crucial mencionado é o 'Loop Guard', que limita o número de interações automáticas entre agentes para evitar gastos excessivos ou erros em loop. Por padrão, esse limite é definido em 4 iterações, mas pode ser aumentado para permitir discussões mais profundas entre as IAs. O usuário mantém o controle final, precisando enviar um comando de continuar sempre que o limite do guarda é atingido.

Apresentação do Patrocinador e Automação Web

O vídeo faz uma pausa para apresentar o Airtop, uma plataforma de automação baseada em nuvem que utiliza IA para navegar na web. O narrador demonstra como a ferramenta pode extrair dados de sites de concorrentes ou realizar login em portais complexos usando apenas comandos em linguagem natural. O Airtop se destaca por sua capacidade de ignorar medidas anti-bot e CAPTCHAs que normalmente travam automações tradicionais baseadas em código. Esta seção serve para ilustrar como agentes de IA podem ser usados não apenas para codificação, mas também para tarefas operacionais repetitivas. É um exemplo prático de como a IA está transformando a produtividade além do desenvolvimento de software puro.

Planejamento e Execução em Canais Separados

Com a infraestrutura pronta, inicia-se a fase de planejamento inspirada na estrutura de canais do Slack, dividindo front-end e back-end. O agente planejador cria um PRD detalhado que deve ser revisado e aprovado pelo usuário antes de qualquer linha de código ser escrita. Uma vez aprovado, o planejador alerta o Gemini para começar as especificações de interface, criando um diálogo dinâmico de revisão entre os agentes. Durante este processo, o narrador observa que os agentes podem identificar lacunas uns nos outros e solicitar correções de forma coordenada. O objetivo é garantir que toda a lógica de negócio e design esteja validada antes de mover para a fase de construção ativa.

Revisão em Três Fases e Teste de Estresse

Antes da implementação final, o vídeo introduz o 'Modo Planejador', que submete o projeto a uma crítica rigorosa entre os próprios agentes. Este modo opera em três fases: o Apresentador expõe o plano, o Desafiador atua como crítico feroz para encontrar falhas, e o Sintetizador une as conclusões. Essa técnica de 'auto-crítica' entre IAs é capaz de revelar problemas de segurança ou lógica que passariam despercebidos por um revisor humano. O apresentador destaca que ver os agentes se questionarem mutuamente é uma das partes mais fascinantes da ferramenta. Ao final desta etapa, o plano é refinado e está verdadeiramente pronto para ser orquestrado para a produção.

Orquestração Final e Resultado do Aplicativo

Na fase final, o agente planejador atua como orquestrador, dando sinal verde para que os agentes de front-end e back-end trabalhem em paralelo. Um exemplo interessante de conflito é mostrado, onde o designer tentou corrigir um erro do construtor e foi repreendido pelos outros agentes por sobrescrever arquivos indevidamente. O narrador sugere o uso de árvores de trabalho (worktrees) para evitar esses problemas de sincronização em projetos maiores. No final, o aplicativo resultante é um jogo de teste de digitação com uma interface imersiva e dashboard de desempenho funcional. O vídeo conclui demonstrando que a colaboração entre IA foi bem-sucedida em criar um produto final coeso e esteticamente agradável.

Community Posts

View all posts