A técnica Ralph Wiggum MORREU! Claude Code Tasks substitui While Loops

BBetter Stack
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00A equipe do Claude Code atualizou recentemente os “to-do's” para tarefas, o que é uma grande notícia porque
00:00:05agora cada tarefa tem seu próprio arquivo JSON que pode ser atualizado e enviado ao GitHub.
00:00:11Essas tarefas podem rodar em paralelo com subagentes, e várias sessões do Claude Code podem compartilhar
00:00:16a mesma lista de tarefas.
00:00:17Ideal para projetos complexos que possuem múltiplas tarefas e exigem muitas sessões.
00:00:22Mas o que isso significa para o famoso “loop Ralph Wiggum”?
00:00:26Será que isso o torna obsoleto?
00:00:28Não exatamente.
00:00:29Inscreva-se no canal e vamos direto ao assunto.
00:00:32O Opus 4.5 mudou o jogo em vários aspectos.
00:00:35Algo que ele faz e que talvez você não saiba é a capacidade de rodar de forma autônoma por
00:00:39muito mais tempo, mantendo o controle do seu estado melhor do que outros modelos.
00:00:44Isso significa que aquela lista de tarefas clássica que você já viu no Claude Code antes
00:00:48praticamente não é necessária para tarefas pequenas.
00:00:50Mas para tarefas longas, ele ainda tem uma janela de contexto de 200k, o que significa que há uma zona inteligente e
00:00:56uma zona burra, então ele começará a entregar resultados ruins após a marca de 80%.
00:01:02Confira meu vídeo sobre o Ralph Wiggum para entender melhor as áreas inteligente e burra de um modelo
00:01:07com base no seu contexto.
00:01:08Nesta etapa, você pode usar uma ferramenta como o Beads, que armazena tarefas em um banco de dados SQLite
00:01:14e as coloca em um arquivo JSONL para serem enviadas ao controle de versão.
00:01:19A ferramenta Beads foi a grande inspiração para a equipe do Claude Code atualizar os to-do's para este
00:01:24novo sistema de gerenciamento de tarefas, que faz desde o armazenamento em arquivos JSON
00:01:30até permitir a execução em múltiplas sessões e muito mais.
00:01:34Mas, por mais legal que seja essa atualização, ela funciona de um jeito um pouco diferente do Beads e do Ralph Wiggum.
00:01:39Na verdade, deixe-me mostrar para vocês.
00:01:41Aqui está um arquivo de planejamento escrito pelo Claude Code contendo três grandes mudanças que quero
00:01:46adicionar a uma ferramenta chamada XDL para ajudar a baixar vídeos do X ou Twitter via linha de comando.
00:01:54Para as tarefas funcionarem, você precisa estar no Claude Code versão 2.1.6 ou superior, que contém
00:02:00essas ferramentas relacionadas ao gerenciamento de tarefas.
00:02:03Então, vou pedir ao Claude para transformar o arquivo de planejamento em um conjunto de tarefas a serem concluídas.
00:02:08Vejam que ele criou as tarefas, adicionou algumas dependências — tarefas que
00:02:13estão bloqueadas por outras — e as listou aqui, destacando em amarelo as tarefas
00:02:18que bloqueiam as tarefas específicas.
00:02:20Se formos ao diretório .claud na raiz da nossa máquina, veremos uma pasta “tasks”
00:02:26com outra pasta específica para o nosso projeto.
00:02:29Ao abri-la, vemos todas as tarefas criadas com ID, assunto, descrição
00:02:36e quais tarefas bloqueiam esta, além de quais são bloqueadas por ela.
00:02:41Agora vamos pedir ao Claude para rodar cada tarefa em um subagente, o que ele
00:02:45já começou a fazer.
00:02:46A tarefa 1 está sendo executada, assim como as 8, 9 e 10, já que não estão bloqueadas por outras
00:02:52tarefas.
00:02:53Também podemos ver aqui em cima os diferentes subagentes trabalhando em tarefas distintas.
00:02:57Agora que todas as tarefas foram concluídas, posso verificar quanto contexto foi usado e
00:03:01vemos que apenas 18% foi consumido, pois tudo foi feito em subagentes.
00:03:06Mas há algo mais que você pode fazer com o novo sistema de tarefas.
00:03:09Se eu quiser rodar várias sessões do Claude — neste caso em painéis divididos, mas poderiam ser
00:03:14abas ou servidores diferentes — tendo acesso à mesma lista de tarefas,
00:03:19posso usar esta variável de ambiente, Claude code task list ID, e passar o ID
00:03:26que corresponde ao diretório da lista de tarefas que quero usar.
00:03:30Assim, o Claude terá acesso a todas as tarefas daquele diretório, e eu posso fazer o
00:03:34mesmo nesta outra sessão.
00:03:36Dessa forma, posso pedir para uma sessão executar as tarefas e para a outra verificar se
00:03:41a tarefa foi concluída com sucesso.
00:03:43Se eu rodar a sessão da esquerda, a da direita conseguirá ver o progresso
00:03:48de cada tarefa em tempo real.
00:03:49Agora que terminou deste lado, esta sessão aqui já pode validar que
00:03:53a tarefa foi finalizada.
00:03:55Isso é fantástico, pois você pode começar uma tarefa em uma máquina, parar,
00:04:00salvar essas tarefas no GitHub ou outro sistema de controle de versão e, em outra
00:04:06máquina, baixar tudo e continuar exatamente de onde parou.
00:04:10Quem conhece o Beads sabe que é parecido com o funcionamento dele,
00:04:15mas não idêntico, porque o Beads usa SQLite para uma recuperação muito rápida
00:04:23e sincroniza as tarefas em um único arquivo JSONL, em vez de vários arquivos JSON.
00:04:29Assim, você adiciona esse arquivo único ao projeto e compartilha com sua equipe.
00:04:33Também difere um pouco do loop Ralph Wiggum puramente pela filosofia.
00:04:39No loop Ralph, você tem um único prompt e uma lista de tarefas, e essas
00:04:43tarefas devem te ajudar a cumprir aquele prompt, sendo enviadas ao modelo repetidamente.
00:04:48continuamente.
00:04:49Já com este novo sistema, você tem a lista de tarefas e pede ao modelo
00:04:54para simplesmente escolher a próxima que precisa ser feita.
00:04:57Então ele lê todas as tarefas para descobrir qual é o próximo passo.
00:05:02Isso é amenizado se você tiver um subagente focado em uma única tarefa, mas se você
00:05:07quer um loop autônomo que dure o quanto você quiser, onde o modelo segue uma
00:05:12“estrela guia” no seu arquivo prompt.md para melhorar o projeto continuamente, mesmo com
00:05:17tarefas que você não adicionou, então este novo sistema de gerenciamento não é para você.
00:05:22Há também a questão da documentação, pois, no momento desta gravação, todas as informações
00:05:27sobre esse recurso estão contidas em um único tweet.
00:05:30E, comparado ao Beads, ainda falta uma ferramenta de visualização ou algo tipo um kanban
00:05:34para acompanhar o progresso, mas tenho certeza que a comunidade do Claude Code já está
00:05:40trabalhando nisso.
00:05:42Com todos esses novos sistemas criando softwares, você vai precisar
00:05:47de uma maneira de garantir que não está enviando erros para seus usuários.
00:05:50É aí que entra o Better Stack, que permite monitorar erros no backend
00:05:56e frontend usando um rastreador nativo de IA, além de uma página de status para
00:06:02informar usuários se o site cair e um ótimo sistema de gerenciamento de incidentes.
00:06:08Então, dê uma olhada no Better Stack hoje mesmo.

Key Takeaway

O Claude Code introduziu um sistema avançado de gerenciamento de tarefas baseado em arquivos JSON que permite colaboração entre múltiplas sessões e subagentes, transformando a forma como projetos complexos são executados de forma autônoma.

Highlights

A atualização do Claude Code substitui a lista de tarefas básica por arquivos JSON individuais para cada tarefa.

O novo sistema permite que múltiplas sessões do Claude Code compartilhem e sincronizem a mesma lista de tarefas via ID.

O modelo Opus 4.5 demonstra maior autonomia e melhor gestão de estado em janelas de contexto longas.

Uso de subagentes para execução de tarefas em paralelo

Timeline

Introdução ao Novo Sistema de Tarefas do Claude Code

O vídeo inicia detalhando a transição dos antigos "to-do's" para um sistema de tarefas robusto onde cada item possui seu próprio arquivo JSON. Essa mudança é crucial porque permite que as tarefas sejam enviadas ao GitHub e atualizadas de forma independente. O palestrante explica que essas tarefas agora podem rodar em paralelo utilizando subagentes especializados. O sistema foi projetado para facilitar projetos complexos que exigem múltiplas sessões simultâneas de trabalho. Além disso, introduz-se o questionamento sobre o futuro do famoso loop "Ralph Wiggum" diante dessa evolução tecnológica.

A Autonomia do Opus 4.5 e Limitações de Contexto

Nesta seção, discute-se como o modelo Opus 4.5 mudou o cenário da IA com sua capacidade superior de rodar autonomamente por longos períodos. O palestrante destaca que o modelo mantém o controle do seu estado interno de forma muito mais eficiente que seus concorrentes. Entretanto, alerta-se para a janela de contexto de 200k, onde existe uma "zona inteligente" e uma "zona burra". O desempenho do modelo tende a cair drasticamente após atingir 80% do uso do contexto total. Essa característica reforça a importância de gerenciar tarefas de maneira externa para manter a precisão dos resultados.

Inspiração no Beads e Funcionamento Prático

O palestrante revela que a ferramenta Beads, que utiliza SQLite para armazenamento rápido, serviu de inspiração para a equipe do Claude Code. É demonstrado um exemplo prático usando uma ferramenta de download chamada XDL para ilustrar a criação de tarefas via linha de comando. Para utilizar esses recursos, é necessário estar na versão 2.1.6 ou superior do Claude Code. O sistema organiza automaticamente dependências entre tarefas, sinalizando visualmente quais itens bloqueiam a execução de outros. Os arquivos são armazenados em um diretório específico chamado ".claud" na raiz da máquina do usuário.

Execução com Subagentes e Múltiplas Sessões

O vídeo demonstra a execução simultânea de tarefas através de subagentes, o que otimiza o uso de contexto para apenas 18% do total disponível. Uma funcionalidade poderosa apresentada é o uso da variável de ambiente "Claude_code_task_list_id" para sincronizar diferentes abas ou servidores. Isso permite que uma sessão execute o trabalho enquanto a outra valida o progresso em tempo real de forma colaborativa. O palestrante enfatiza a facilidade de pausar o trabalho em uma máquina e retomar em outra através do controle de versão. Embora semelhante ao Beads, o sistema do Claude Code opta por arquivos JSON individuais em vez de um único arquivo JSONL.

Filosofia de Trabalho: Ralph Wiggum vs. Novo Sistema

A parte final do vídeo compara a filosofia do novo sistema com o loop Ralph Wiggum tradicional. No loop Ralph, o modelo recebe continuamente um arquivo mestre para guiar o projeto, enquanto o novo sistema foca na escolha da próxima tarefa pendente. O palestrante observa que para loops puramente autônomos baseados em uma "estrela guia", o método antigo ainda pode ser superior. Atualmente, a documentação oficial é escassa, limitando-se a postagens em redes sociais como o Twitter. Por fim, o vídeo sugere o uso do Better Stack para monitoramento de erros e gestão de incidentes em softwares gerados por IA.

Community Posts

View all posts