O Projeto do Sistema Operacional Claude Completo

AAI LABS
컴퓨터/소프트웨어AI/미래기술

Transcript

00:00:00Imagine que você é um rei medieval. Você tem um reino inteiro para administrar, mas preferiria não fazer absolutamente
00:00:04nada enquanto outras pessoas cuidam disso para você. O problema é que você não pode, porque sua equipe está acostumada
00:00:10a receber tudo de mão beijada. O que você realmente precisa, em vez disso, é de um sistema que administre o reino inteiro por
00:00:15conta própria, e é exatamente nisso que o Claude Code se tornou. Desde que a Anthropic começou a lançar
00:00:19atualizações, ele deixou de ser apenas um agente de codificação e se transformou em um sistema operacional completo, um que
00:00:25coordena tudo na sua máquina. Mas fluxos de trabalho dinâmicos são o que realmente une tudo isso.
00:00:30Então, antes que nosso rei entregue todo o seu reino a um agente, vamos ver como essa coisa realmente funciona.
00:00:35Desde que a Anthropic começou a lançar novas formas de desperdiçarmos tokens, o que é apenas a desculpa deles
00:00:40para ganhar mais dinheiro com o Claude Code, ele se tornou muito mais do que apenas um agente de codificação. É
00:00:44basicamente um sistema operacional completo agora. Assim como um sistema operacional forma a base de cada
00:00:50tarefa e coordena o que você faz na sua máquina, o Claude Code agora desempenha esse mesmo papel. Ele coordena
00:00:55e controla tudo o que você faz nele. Mas antes de mergulharmos em como fluxos de trabalho dinâmicos completam este
00:01:00sistema, você precisa saber sobre os outros componentes. A única diferença entre um
00:01:04sistema operacional de computador e o sistema operacional do Claude Code é que você não precisa trabalhar
00:01:08tão duro na configuração, a menos que esteja usando Arch. E não, você não estará instalando um
00:01:12monte de drivers só para fazer o microfone funcionar e poder dar comandos de voz como um deus das vibes.
00:01:17E assim como um sistema operacional real, ele é composto por várias partes. Cada uma é importante o suficiente para que o
00:01:22sistema não esteja completo sem ela. Em um SO, o kernel é a camada mais importante, forma o núcleo e
00:01:28controla todas as operações. O equivalente no Claude Code é o arquivo Claude.md e seus arquivos de contexto.
00:01:33Já fizemos um vídeo completo falando sobre como estruturar seu arquivo Claude.md para que seu agente
00:01:39tenha o melhor desempenho. Isso importa aqui porque o kernel é o programa condutor de todo o seu agente.
00:01:44Se ele não estiver configurado corretamente, o agente não consegue descobrir o que seu projeto realmente quer. E as outras
00:01:48partes desmoronam com ele. Mais ou menos como sua vida inteira desmorona quando você se casa. Depois, há
00:01:53os drivers, as peças que permitem que o sistema interaja com dispositivos externos. O equivalente no
00:01:58Claude Code é o MCP. Então, sempre que o Claude precisa de uma ferramenta externa, ele a busca através do MCP e chama
00:02:04essa ferramenta para fazer o trabalho. Depois vêm os programas do dia a dia, que no Claude Code são as habilidades e
00:02:09outros comandos. Eles contêm instruções estruturadas para tarefas repetíveis e você pode invocá-los sempre que
00:02:14precisar deles. Todo SO também precisa de um agendador ou cron job que execute uma tarefa específica em um horário programado.
00:02:20Da mesma forma, o Claude Code adicionou loops e rotinas recentemente. Eles são basicamente seus cron jobs e
00:02:25eliminam a necessidade de você monitorá-lo através de uma tarefa. Eles automatizam o trabalho repetitivo que você
00:02:29faria manualmente. Então, mesmo se o seu sistema desligar, as tarefas continuam rodando sozinhas. Assim, você pode
00:02:34dormir tranquilamente sabendo que seu aplicativo SaaS B2B, que literalmente ninguém está usando, está sendo cuidado.
00:02:40E por último, mas mais importante, há a peça que une todos eles em um
00:02:45sistema operacional completo. Essa peça é o fluxo de trabalho dinâmico, o novo recurso que veio com o Opus
00:02:504.8. Você talvez já saiba que o Claude Code tem fluxos de trabalho dinâmicos. Basicamente, eles são outra tentativa
00:02:55da Anthropic para simplificar tarefas de longa duração. Eles funcionam como instruções repetíveis que geram múltiplos
00:03:01agentes para realizar a tarefa para a qual foram projetados. Então, como isso é diferente das outras arquiteturas que
00:03:06você já tem? Para compará-los, a primeira e mais simples são as habilidades. Habilidades são instruções repetíveis para
00:03:11tarefas que precisam de passos guiados. Mas uma habilidade é gerada por um agente e esse mesmo agente lê as instruções
00:03:17a partir dela. Ela apenas guia o agente para fazer uma tarefa que ele já conhece de uma maneira melhor e não ajuda com
00:03:22tarefas de longa duração. É apenas um agente fazendo tudo. Depois, há o comando goal (objetivo). Ele
00:03:27itera em direção a um objetivo final predefinido e o agente entra em loop até que a condição final seja atingida. Esta foi uma
00:03:32tentativa excepcional de tornar as tarefas de longa duração melhores. Temos usado muito isso em nossos próprios fluxos de trabalho desde
00:03:38que foi lançado. Tanto o goal quanto o workflow podem coordenar múltiplos agentes, mas são diferentes.
00:03:43A coisa principal que os separa é o determinismo. O goal é não determinístico, o que significa que o sistema decide
00:03:48o que fazer a seguir. Um workflow é determinístico e o código decide exatamente o que acontece. Você cria seu
00:03:54primeiro fluxo de trabalho apenas usando a palavra-chave workflow. A partir dessa palavra em seu prompt, o Claude identifica o
00:03:59fluxo de trabalho dinâmico necessário para a tarefa, mas esta é uma palavra que usamos o tempo todo nos prompts, então você pode
00:04:04pensar que ele dispararia toda vez. Não vai, porém, a menos que o prompt realmente expresse a intenção
00:04:09de criar um. É aqui que os fluxos de trabalho são realmente diferentes. Em vez do markdown habitual que outros
00:04:14usam, ele cria um código JavaScript. Ele vive dentro do diretório workflow na pasta .claude,
00:04:19e usa todo esse script para controlar a coisa toda. Então, em vez de seu plano viver na
00:04:23janela de contexto, esse plano é escrito em código, definindo como os subagentes trabalharão passo a
00:04:28passo. Ele define esquemas rigorosos, que são basicamente formulários para os subagentes, para que eles forneçam a
00:04:33saída em um formato estrito. Cada agente é chamado com o prompt e o formulário que ele deve satisfazer. Ele continua
00:04:39trabalhando até que a saída corresponda a esse esquema, então retorna suas descobertas. Você os invoca com o comando de barra
00:04:44com o nome do workflow, então você pode passar o plano que deseja testar. Ele roda em
00:04:49segundo plano para que você possa continuar com seu próprio trabalho, dê a ele outro prompt para que seu gerente de projeto
00:04:53se sinta orgulhoso da sua produtividade de IA por uma vez. Para verificar o progresso, você apenas executa o comando workflow.
00:04:58Lá você pode ver cada estágio de cada fluxo de trabalho e todos os modelos que cada agente invocou,
00:05:03e ver quantos tokens cada tarefa consumiu. E se sua sessão terminar enquanto um workflow estiver rodando,
00:05:08você não precisa se preocupar em perder o progresso. Ele persiste após você executar o comando resume. Cada workflow
00:05:14mantém seu próprio ID. E quando você retoma, ele puxa todo o trabalho de agente em cache de volta da memória e continua
00:05:19de onde parou. Diferente da minha avó, ele não esquece de pagar a conta da Claude AI e realmente
00:05:24lembra o que precisa fazer. Uma coisa a notar antes de usar um workflow. Como isso está em visualização
00:05:29de pesquisa, fluxos de trabalho dinâmicos consomem muito mais tokens do que uma sessão típica do Claude Code. Isso porque
00:05:35eles usam vários subagentes sob o capô e cada um roda em sua própria janela de contexto separada. Você precisa
00:05:40considerar cuidadosamente quando você realmente precisa deles, ou então você vai esgotar seu plano de $200 em algumas
00:05:45horas. Existem algumas métricas chave que dizem se um fluxo de trabalho é a melhor opção. A primeira
00:05:50é que a tarefa pode ser dividida em unidades independentes. Se os agentes dependem do trabalho uns dos outros,
00:05:55eles acabam esperando, e não há sentido em gerar um fluxo de trabalho porque você perde todo o
00:06:00paralelismo. É por isso que, se as tarefas são menos dependentes umas das outras, você obtém melhor paralelismo e
00:06:05resultados mais rápidos. O que sua startup deveria aprender, já que ainda depende do dinheiro dos seus pais
00:06:10para sobreviver. A próxima razão para usar fluxos de trabalho dinâmicos é se a tarefa precisa de mais do que uma única janela
00:06:15de contexto para rodar e precisa ser dividida em partes. Os fluxos de trabalho usam vários subagentes, cada um com sua
00:06:21própria janela de contexto, então a tarefa deve ser grande o suficiente para realmente precisar dessas janelas separadas. Caso contrário,
00:06:26você apenas estará desperdiçando tempo e tokens. Cada subagente roda em seu próprio contexto novo e retorna
00:06:31apenas o resultado. O resto de seu raciocínio permanece no arquivo de código e nunca entra na janela principal de contexto
00:06:36a menos que você precise dele. A próxima razão é que a tarefa vale a pena ser verificada. Use um fluxo de trabalho quando uma resposta errada
00:06:41for cara o suficiente para precisar de verificação cruzada antes de seguir em frente. Isso inclui coisas como
00:06:46descobertas de segurança, reivindicações de bugs e migrações. Mas essa verificação custa agentes extras que queimam
00:06:52tokens e tempo. Então certifique-se de que a tarefa realmente vale a pena e você não está apenas gerando cinco agentes
00:06:57porque você ouviu recentemente um CEO de tecnologia de IA dizer que mais tokens é igual a mais dinheiro. A última razão é que
00:07:03sua tarefa é determinística. Um fluxo de trabalho usa código para chamar agentes em uma estrutura fixa. Então, se a tarefa é
00:07:09determinística, vá em frente. Se a tarefa não é determinística e precisa de um agente para avaliar o que
00:07:14a próxima tarefa deveria ser durante a execução, fluxos de trabalho não são para isso. Então, quando você escolhe entre fluxo de trabalho e
00:07:20objetivo, pense na forma da tarefa. Uma tarefa pode ser ampla ou profunda. Ampla significa que pode ser dividida em muitas
00:07:25subtarefas que podem rodar ao mesmo tempo. Profunda significa uma tarefa de cada vez, indo passo a passo mais fundo nela.
00:07:32Um fluxo de trabalho é amplo, então em vez de ir mais fundo, ele apenas chama os agentes e os deixa iterar. Para tarefas profundas,
00:07:37o comando goal pega uma tarefa de cada vez e não executa as coisas em paralelo da maneira que os fluxos de trabalho
00:07:43fazem. Apenas recorra a um fluxo de trabalho quando a tarefa realmente se encaixar, para não desperdiçar tokens.
00:07:48O Claude Code já vem com um fluxo de trabalho dinâmico integrado chamado Deep Research. É basicamente o
00:07:53pipeline de pesquisa de várias etapas que costumávamos construir à mão com múltiplos arquivos de contexto e Claude.md. Agora
00:07:58é apenas um fluxo de trabalho que você pode invocar de qualquer projeto. Esta pesquisa forma uma parte chave de todo o SO que
00:08:04você constrói. Ela garante que as fontes de informação por trás desse SO sejam confiáveis, para que sua mãe não possa te alimentar
00:08:09com informações falsas do grupo dela de boomer no Facebook e depois te repreender quando você verificar os fatos dela. Ele roda em cinco
00:08:14partes e cada uma leva à próxima. Primeiro, ele busca informações, depois busca os detalhes
00:08:19das fontes que encontra. Depois disso vem a verificação adversária para validar as alegações,
00:08:24e ele sintetiza o que sobreviver em um documento final. Você pode vê-lo trabalhar a partir do
00:08:29comando workflows, onde cada subagente herda suas ferramentas do pai, e é realmente intensivo em
00:08:34tokens, então pode queimar todo o seu limite rapidamente. Esta única execução levou um milhão de tokens em um
00:08:39pequeno tópico. Além da pesquisa de várias etapas, você pode construir outros fluxos de trabalho de pesquisa que se tornam parte do
00:08:45seu sistema de pesquisa. Um que fizemos para nós mesmos pesquisa concorrentes, verifica como eles estão performando,
00:08:49e encontra a vantagem competitiva que eles têm. Esta é uma peça importante se você for um construtor de produtos. Você
00:08:54precisa saber como seus concorrentes estão performando no mercado para que possa construir algo melhor.
00:08:59Este é dividido em quatro fases, como o fluxo de trabalho de pesquisa, e assim que termina, ele reporta
00:09:04as descobertas. Nossa execução usou 679.000 tokens e 34 agentes e escreveu um relatório markdown completo com suas descobertas.
00:09:11Ele também melhora a si mesmo à medida que avança. Quando encontra um problema, ele aplica uma correção, então da próxima vez que você rodar,
00:09:17ele não encontra os mesmos problemas que encontrou na primeira vez. O relatório vem com métricas de
00:09:21comparação claramente definidas e todas as suas descobertas, então, quando você construir seu produto, pode usá-lo como uma fonte
00:09:26para analisar o mercado antes de lançá-lo. Além disso, se você está gostando do nosso conteúdo, considere apertar
00:09:30o botão de hype, porque isso nos ajuda a criar mais conteúdo como este e alcançar mais pessoas.
00:09:35Todo sistema operacional precisa do seu kernel, seus drivers e das peças que o tornam completo. Juntos,
00:09:41eles o deixam rodar sem sua entrada. Um exemplo de tal sistema é uma configuração de segundo cérebro. Isso é
00:09:45definitivamente útil se o seu primeiro, como o nosso, ficou completamente f***dido de ficar sem uso desde que
00:09:50nossos dispositivos foram abençoados com LLMs. O kernel desse segundo cérebro se torna seu Claude.md,
00:09:55que contém as informações sobre como navegar por todo o sistema. Os programas do dia a dia, as coisas repetíveis
00:10:01são suas habilidades. Eles carregam as instruções para as tarefas que você faz repetidamente. Aqui está a melhor
00:10:06maneira de configurar um. Quando você estiver profundamente em uma longa sessão e perceber que isso é algo que você fará com frequência,
00:10:11apenas peça ao Claude para combinar os aprendizados daquela sessão em uma habilidade. A memória desse SO é tudo
00:10:16o que os arquivos que você cria e mantém em seu cofre. Eles registram o que você faz e como faz. Isso
00:10:21significa que ele sabe mais sobre você do que você mesmo, e eles dão ao Claude contexto sobre tudo o que você
00:10:25está trabalhando. Muitas vezes precisamos que o segundo cérebro alcance fontes externas, então configuramos
00:10:29os MCPs do Google Agenda e Notion. Dessa forma, ele pode acessar os arquivos de projeto no Notion e sincronizar os dados,
00:10:35ler a agenda no calendário, e criar e atualizar entradas para que ele possa encaixar um pouco de tocar na grama
00:10:41entre sua agenda já ocupada. Documentamos os formatos exatos que ele deve seguir no arquivo Claude.md
00:10:46e a parte mais importante é criar os fluxos de trabalho para sua configuração. Eles permitem que você paralelize
00:10:51suas tarefas repetíveis e as entregue a subagentes. O fluxo de trabalho de resumo matinal que construímos gera subagentes
00:10:57para reunir informações de várias fontes e retorna um resumo para começar nosso dia. Uma vez que tudo isso está
00:11:02configurado, você apenas dá a ele um prompt. Ele carrega a habilidade e o contexto certos, cria os arquivos nos lugares certos,
00:11:07e conecta as informações às partes relevantes por conta própria. Se você tem usado o segundo cérebro
00:11:12há algum tempo, você deve construir um fluxo de trabalho de auditoria. Ele verifica links quebrados e expõe cada problema
00:11:17na configuração e os reporta de volta. A partir daí, você pode executar as correções e manter seu segundo cérebro em ótima
00:11:22forma, mas sabendo que tipo de homem você é, você também estará pagando por suas sessões de terapia na próxima semana.
00:11:27Semelhante a como você pode configurar um sistema operacional inteiro para projetos não relacionados a codificação, você pode fazer o mesmo para
00:11:32seus projetos de codificação também. Você configura seu claude.md como o kernel e coloca todas as informações
00:11:37do projeto dentro dele. Você configura os agentes para seu projeto, que agem como seus programas diários.
00:11:42Você também configura hooks para diferentes casos, como formatar um arquivo após um agente terminar de editá-lo,
00:11:46para que entre a bagunça f***dida que você chama de relacionamento e seu código, pelo menos uma coisa
00:11:51esteja organizada. Você cria habilidades para diferentes tarefas, como adicionar um novo endpoint. Assim, cada endpoint
00:11:56segue o esquema exato que você deseja, e você pode criar fluxos de trabalho para coisas como revisar alterações antes
00:12:01de enviar, migrar a base de código ou o banco de dados, e executar testes de ponta a ponta para confirmar que todo o
00:12:07aplicativo funciona. Em vez de você acordar com seu gerente ligando às 2 da manhã porque sua produção caiu novamente, o
00:12:12contexto para esse SO se torna os arquivos na sua pasta docs e o próprio código. Fluxos de trabalho são excepcionalmente
00:12:17úteis para migrações de projetos. Você pode construir um que converta seu projeto inteiro de uma biblioteca para
00:12:22outra e deixar os agentes individuais lidarem com a conversão. Testamos isso antes, e sem um
00:12:27fluxo de trabalho, levou mais de uma hora, mas com um fluxo de trabalho, levou apenas 21 minutos. Então, o tempo economizado
00:12:32com fluxos de trabalho pode ir para coisas mais importantes, como rolar pelos deepfakes inapropriados do Dario.
00:12:37É assim que nosso sistema operacional se estende a casos de uso de codificação, então quando você está construindo projetos,
00:12:43você não precisa lidar com tudo manualmente. Você deixa o sistema operacional fazer isso por você. Se você quer
00:12:47fundar a próxima grande empresa de SaaS B2B de IA, mas não sabe por onde começar, você deveria estar no AI Labs Pro.
00:12:53É lá que você encontrará os fluxos de trabalho usados neste vídeo, junto com todos os outros recursos,
00:12:57guias e brindes que reunimos. Você também conhecerá um monte de nerds com ideias semelhantes,
00:13:01incluindo nossa equipe. O link está na descrição, e você pode conferir isso.
00:13:05Isso nos leva ao final deste vídeo. Se você gostaria de apoiar o canal e nos ajudar a continuar fazendo
00:13:09vídeos como este, você pode fazer isso usando o botão de super obrigado abaixo. Como sempre, obrigado por
00:13:14assistir e vejo você no próximo.

Key Takeaway

Ao transformar o Claude Code em um sistema operacional com fluxos de trabalho dinâmicos baseados em código, é possível automatizar tarefas complexas e de longa duração com maior paralelismo e eficiência do que utilizando agentes isolados.

Highlights

  • O Claude Code evoluiu de um agente de codificação para um sistema operacional completo capaz de coordenar fluxos de trabalho, ferramentas externas via MCP e tarefas automatizadas.

  • Fluxos de trabalho dinâmicos são determinísticos, utilizam código JavaScript para definir passos rigorosos e geram múltiplos subagentes para realizar tarefas de longa duração.

  • Migrações de projetos complexos realizados com fluxos de trabalho dinâmicos foram concluídas em 21 minutos, em comparação com mais de uma hora de trabalho manual.

  • O sistema utiliza o arquivo Claude.md como kernel e arquivos de contexto como memória para manter a persistência entre sessões através do comando resume.

  • Tarefas de longa duração consumiram até 1 milhão de tokens em testes de pesquisa de várias etapas devido à execução de múltiplos subagentes, cada um com sua própria janela de contexto.

  • A seleção entre fluxos de trabalho (broad, paralelizável, determinístico) e objetivos (deep, iterativo, não-determinístico) é fundamental para otimizar o consumo de tokens.

Timeline

A arquitetura do Sistema Operacional Claude

  • O Claude Code opera como um sistema operacional que coordena operações, interações externas e tarefas repetitivas na máquina.
  • O arquivo Claude.md funciona como o kernel, centralizando as instruções e o contexto necessários para o funcionamento do agente.
  • O MCP (Model Context Protocol) permite a integração com dispositivos e ferramentas externas.
  • Loops e rotinas atuam como cron jobs, automatizando o trabalho repetitivo sem necessidade de monitoramento constante.

O sistema operacional Claude estrutura-se em componentes equivalentes a um SO tradicional para gerenciar o reino de tarefas de um usuário. O kernel (Claude.md) dita o comportamento central, enquanto drivers (MCP) conectam o sistema ao mundo externo. Programas do dia a dia correspondem a habilidades estruturadas, e loops automatizados eliminam a necessidade de supervisão manual contínua.

Fluxos de trabalho dinâmicos e determinismo

  • Fluxos de trabalho dinâmicos definem planos de execução através de código JavaScript armazenado no diretório .claude.
  • Diferente do modo goal, que é não-determinístico e iterativo, fluxos de trabalho são determinísticos e seguem um esquema fixo.
  • Cada subagente de um fluxo de trabalho opera em sua própria janela de contexto, permitindo a paralelização de tarefas.
  • O custo de tokens aumenta consideravelmente ao utilizar fluxos de trabalho devido ao uso de múltiplos subagentes.

Introduzidos com o Opus 4.8, os fluxos de trabalho dinâmicos permitem a execução de tarefas de longa duração através de múltiplos subagentes. Eles superam habilidades simples e comandos de objetivo pela capacidade de paralelização (tarefas amplas) e pelo controle determinístico exercido por scripts JavaScript, garantindo a conformidade com esquemas de saída rigorosos.

Aplicações práticas e automação do sistema

  • O recurso Deep Research é um fluxo de trabalho integrado que realiza pesquisas de várias etapas de forma autônoma.
  • Configurar um segundo cérebro exige a integração de MCPs, como Notion e Google Agenda, vinculados ao contexto do Claude.md.
  • Fluxos de trabalho reduzem drasticamente o tempo de tarefas como migrações de projetos e auditorias de configuração.
  • A persistência de fluxos de trabalho permite retomar tarefas interrompidas mantendo o progresso e o estado dos subagentes.

A implementação prática desses conceitos permite a criação de ambientes altamente automatizados, tanto para codificação quanto para gestão pessoal. O uso estratégico de fluxos de trabalho, integrados a ferramentas externas e mantendo uma memória rigorosa no arquivo Claude.md, transforma o agente em um sistema capaz de executar auditorias, migrações e resumos diários sem intervenção humana frequente.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video