O Projeto do Sistema Operacional Claude Completo

Portuguêsالعربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Русский 中文

컴퓨터/소프트웨어AI/미래기술

Transcript

00:00:00Imagine que você é um rei medieval. Você tem um reino inteiro para administrar, mas preferiria não fazer absolutamente

00:00:04nada enquanto outras pessoas cuidam disso para você. O problema é que você não pode, porque sua equipe está acostumada

00:00:10a receber tudo de mão beijada. O que você realmente precisa, em vez disso, é de um sistema que administre o reino inteiro por

00:00:15conta própria, e é exatamente nisso que o Claude Code se tornou. Desde que a Anthropic começou a lançar

00:00:19atualizações, ele deixou de ser apenas um agente de codificação e se transformou em um sistema operacional completo, um que

00:00:25coordena tudo na sua máquina. Mas fluxos de trabalho dinâmicos são o que realmente une tudo isso.

00:00:30Então, antes que nosso rei entregue todo o seu reino a um agente, vamos ver como essa coisa realmente funciona.

00:00:35Desde que a Anthropic começou a lançar novas formas de desperdiçarmos tokens, o que é apenas a desculpa deles

00:00:40para ganhar mais dinheiro com o Claude Code, ele se tornou muito mais do que apenas um agente de codificação. É

00:00:44basicamente um sistema operacional completo agora. Assim como um sistema operacional forma a base de cada

00:00:50tarefa e coordena o que você faz na sua máquina, o Claude Code agora desempenha esse mesmo papel. Ele coordena

00:00:55e controla tudo o que você faz nele. Mas antes de mergulharmos em como fluxos de trabalho dinâmicos completam este

00:01:00sistema, você precisa saber sobre os outros componentes. A única diferença entre um

00:01:04sistema operacional de computador e o sistema operacional do Claude Code é que você não precisa trabalhar

00:01:08tão duro na configuração, a menos que esteja usando Arch. E não, você não estará instalando um

00:01:12monte de drivers só para fazer o microfone funcionar e poder dar comandos de voz como um deus das vibes.

00:01:17E assim como um sistema operacional real, ele é composto por várias partes. Cada uma é importante o suficiente para que o

00:01:22sistema não esteja completo sem ela. Em um SO, o kernel é a camada mais importante, forma o núcleo e

00:01:28controla todas as operações. O equivalente no Claude Code é o arquivo Claude.md e seus arquivos de contexto.

00:01:33Já fizemos um vídeo completo falando sobre como estruturar seu arquivo Claude.md para que seu agente

00:01:39tenha o melhor desempenho. Isso importa aqui porque o kernel é o programa condutor de todo o seu agente.

00:01:44Se ele não estiver configurado corretamente, o agente não consegue descobrir o que seu projeto realmente quer. E as outras

00:01:48partes desmoronam com ele. Mais ou menos como sua vida inteira desmorona quando você se casa. Depois, há

00:01:53os drivers, as peças que permitem que o sistema interaja com dispositivos externos. O equivalente no

00:01:58Claude Code é o MCP. Então, sempre que o Claude precisa de uma ferramenta externa, ele a busca através do MCP e chama

00:02:04essa ferramenta para fazer o trabalho. Depois vêm os programas do dia a dia, que no Claude Code são as habilidades e

00:02:09outros comandos. Eles contêm instruções estruturadas para tarefas repetíveis e você pode invocá-los sempre que

00:02:14precisar deles. Todo SO também precisa de um agendador ou cron job que execute uma tarefa específica em um horário programado.

00:02:20Da mesma forma, o Claude Code adicionou loops e rotinas recentemente. Eles são basicamente seus cron jobs e

00:02:25eliminam a necessidade de você monitorá-lo através de uma tarefa. Eles automatizam o trabalho repetitivo que você

00:02:29faria manualmente. Então, mesmo se o seu sistema desligar, as tarefas continuam rodando sozinhas. Assim, você pode

00:02:34dormir tranquilamente sabendo que seu aplicativo SaaS B2B, que literalmente ninguém está usando, está sendo cuidado.

00:02:40E por último, mas mais importante, há a peça que une todos eles em um

00:02:45sistema operacional completo. Essa peça é o fluxo de trabalho dinâmico, o novo recurso que veio com o Opus

00:02:504.8. Você talvez já saiba que o Claude Code tem fluxos de trabalho dinâmicos. Basicamente, eles são outra tentativa

00:02:55da Anthropic para simplificar tarefas de longa duração. Eles funcionam como instruções repetíveis que geram múltiplos

00:03:01agentes para realizar a tarefa para a qual foram projetados. Então, como isso é diferente das outras arquiteturas que

00:03:06você já tem? Para compará-los, a primeira e mais simples são as habilidades. Habilidades são instruções repetíveis para

00:03:11tarefas que precisam de passos guiados. Mas uma habilidade é gerada por um agente e esse mesmo agente lê as instruções

00:03:17a partir dela. Ela apenas guia o agente para fazer uma tarefa que ele já conhece de uma maneira melhor e não ajuda com

00:03:22tarefas de longa duração. É apenas um agente fazendo tudo. Depois, há o comando goal (objetivo). Ele

00:03:27itera em direção a um objetivo final predefinido e o agente entra em loop até que a condição final seja atingida. Esta foi uma

00:03:32tentativa excepcional de tornar as tarefas de longa duração melhores. Temos usado muito isso em nossos próprios fluxos de trabalho desde

00:03:38que foi lançado. Tanto o goal quanto o workflow podem coordenar múltiplos agentes, mas são diferentes.

00:03:43A coisa principal que os separa é o determinismo. O goal é não determinístico, o que significa que o sistema decide

00:03:48o que fazer a seguir. Um workflow é determinístico e o código decide exatamente o que acontece. Você cria seu

00:03:54primeiro fluxo de trabalho apenas usando a palavra-chave workflow. A partir dessa palavra em seu prompt, o Claude identifica o

00:03:59fluxo de trabalho dinâmico necessário para a tarefa, mas esta é uma palavra que usamos o tempo todo nos prompts, então você pode

00:04:04pensar que ele dispararia toda vez. Não vai, porém, a menos que o prompt realmente expresse a intenção

00:04:09de criar um. É aqui que os fluxos de trabalho são realmente diferentes. Em vez do markdown habitual que outros

00:04:14usam, ele cria um código JavaScript. Ele vive dentro do diretório workflow na pasta .claude,

00:04:19e usa todo esse script para controlar a coisa toda. Então, em vez de seu plano viver na

00:04:23janela de contexto, esse plano é escrito em código, definindo como os subagentes trabalharão passo a

00:04:28passo. Ele define esquemas rigorosos, que são basicamente formulários para os subagentes, para que eles forneçam a

00:04:33saída em um formato estrito. Cada agente é chamado com o prompt e o formulário que ele deve satisfazer. Ele continua

00:04:39trabalhando até que a saída corresponda a esse esquema, então retorna suas descobertas. Você os invoca com o comando de barra

00:04:44com o nome do workflow, então você pode passar o plano que deseja testar. Ele roda em

00:04:49segundo plano para que você possa continuar com seu próprio trabalho, dê a ele outro prompt para que seu gerente de projeto

00:04:53se sinta orgulhoso da sua produtividade de IA por uma vez. Para verificar o progresso, você apenas executa o comando workflow.

00:04:58Lá você pode ver cada estágio de cada fluxo de trabalho e todos os modelos que cada agente invocou,

00:05:03e ver quantos tokens cada tarefa consumiu. E se sua sessão terminar enquanto um workflow estiver rodando,

00:05:08você não precisa se preocupar em perder o progresso. Ele persiste após você executar o comando resume. Cada workflow

00:05:14mantém seu próprio ID. E quando você retoma, ele puxa todo o trabalho de agente em cache de volta da memória e continua

00:05:19de onde parou. Diferente da minha avó, ele não esquece de pagar a conta da Claude AI e realmente

00:05:24lembra o que precisa fazer. Uma coisa a notar antes de usar um workflow. Como isso está em visualização

00:05:29de pesquisa, fluxos de trabalho dinâmicos consomem muito mais tokens do que uma sessão típica do Claude Code. Isso porque

00:05:35eles usam vários subagentes sob o capô e cada um roda em sua própria janela de contexto separada. Você precisa

00:05:40considerar cuidadosamente quando você realmente precisa deles, ou então você vai esgotar seu plano de $200 em algumas

00:05:45horas. Existem algumas métricas chave que dizem se um fluxo de trabalho é a melhor opção. A primeira

00:05:50é que a tarefa pode ser dividida em unidades independentes. Se os agentes dependem do trabalho uns dos outros,

00:05:55eles acabam esperando, e não há sentido em gerar um fluxo de trabalho porque você perde todo o

00:06:00paralelismo. É por isso que, se as tarefas são menos dependentes umas das outras, você obtém melhor paralelismo e

00:06:05resultados mais rápidos. O que sua startup deveria aprender, já que ainda depende do dinheiro dos seus pais

00:06:10para sobreviver. A próxima razão para usar fluxos de trabalho dinâmicos é se a tarefa precisa de mais do que uma única janela

00:06:15de contexto para rodar e precisa ser dividida em partes. Os fluxos de trabalho usam vários subagentes, cada um com sua

00:06:21própria janela de contexto, então a tarefa deve ser grande o suficiente para realmente precisar dessas janelas separadas. Caso contrário,

00:06:26você apenas estará desperdiçando tempo e tokens. Cada subagente roda em seu próprio contexto novo e retorna

00:06:31apenas o resultado. O resto de seu raciocínio permanece no arquivo de código e nunca entra na janela principal de contexto

00:06:36a menos que você precise dele. A próxima razão é que a tarefa vale a pena ser verificada. Use um fluxo de trabalho quando uma resposta errada

00:06:41for cara o suficiente para precisar de verificação cruzada antes de seguir em frente. Isso inclui coisas como

00:06:46descobertas de segurança, reivindicações de bugs e migrações. Mas essa verificação custa agentes extras que queimam

00:06:52tokens e tempo. Então certifique-se de que a tarefa realmente vale a pena e você não está apenas gerando cinco agentes

00:06:57porque você ouviu recentemente um CEO de tecnologia de IA dizer que mais tokens é igual a mais dinheiro. A última razão é que

00:07:03sua tarefa é determinística. Um fluxo de trabalho usa código para chamar agentes em uma estrutura fixa. Então, se a tarefa é

00:07:09determinística, vá em frente. Se a tarefa não é determinística e precisa de um agente para avaliar o que

00:07:14a próxima tarefa deveria ser durante a execução, fluxos de trabalho não são para isso. Então, quando você escolhe entre fluxo de trabalho e

00:07:20objetivo, pense na forma da tarefa. Uma tarefa pode ser ampla ou profunda. Ampla significa que pode ser dividida em muitas

00:07:25subtarefas que podem rodar ao mesmo tempo. Profunda significa uma tarefa de cada vez, indo passo a passo mais fundo nela.

00:07:32Um fluxo de trabalho é amplo, então em vez de ir mais fundo, ele apenas chama os agentes e os deixa iterar. Para tarefas profundas,

00:07:37o comando goal pega uma tarefa de cada vez e não executa as coisas em paralelo da maneira que os fluxos de trabalho

00:07:43fazem. Apenas recorra a um fluxo de trabalho quando a tarefa realmente se encaixar, para não desperdiçar tokens.

00:07:48O Claude Code já vem com um fluxo de trabalho dinâmico integrado chamado Deep Research. É basicamente o

00:07:53pipeline de pesquisa de várias etapas que costumávamos construir à mão com múltiplos arquivos de contexto e Claude.md. Agora

00:07:58é apenas um fluxo de trabalho que você pode invocar de qualquer projeto. Esta pesquisa forma uma parte chave de todo o SO que

00:08:04você constrói. Ela garante que as fontes de informação por trás desse SO sejam confiáveis, para que sua mãe não possa te alimentar

00:08:09com informações falsas do grupo dela de boomer no Facebook e depois te repreender quando você verificar os fatos dela. Ele roda em cinco

00:08:14partes e cada uma leva à próxima. Primeiro, ele busca informações, depois busca os detalhes

00:08:19das fontes que encontra. Depois disso vem a verificação adversária para validar as alegações,

00:08:24e ele sintetiza o que sobreviver em um documento final. Você pode vê-lo trabalhar a partir do

00:08:29comando workflows, onde cada subagente herda suas ferramentas do pai, e é realmente intensivo em

00:08:34tokens, então pode queimar todo o seu limite rapidamente. Esta única execução levou um milhão de tokens em um

00:08:39pequeno tópico. Além da pesquisa de várias etapas, você pode construir outros fluxos de trabalho de pesquisa que se tornam parte do

00:08:45seu sistema de pesquisa. Um que fizemos para nós mesmos pesquisa concorrentes, verifica como eles estão performando,

00:08:49e encontra a vantagem competitiva que eles têm. Esta é uma peça importante se você for um construtor de produtos. Você

00:08:54precisa saber como seus concorrentes estão performando no mercado para que possa construir algo melhor.

00:08:59Este é dividido em quatro fases, como o fluxo de trabalho de pesquisa, e assim que termina, ele reporta

00:09:04as descobertas. Nossa execução usou 679.000 tokens e 34 agentes e escreveu um relatório markdown completo com suas descobertas.

00:09:11Ele também melhora a si mesmo à medida que avança. Quando encontra um problema, ele aplica uma correção, então da próxima vez que você rodar,

00:09:17ele não encontra os mesmos problemas que encontrou na primeira vez. O relatório vem com métricas de

00:09:21comparação claramente definidas e todas as suas descobertas, então, quando você construir seu produto, pode usá-lo como uma fonte

00:09:26para analisar o mercado antes de lançá-lo. Além disso, se você está gostando do nosso conteúdo, considere apertar

00:09:30o botão de hype, porque isso nos ajuda a criar mais conteúdo como este e alcançar mais pessoas.

00:09:35Todo sistema operacional precisa do seu kernel, seus drivers e das peças que o tornam completo. Juntos,

00:09:41eles o deixam rodar sem sua entrada. Um exemplo de tal sistema é uma configuração de segundo cérebro. Isso é

00:09:45definitivamente útil se o seu primeiro, como o nosso, ficou completamente f***dido de ficar sem uso desde que

00:09:50nossos dispositivos foram abençoados com LLMs. O kernel desse segundo cérebro se torna seu Claude.md,

00:09:55que contém as informações sobre como navegar por todo o sistema. Os programas do dia a dia, as coisas repetíveis

00:10:01são suas habilidades. Eles carregam as instruções para as tarefas que você faz repetidamente. Aqui está a melhor

00:10:06maneira de configurar um. Quando você estiver profundamente em uma longa sessão e perceber que isso é algo que você fará com frequência,

00:10:11apenas peça ao Claude para combinar os aprendizados daquela sessão em uma habilidade. A memória desse SO é tudo

00:10:16o que os arquivos que você cria e mantém em seu cofre. Eles registram o que você faz e como faz. Isso

00:10:21significa que ele sabe mais sobre você do que você mesmo, e eles dão ao Claude contexto sobre tudo o que você

00:10:25está trabalhando. Muitas vezes precisamos que o segundo cérebro alcance fontes externas, então configuramos

00:10:29os MCPs do Google Agenda e Notion. Dessa forma, ele pode acessar os arquivos de projeto no Notion e sincronizar os dados,

00:10:35ler a agenda no calendário, e criar e atualizar entradas para que ele possa encaixar um pouco de tocar na grama

00:10:41entre sua agenda já ocupada. Documentamos os formatos exatos que ele deve seguir no arquivo Claude.md

00:10:46e a parte mais importante é criar os fluxos de trabalho para sua configuração. Eles permitem que você paralelize

00:10:51suas tarefas repetíveis e as entregue a subagentes. O fluxo de trabalho de resumo matinal que construímos gera subagentes

00:10:57para reunir informações de várias fontes e retorna um resumo para começar nosso dia. Uma vez que tudo isso está

00:11:02configurado, você apenas dá a ele um prompt. Ele carrega a habilidade e o contexto certos, cria os arquivos nos lugares certos,

00:11:07e conecta as informações às partes relevantes por conta própria. Se você tem usado o segundo cérebro

00:11:12há algum tempo, você deve construir um fluxo de trabalho de auditoria. Ele verifica links quebrados e expõe cada problema

00:11:17na configuração e os reporta de volta. A partir daí, você pode executar as correções e manter seu segundo cérebro em ótima

00:11:22forma, mas sabendo que tipo de homem você é, você também estará pagando por suas sessões de terapia na próxima semana.

00:11:27Semelhante a como você pode configurar um sistema operacional inteiro para projetos não relacionados a codificação, você pode fazer o mesmo para

00:11:32seus projetos de codificação também. Você configura seu claude.md como o kernel e coloca todas as informações

00:11:37do projeto dentro dele. Você configura os agentes para seu projeto, que agem como seus programas diários.

00:11:42Você também configura hooks para diferentes casos, como formatar um arquivo após um agente terminar de editá-lo,

00:11:46para que entre a bagunça f***dida que você chama de relacionamento e seu código, pelo menos uma coisa

00:11:51esteja organizada. Você cria habilidades para diferentes tarefas, como adicionar um novo endpoint. Assim, cada endpoint

00:11:56segue o esquema exato que você deseja, e você pode criar fluxos de trabalho para coisas como revisar alterações antes

00:12:01de enviar, migrar a base de código ou o banco de dados, e executar testes de ponta a ponta para confirmar que todo o

00:12:07aplicativo funciona. Em vez de você acordar com seu gerente ligando às 2 da manhã porque sua produção caiu novamente, o

00:12:12contexto para esse SO se torna os arquivos na sua pasta docs e o próprio código. Fluxos de trabalho são excepcionalmente

00:12:17úteis para migrações de projetos. Você pode construir um que converta seu projeto inteiro de uma biblioteca para

00:12:22outra e deixar os agentes individuais lidarem com a conversão. Testamos isso antes, e sem um

00:12:27fluxo de trabalho, levou mais de uma hora, mas com um fluxo de trabalho, levou apenas 21 minutos. Então, o tempo economizado

00:12:32com fluxos de trabalho pode ir para coisas mais importantes, como rolar pelos deepfakes inapropriados do Dario.

00:12:37É assim que nosso sistema operacional se estende a casos de uso de codificação, então quando você está construindo projetos,

00:12:43você não precisa lidar com tudo manualmente. Você deixa o sistema operacional fazer isso por você. Se você quer

00:12:47fundar a próxima grande empresa de SaaS B2B de IA, mas não sabe por onde começar, você deveria estar no AI Labs Pro.

00:12:53É lá que você encontrará os fluxos de trabalho usados neste vídeo, junto com todos os outros recursos,

00:12:57guias e brindes que reunimos. Você também conhecerá um monte de nerds com ideias semelhantes,

00:13:01incluindo nossa equipe. O link está na descrição, e você pode conferir isso.

00:13:05Isso nos leva ao final deste vídeo. Se você gostaria de apoiar o canal e nos ajudar a continuar fazendo

00:13:09vídeos como este, você pode fazer isso usando o botão de super obrigado abaixo. Como sempre, obrigado por

00:13:14assistir e vejo você no próximo.

Key Takeaway

Ao transformar o Claude Code em um sistema operacional com fluxos de trabalho dinâmicos baseados em código, é possível automatizar tarefas complexas e de longa duração com maior paralelismo e eficiência do que utilizando agentes isolados.

Highlights

O Claude Code evoluiu de um agente de codificação para um sistema operacional completo capaz de coordenar fluxos de trabalho, ferramentas externas via MCP e tarefas automatizadas.
Fluxos de trabalho dinâmicos são determinísticos, utilizam código JavaScript para definir passos rigorosos e geram múltiplos subagentes para realizar tarefas de longa duração.
Migrações de projetos complexos realizados com fluxos de trabalho dinâmicos foram concluídas em 21 minutos, em comparação com mais de uma hora de trabalho manual.
O sistema utiliza o arquivo Claude.md como kernel e arquivos de contexto como memória para manter a persistência entre sessões através do comando resume.
Tarefas de longa duração consumiram até 1 milhão de tokens em testes de pesquisa de várias etapas devido à execução de múltiplos subagentes, cada um com sua própria janela de contexto.
A seleção entre fluxos de trabalho (broad, paralelizável, determinístico) e objetivos (deep, iterativo, não-determinístico) é fundamental para otimizar o consumo de tokens.

Timeline

A arquitetura do Sistema Operacional Claude

O Claude Code opera como um sistema operacional que coordena operações, interações externas e tarefas repetitivas na máquina.
O arquivo Claude.md funciona como o kernel, centralizando as instruções e o contexto necessários para o funcionamento do agente.
O MCP (Model Context Protocol) permite a integração com dispositivos e ferramentas externas.
Loops e rotinas atuam como cron jobs, automatizando o trabalho repetitivo sem necessidade de monitoramento constante.

O sistema operacional Claude estrutura-se em componentes equivalentes a um SO tradicional para gerenciar o reino de tarefas de um usuário. O kernel (Claude.md) dita o comportamento central, enquanto drivers (MCP) conectam o sistema ao mundo externo. Programas do dia a dia correspondem a habilidades estruturadas, e loops automatizados eliminam a necessidade de supervisão manual contínua.

Fluxos de trabalho dinâmicos e determinismo

Fluxos de trabalho dinâmicos definem planos de execução através de código JavaScript armazenado no diretório .claude.
Diferente do modo goal, que é não-determinístico e iterativo, fluxos de trabalho são determinísticos e seguem um esquema fixo.
Cada subagente de um fluxo de trabalho opera em sua própria janela de contexto, permitindo a paralelização de tarefas.
O custo de tokens aumenta consideravelmente ao utilizar fluxos de trabalho devido ao uso de múltiplos subagentes.

Introduzidos com o Opus 4.8, os fluxos de trabalho dinâmicos permitem a execução de tarefas de longa duração através de múltiplos subagentes. Eles superam habilidades simples e comandos de objetivo pela capacidade de paralelização (tarefas amplas) e pelo controle determinístico exercido por scripts JavaScript, garantindo a conformidade com esquemas de saída rigorosos.

Aplicações práticas e automação do sistema

O recurso Deep Research é um fluxo de trabalho integrado que realiza pesquisas de várias etapas de forma autônoma.
Configurar um segundo cérebro exige a integração de MCPs, como Notion e Google Agenda, vinculados ao contexto do Claude.md.
Fluxos de trabalho reduzem drasticamente o tempo de tarefas como migrações de projetos e auditorias de configuração.
A persistência de fluxos de trabalho permite retomar tarefas interrompidas mantendo o progresso e o estado dos subagentes.

A implementação prática desses conceitos permite a criação de ambientes altamente automatizados, tanto para codificação quanto para gestão pessoal. O uso estratégico de fluxos de trabalho, integrados a ferramentas externas e mantendo uma memória rigorosa no arquivo Claude.md, transforma o agente em um sistema capaz de executar auditorias, migrações e resumos diários sem intervenção humana frequente.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video