Seu SO Agêntico do Claude Code é Ruim

CChase AI
Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology

Transcript

00:00:00Seu OS agentivo de código em nuvem é péssimo e é porque você está focado nas
00:00:05coisas erradas.
00:00:05Você gasta todo o seu tempo em dashboards chiques e centros de comando como este
00:00:09e este outro, em vez de focar no que realmente gera valor em um
00:00:14OS agentivo de código em nuvem.
00:00:15E isso é: uma base de habilidades e automação que realmente impulsiona tudo.
00:00:20O problema é que criar algo assim em alto nível leva tempo,
00:00:25não é chamativo e pode ser um pouco entediante,
00:00:28especialmente comparado a esses centros de comando incríveis que rendem
00:00:33muitas visualizações. Mas a verdade é que para obter valor de um OS agêntico de código na nuvem,
00:00:37especialmente falando da parte de observabilidade,
00:00:40do dashboard, dessa coisa de centro de comando.
00:00:42Só vai funcionar se isso estiver alinhado, e é porque um
00:00:48OS agentivo forte tem três partes. A primeira é o que você vê aqui.
00:00:52É a base de habilidades e automação.
00:00:54É a ideia de pegar o código em nuvem e transformá-lo em um sistema que
00:00:58possa nos dar resultados confiáveis.
00:00:59Vamos pegar seus fluxos de trabalho e tarefas diárias, de sua equipe ou clientes,
00:01:05e transformá-los em habilidades e automações onde fizer sentido.
00:01:09E, no processo, construir um sistema coeso como este que você vê aqui.
00:01:14Para que possamos repetir o mesmo processo em alto nível e obter
00:01:19resultados consistentes. A segunda parte de um OS agentivo é a camada de memória.
00:01:23Como lidamos com a ideia de engenharia de contexto? Bem,
00:01:27há várias maneiras de fazer isso.
00:01:28Podemos fazer algo super sofisticado com grafos de conhecimento e usar
00:01:32algo como LightRAG, ou manter o simples e usar apenas o Obsidian,
00:01:36que é uma solução 80% eficaz e mais do que suficiente para a vasta maioria.
00:01:40Só depois de consolidar tudo isso é que qualquer dashboard ou centro
00:01:45de comando faz sentido, porque o valor de um dashboard vem de duas partes.
00:01:51Primeiro, o lado da observabilidade.
00:01:53É a ideia de compensar algumas fraquezas de estar em um terminal.
00:01:57Como ver minhas métricas de redes sociais,
00:02:00analisar rapidamente métricas de audiência,
00:02:03e ter todas as minhas pesquisas exibidas em uma única aba.
00:02:06A segunda metade desse valor vem daqui, de todos esses botões.
00:02:10É a ideia de que, se eu quiser levar o poder do código em nuvem para um colega
00:02:14ou cliente que nunca usaria o terminal,
00:02:17eu posso criar essa arquitetura de habilidades para eles, atribuí-las a esses botões,
00:02:22e eles podem simplesmente executá-las com apenas um clique.
00:02:26Então, hoje vou mostrar como configurar corretamente essa base de habilidades.
00:02:30E depois falaremos sobre o dashboard, porque há muito que
00:02:35se pode fazer nesse cenário. E existem dois caminhos.
00:02:37Você pode seguir como eu estive mostrando em duas versões.
00:02:40Há esta, que faz parte do próprio Obsidian,
00:02:44o que é legal por incluir um terminal integrado; e há esta
00:02:47versão em web app, feita para distribuição.
00:02:50Se você quer envolver outros membros da equipe ou pacotes para
00:02:53clientes, mas antes de entrarmos nos detalhes técnicos,
00:02:56uma palavra rápida do nosso patrocinador: eu. No Chase AI,
00:03:01acabei de lançar a masterclass do Claude Code,
00:03:03que é a melhor forma de ir do zero a desenvolvedor AI.
00:03:06Mas também adicionei uma masterclass de OS agentivo lá dentro.
00:03:11Tudo o que você vê no vídeo — prompts, dashboards, configurações —
00:03:15pode ser encontrado em detalhes no Chase AI.
00:03:19O link está no comentário fixado. Além disso,
00:03:23quando este vídeo sair,
00:03:24farei um webinar gratuito sobre como configurar um OS agentivo
00:03:28para você, passando pelas três camadas. Para participar,
00:03:32veja o comentário fixado também. Terei um link para ambos.
00:03:35Se é aqui que reside o valor, como configurar isso?
00:03:38E por que é feito assim? Por que parece um organograma? Bem,
00:03:42toda essa estrutura de organograma, onde as coisas são divididas
00:03:46em seções como produtividade, pesquisa e conteúdo.
00:03:49Isso serve apenas para ajudar a visualizar algo que é invisível.
00:03:53É apenas para o seu modelo mental.
00:03:54É a ideia de que você faz muitas coisas em diferentes domínios
00:03:58no seu fluxo diário ou semanal, seja no seu
00:04:01negócio ou na vida pessoal. Para mim,
00:04:04isso se divide em produtividade. Coisas como Google,
00:04:09pesquisa, conteúdo, minha comunidade, agência, vendas e por aí vai.
00:04:13E o que precisamos fazer é pegar o emaranhado
00:04:18de coisas que você faz no dia a dia, certo?
00:04:21Todas essas tarefas diferentes e separá-las para transformá-las
00:04:26em habilidades. Por que transformar em habilidades? Bem,
00:04:30provavelmente o modo como você usa o código em nuvem hoje,
00:04:32quando precisa que ele faça algo,
00:04:34você apenas abre o terminal e diz a ele o que fazer.
00:04:37Você o está usando apenas como um ChatGPT um pouco melhor.
00:04:41E se você faz isso o tempo todo,
00:04:44por que não codificar isso em uma habilidade?
00:04:47Porque ao codificar, ganhamos algumas coisas. Primeiro,
00:04:51é conveniente. Estou pegando a tarefa inteira
00:04:54e, em vez de explicar tudo em um parágrafo,
00:04:56eu apenas digo o nome da habilidade em uma palavra e ele executa.
00:05:00A conveniência é uma parte. A segunda é que, por estar codificado,
00:05:05podemos testar usando algo como a habilidade de criador de habilidades.
00:05:09Podemos realmente criar benchmarks para as habilidades que criamos.
00:05:14Para ver se,
00:05:16primeiro, a habilidade faz sentido, fazendo testes A/B entre usar
00:05:20a habilidade ou não usá-la. Com o tempo, se for boa,
00:05:25começaremos a ter resultados mais determinísticos de um sistema que é
00:05:30inerentemente não determinístico. Quando falamos de LLMs,
00:05:33há uma certa aleatoriedade inerente ao seu funcionamento.
00:05:38Sempre que pudermos tornar as coisas menos aleatórias, melhor.
00:05:42Ao codificar essas tarefas do dia a dia e transformá-las em habilidades,
00:05:45damos um passo enorme nesse sentido.
00:05:47E embora isso faça sentido para muitos, se você perguntar
00:05:50se eles já sentaram no terminal, ligaram o microfone,
00:05:54abriram o Claude e disseram: “Ei, aqui está meu plano diário. É isso que eu faço.”
00:05:59“Pode extrair algumas habilidades disso e criá-las usando o
00:06:04habilidade de criar habilidades,
00:06:05você provavelmente contaria a porcentagem em uma mão,
00:06:09o que é bizarro, pois este é um dos upgrades mais fáceis e poderosos na
00:06:14forma como você usa o Claude Code.
00:06:15E essa visualização está lá apenas para te ajudar a pensar sobre isso, porque
00:06:19fazemos várias coisas diferentes em vários domínios diferentes.
00:06:22E, muitas vezes, podemos até combinar muitas das tarefas que fazemos em,
00:06:28entre aspas, habilidades de fluxo de trabalho ou habilidades de ordem superior
00:06:32que fazem várias coisas ao mesmo tempo. Por exemplo,
00:06:33eu tenho uma habilidade chamada “Cascata de Conteúdo”.
00:06:37Esta habilidade, para todos os efeitos, é um reaproveitador de conteúdo ou,
00:06:42quando crio um vídeo no YouTube e a aciono, ela faz várias coisas por mim.
00:06:46Ela baixa a transcrição. Cria um post no blog.
00:06:50Cria um post no LinkedIn. Cria um post no Twitter. Inicia o Playwright.
00:06:54E depois publica essas coisas para mim.
00:06:57São várias tarefas individuais diferentes em uma só,
00:07:00mas em vez de dividir em nove habilidades diferentes, bem,
00:07:03agora é apenas uma habilidade.
00:07:04E isso é algo que pode dar um enorme impulso na produtividade.
00:07:09Mas se você já fez isso com todas as coisas do seu dia a dia,
00:07:12provavelmente não.
00:07:13E é esse processo de percorrer o que você faz passo a passo e
00:07:18codificá-lo. Esse é o poder de um SO agêntico.
00:07:21Tudo o que fazemos fora disso, a camada de memória, o painel,
00:07:24é apenas um enfeite em volta.
00:07:27E se você é alguém que não está tentando trabalhar com equipe,
00:07:30alguém que não está tentando empacotar e vender essas coisas,
00:07:32você poderia parar por aqui e já teria,
00:07:35sabe, 80% da solução e estaria muito à frente dos demais.
00:07:38E assim, para executar este processo é bem simples em sua
00:07:43essência. Você fará o que eu disse: abra o terminal,
00:07:47inicie uma nova sessão e comece a falar. E ao final diga: Ei,
00:07:51podemos transformar isso em algum tipo de habilidade?
00:07:54Eu tenho um prompt inteiro que detalha como fazer
00:07:58esta triagem de habilidades, mas na essência, é só isso que fazemos.
00:08:01Aqui está o que eu faço. Transforme em habilidades. Ótimo. Vamos testá-las.
00:08:06Vamos para o próximo domínio no meu negócio ou equipe. E a questão é:
00:08:10isso será extremamente personalizado e específico para você.
00:08:15Acho que ficamos perdidos em meio a 10 bilhões de habilidades que estão
00:08:19flutuando por aí. Vamos a esses mega repositórios,
00:08:21como habilidades incríveis do Claude. E ao ver 10 milhões delas,
00:08:25pensamos que é isso que vai mudar,
00:08:27sabe, meus resultados diários com o Claude Code.
00:08:31E é como se estivéssemos procurando uma agulha no palheiro quando,
00:08:34na verdade, o poder do Claude Code é o quão fácil é
00:08:38customizá-lo para você. Tipo,
00:08:39por que não estamos explorando isso mais de forma sistêmica?
00:08:43Mas, além das coisas customizadas,
00:08:44acho que há algumas coisas que quase todos podem aproveitar.
00:08:48No lado da produtividade, um ponto importante é o ecossistema Google,
00:08:53já falei sobre usar coisas como a CLI do GWS para
00:08:58basicamente permitir que você faça qualquer coisa no ecossistema Google e
00:09:01transformar isso em habilidades, seja triagem de e-mail, Google Drive
00:09:05ou coisas no calendário.
00:09:06Mas a verdade é que você também pode usar os conectores MCP padrão
00:09:11que vêm com o Claude Code. Falo do básico: Gmail do Claude.ai,
00:09:15Google Agenda e Drive.
00:09:17A única coisa que se perde é que você não poderá enviar
00:09:20e-mails, mas ainda pode criar rascunhos, o que para muitos já basta,
00:09:24já que não querem que sejam enviados automaticamente.
00:09:27E isso leva 30 segundos para fazer. É um ganho de produtividade que,
00:09:30repetindo, pouquíssimas pessoas realmente fazem. Agora,
00:09:33após passar por esse processo de criação de habilidades,
00:09:36o próximo passo é a árvore de decisão. Sobre as automações para cada habilidade:
00:09:39ela precisa ser sob demanda ou podemos torná-la uma rotina dentro
00:09:43do Claude Code? Quando falamos de rotinas e automações no
00:09:47Claude Code, elas se dividem em duas partes.
00:09:49Serão automações locais versus automações rodando na
00:09:55nuvem. Se você não souber qual é qual, fique com a local.
00:09:59Basicamente, ela rodará enquanto seu computador estiver ligado.
00:10:02A versão na nuvem...
00:10:04significa que rodará nos servidores da Anthropic e você terá
00:10:07limites de execução, pois são eles que estão pagando por isso.
00:10:10E se estiver na nuvem, ei,
00:10:11ela não terá acesso ao seu computador real. Não roda na sua máquina.
00:10:15Não terá suas CLIs, habilidades ou arquivos.
00:10:17Então, na dúvida, quase sempre será uma automação local.
00:10:22E este é o processo pelo qual você cria a base de um SO agêntico
00:10:26no Claude Code. Eu vivo dizendo Claude Code, mas a verdade é que ele é só o motor.
00:10:30Falaremos um pouco mais sobre isso.
00:10:32Você poderia trocar pelo Codex. Poderia trocar por qualquer coisa.
00:10:36Sabe, estamos construindo o chassi para isso.
00:10:39Podemos trocar o motor a qualquer momento.
00:10:42Tudo o que digo aqui também se aplica ao Codex.
00:10:44Agora vamos falar de Obsidian e memória rapidamente antes de irmos para a
00:10:48parte do centro de comando e painel de observabilidade,
00:10:50porque acho que muita gente se confunde sobre o que o Obsidian realmente
00:10:54oferece e qual é o objetivo de tudo.
00:10:55Lembre-se que o objetivo do Obsidian é apenas uma camada de organização.
00:10:59O Obsidian não está fazendo nada especial com esses arquivos markdown.
00:11:04Ele apenas nos dá, como seres humanos, uma forma de entender
00:11:09o que está acontecendo nos arquivos e um jeito simples de conectá-los.
00:11:13Ele não muda a memória inerentemente. Isso não é RAG.
00:11:17Não está embutindo nada. Não há um banco de dados vetorial,
00:11:21apesar de, sabe, esses gráficos legais,
00:11:24isso não é um grafo de conhecimento real nesse sentido. Dito isso,
00:11:28estar organizado,
00:11:29especialmente quando falamos de organização em escala com milhares de
00:11:32documentos, é muito importante. E não é importante só para você,
00:11:36para conseguir descobrir onde as coisas estão.
00:11:37Eventualmente, torna-se importante para o Claude Code em certa escala em termos de
00:11:40eficiência de tokens e refinamento. É por isso que todos mencionam isso, certo?
00:11:45O nome “Karpathy RAG”, vamos passar por isso rapidinho.
00:11:47É apenas a ideia de que temos um cofre,
00:11:49que é onde o Obsidian vive, e uma série de subpastas. Karpathy diz: Ei,
00:11:53temos “raw” para dados não estruturados. Temos “wikis”, que pegam
00:11:58os dados não estruturados e os transformam em relatórios e artigos.
00:12:02E então temos “outputs” para as entregas. Então, tipo,
00:12:05eu fiz uma pesquisa sobre agentes de IA, que foi para o “raw”.
00:12:09Essa pesquisa virou um artigo sobre agentes de IA na minha wiki de agentes.
00:12:13Ei, eu transformei isso em uma apresentação. Essa é a ideia.
00:12:16A verdade é que você não precisa fazer nada disso.
00:12:19Tudo o que você precisa fazer é encontrar algo que faça sentido para você.
00:12:24E deve ser criado de forma que você e o Claude Code possam navegar
00:12:29pelo sistema de pastas. Se houvesse cem mil arquivos lá,
00:12:33uma base como esta é um bom começo, especialmente porque existem as
00:12:37chamadas master index e arquivos de índice por todo lado.
00:12:40Esses arquivos de índice estão essencialmente em cada nível do Obsidian.
00:12:45E lembre-se que o Obsidian é apenas uma pasta.
00:12:47Então estamos falando de cada subpasta que acessamos.
00:12:49Sempre há uma pasta que age como um índice.
00:12:52Se eu estiver no cofre e clicar na pasta wiki lá dentro,
00:12:57ela terá um índice chamado arquivo index, que me diz: Ah,
00:13:02aqui dentro temos wikis de agentes, sistemas RAG e criação de conteúdo.
00:13:06Legal. Eu sei onde ir. Entro na pasta de Agentes de IA. O que tem lá?
00:13:11Há outro índice. Há outro índice dizendo: Ei,
00:13:16dentro da pasta de Agentes de IA,
00:13:18temos este e aquele documento. Isso é o maior aprendizado que tiro de Karpathy,
00:13:23a ideia de índices e o fato de que, para cada nível que eu desço
00:13:27no Obsidian e na minha estrutura de arquivos,
00:13:30há um documento mestre que me aponta na direção certa.
00:13:33Se você não tiver isso no começo,
00:13:34boa sorte tentando organizar quando tiver 5.000 documentos. No meu caso,
00:13:38eu tenho várias pastas: arquivo, conteúdo, notas,
00:13:42dashboard, entrada, operações, projetos, sistemas, wiki... faz sentido para mim.
00:13:47Eu tenho um índice. Eu entendo o que está acontecendo.
00:13:49Você deve customizar tudo isso para que faça sentido para você.
00:13:53E falando em customizações, vamos agora para a parte do dashboard.
00:13:57Estes centros de comando para esses sistemas operacionais de agentes.
00:14:01Já falamos um pouco sobre o valor disso, certo?
00:14:03É a ideia de que há visibilidade e eu posso ver coisas que
00:14:07eu não conseguiria ver no terminal.
00:14:08E temos esses painéis de habilidades que qualquer um pode usar.
00:14:11A próxima pergunta é: por que diabos existem dois?
00:14:14Por que você tem este dentro do próprio Obsidian?
00:14:17Pois eu estou dentro do Obsidian aqui.
00:14:19E por que você tem este outro como um app Streamlit no localhost?
00:14:22Que é essencialmente um web app. Qual a diferença entre os dois
00:14:25e qual faz sentido para quê? Bem, acho que o valor dos apps Streamlit,
00:14:28ou qualquer web app, é a distribuição.
00:14:31Essa camada de dashboard para sistemas de agentes serve para distribuir.
00:14:35Se eu quiser levar isso para uma equipe ou empacotar para
00:14:38clientes, tê-lo configurado assim é super fácil.
00:14:41Posso ter o template no GitHub e posso distribuir isso
00:14:46muito rapidamente para qualquer pessoa em qualquer lugar.
00:14:48Configurar isso leva literalmente segundos.
00:14:50E se for para um membro da equipe ou um cliente não técnico,
00:14:54manter o mais simples possível assim, com botões claros que estão
00:14:57mapeados para habilidades que ele executa... é ótimo. É tudo o que eles querem.
00:15:01O dashboard no Obsidian é um pouco diferente.
00:15:04Você está trocando distribuição por, na verdade, ergonomia neste ponto.
00:15:08E eu diria até por mais poder, porque é super fácil.
00:15:11Como você pode ver aqui, também dá para ter um terminal integrado dentro
00:15:16do seu centro de comando no Obsidian,
00:15:19o que basicamente significa que agora tenho o melhor dos dois mundos,
00:15:22sem mencionar que, por estar no Obsidian, todas as minhas coisas estão aqui
00:15:26para eu mexer. E o Obsidian é infinitamente customizável, como aqui, né?
00:15:30Sabe, eu tenho meu calendário completo, mas não é um plugin de calendário.
00:15:34Sou literalmente eu apenas com a página do Google Agenda
00:15:38aberta aqui no lado direito, tendo uma ideia muito clara de
00:15:43o que está acontecendo no dia, quais são minhas tarefas,
00:15:45o que há no feed de atividades e onde estou em diferentes
00:15:48comunidades. Quero me aprofundar em coisas de audiência.
00:15:51Tenho uma aba para isso. Quero me aprofundar em pesquisa.
00:15:54Tenho uma aba para isso que mostra tendências, repositórios do GitHub,
00:15:58Hacker News, além de alguns dos meus resumos, que também estão ligados a habilidades,
00:16:02como manchetes, o que acontece no X e no YouTube e oportunidades de conteúdo.
00:16:06Novamente, ter isso,
00:16:08se eu estiver em uma configuração puramente de terminal, é um pouco desajeitado.
00:16:12É um pouco mais difícil. O problema, porém,
00:16:14com a configuração do Obsidian, e eu meio que mencionei isso, é a ideia de distribuição.
00:16:18Como eu poderia distribuir algo assim para uma equipe ou para um cliente?
00:16:23Você até consegue fazer isso porque todo esse painel do centro de comando é essencialmente
00:16:28apenas um plugin personalizado que o Claude Code criou, mas é um pouco mais,
00:16:32de novo, desajeitado e estranho de configurar isso para outra pessoa. Não é só tipo, “Ah,
00:16:37clone o repositório e pronto”. É tipo, ok, clone. Agora vá no Obsidian.
00:16:41Agora ative esses plugins. Agora mova isso para cá, mova aquilo para lá,
00:16:44faça tudo isso. Então há uma certa estranheza nisso.
00:16:48Então, se você é alguém que opera sozinho e pensa: “Ei,
00:16:52eu quero um OS agêntico com o Claude Code.
00:16:54Quero todos esses botões personalizáveis legais, sejam eles quais forem.
00:16:58E também quero o terminal claramente disponível no mesmo painel”.
00:17:02A rota do Obsidian é perfeita. Se, por outro lado, você é alguém que diz:
00:17:07“Estou tentando empacotar isso para equipes e clientes e transformar isso em um
00:17:10produto real”, o web app é o caminho a seguir,
00:17:12mas entenda que esses sistemas só são poderosos conforme a arquitetura de habilidades sobre a qual são construídos.
00:17:16É apenas uma camada legal por cima do Claude Code,
00:17:19porque se você não tiver isso,
00:17:21isso é apenas uma bobagem sofisticada. É só isso, entende?
00:17:26Você precisa de substância real aqui. Então não esqueça de onde vem o seu dinheiro.
00:17:30Então vou encerrar por aqui.
00:17:31Espero ter conseguido deixar um pouco mais claro onde acho que está o valor
00:17:36nesses sistemas de OS agêntico.
00:17:37Vejo um certo grupo de pessoas que realmente critica isso e diz que não
00:17:41valem nada. Não acho que seja uma avaliação justa.
00:17:45Geralmente, o foco é puramente no lado do painel de controle,
00:17:48o que faz sentido se você estiver argumentando contra o painel ou o centro de comando
00:17:52isoladamente, mas isso não é real. O poder está de fato...
00:17:56O painel e tudo isso é apenas uma fachada,
00:17:59o que importa está por trás. E é nisso que o foco
00:18:02deveria estar. E se focarmos nisso e na ideia de habilidades e tudo mais,
00:18:06é tipo,
00:18:07estamos argumentando então que você não deveria ter um sistema de habilidades codificado
00:18:11que se baseia no que você faz no dia a dia?
00:18:13Acho difícil argumentar contra isso. Ah, uma última coisa,
00:18:17outras pessoas trouxeram à tona a questão dos custos, que é importante,
00:18:20especialmente se você tem prestado atenção ultimamente.
00:18:22E a ideia de que o comando -p, executando em modo headless,
00:18:26é algo que a Anthropic aparentemente não gosta mais no Claude Code.
00:18:31E por “não gostar”, quero dizer,
00:18:31eles estão te dando 200 dólares para usar exclusivamente nisso, mas em custos de API.
00:18:35Isso é um problema em toda essa configuração? Porque, como você pode imaginar,
00:18:40tudo isso está rodando o Claude Code em modo headless por baixo dos panos. Sim e não.
00:18:45Por 200 pratas por mês, você teria que estar meio que bombardeando o sistema.
00:18:49Para chegar a esse ponto. E então, acho que na realidade,
00:18:55provavelmente não será um problema. Mas se fosse e você sentisse que estava
00:18:59tendo problemas de uso ou os clientes estivessem tendo esses problemas.
00:19:01Acho que a solução simples é apenas migrar tudo para algo como
00:19:04o Codex CLI, porque o Codex é ótimo e eles não têm esses problemas também.
00:19:09E você ganha mais, você tem um custo-benefício melhor.
00:19:12E trocar tudo por baixo dos panos para o Codex é muito simples.
00:19:16Quero dizer, você poderia usar o Claude Code para fazer isso.
00:19:18Você apenas apontaria para o código e diria: “Tudo bem,
00:19:21vamos mudar”. Assim, agora ele chama o Codex CLI em vez do Claude.
00:19:26Então isso é algo que você poderia essencialmente refatorar em questão de minutos.
00:19:30E você pode até colocar um botão no painel, o que eu talvez faça.
00:19:33Tipo: “Tudo bem, vamos para a versão do Codex”.
00:19:35Então é só algo para ficar atento. Na realidade, para 99,99% das pessoas,
00:19:40não tem efeito nenhum. Então é onde vou encerrar de novo,
00:19:43tudo o que você viu aqui,
00:19:45se quiser a minha configuração exata para o centro de comando do Obsidian
00:19:50e tudo mais, você pode encontrar dentro do Chase AI Plus
00:19:53e não deixe de conferir o webinar que vai acontecer, sabe,
00:19:57daqui a umas 20 horas a partir da postagem deste vídeo.
00:20:01Fora isso, a gente se vê por aí.

Key Takeaway

O real valor de um SO agêntico no Claude Code reside na codificação sistêmica de fluxos de trabalho personalizados em habilidades testáveis, e não na estética de dashboards de comando.

Highlights

  • Um Sistema Operacional Agêntico eficiente é composto por três camadas fundamentais: base de habilidades e automação, camada de memória e painel de observabilidade.

  • Transformar tarefas repetitivas em habilidades codificadas no Claude Code reduz o não-determinismo inerente aos LLMs e permite a criação de benchmarks para testar a eficácia via testes A/B.

  • A configuração de memória no Obsidian funciona como uma camada de organização 80% eficaz para a maioria dos usuários, utilizando arquivos de índice em cada nível de pasta para guiar a navegação do agente.

  • O uso de conectores MCP padrão para o ecossistema Google permite automatizar triagem de e-mails e gerenciamento de calendário em apenas 30 segundos de configuração.

  • A transição de automações locais para a nuvem implica restrições de acesso ao sistema de arquivos local e limites de execução impostos pelos custos de API da Anthropic.

  • A arquitetura de habilidades de ordem superior, como a 'Cascata de Conteúdo', permite executar múltiplas tarefas complexas como baixar transcrições e publicar em redes sociais com um único comando.

Timeline

A Falácia dos Dashboards e a Estrutura de Três Camadas

  • O foco excessivo em centros de comando visuais desvia a atenção da base de habilidades que gera valor real.
  • Um sistema robusto exige uma infraestrutura de automação capaz de produzir resultados consistentes e repetíveis.
  • A camada de memória pode ser simplificada com o uso do Obsidian ou sofisticada com implementações de LightRAG.

Dashboards chamativos servem para visualização, mas dependem inteiramente de uma arquitetura de habilidades subjacente para funcionar. A observabilidade compensa as limitações do terminal, permitindo a análise rápida de métricas e pesquisas em uma única interface. Para usuários não técnicos, botões mapeados para habilidades específicas facilitam a execução de tarefas complexas sem a necessidade de interagir com a linha de comando.

Codificação de Habilidades e Redução de Aleatoriedade

  • Codificar tarefas diárias em habilidades transforma o Claude Code de um chat assistencial em um sistema determinístico.
  • A estruturação de habilidades em domínios como produtividade e vendas organiza o modelo mental do usuário.
  • Habilidades de ordem superior consolidam múltiplas subtarefas, como a criação e distribuição automática de conteúdo em diversas plataformas.

O processo de criação de habilidades envolve narrar o fluxo de trabalho diário para o terminal e solicitar a extração de comandos codificados. Isso garante conveniência, pois substitui parágrafos de instruções por comandos de uma única palavra. Além disso, a codificação permite realizar testes para verificar se a automação é superior ao processo manual, mitigando a aleatoriedade dos modelos de linguagem.

Ecossistema Google e Automação Local vs. Nuvem

  • Conectores MCP permitem integrar Gmail, Agenda e Drive ao Claude Code em menos de um minuto.
  • Automações locais são preferíveis por possuírem acesso direto a arquivos do sistema e CLIs personalizadas.
  • Execuções na nuvem enfrentam limites de tokens e custos de API, além de restrições de segurança que impedem o acesso à máquina do usuário.

A integração com o Google Workspace via CLI ou MCP simplifica tarefas administrativas como a criação de rascunhos de e-mail e triagem de mensagens. A escolha entre execução local ou em nuvem depende da necessidade de acesso aos recursos de hardware e arquivos locais. O Claude Code atua apenas como o motor do sistema, podendo ser substituído por outras interfaces como o Codex sem perder a lógica das habilidades construídas.

Organização de Memória com o Método Karpathy RAG

  • O Obsidian atua como uma camada de organização para arquivos Markdown, não como um banco de dados vetorial nativo.
  • Arquivos de índice em cada subpasta são cruciais para orientar o agente em sistemas com milhares de documentos.
  • A estrutura de pastas deve seguir uma lógica de dados brutos (raw), wikis processadas e entregas finais (outputs).

A organização em escala melhora a eficiência de tokens e o refinamento das respostas do agente. O uso de arquivos 'Master Index' funciona como um mapa que aponta a direção correta para o Claude Code em cada nível da hierarquia de pastas. Embora não seja um RAG real no sentido técnico de embeddings, essa estrutura permite que o usuário e o agente naveguem de forma intuitiva por grandes volumes de informação.

Estratégias de Distribuição e Custos de Operação

  • Web apps em Streamlit são ideais para distribuir ferramentas agênticas para equipes ou clientes externos.
  • Dashboards integrados ao Obsidian priorizam a ergonomia e o poder de processamento para usuários individuais.
  • O Codex CLI surge como uma alternativa de baixo custo caso os limites de API da Anthropic para o modo headless sejam atingidos.

A escolha da interface depende do objetivo final: produtividade pessoal ou comercialização de produtos de IA. No Obsidian, a integração de terminais e calendários otimiza o fluxo de trabalho individual. Para lidar com possíveis aumentos de custos ou restrições de uso da Anthropic, a migração para motores alternativos como o Codex é recomendada e pode ser realizada rapidamente através de refatoração de código via terminal.

Community Posts

View all posts