PARE de usar o Claude Code sem este sistema operacional agentico Fable 5

CChase AI
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00Ei Jarvis, me dê o resumo de hoje.
00:00:03Bom dia.
00:00:04Você está com cerca de 466.000 seguidores em todas as plataformas, um aumento de cerca de 3.000 esta semana.
00:00:12Os últimos vídeos estão recebendo cerca de 4.000 visualizações por dia, 17.000 até agora.
00:00:18Grande notícia em IA hoje, uma diretiva do governo dos EUA forçou a Anthropic a suspender o acesso público à sua classe mythos de topo.
00:00:27A coisa mais importante na pauta de hoje, editar e lançar o vídeo de revelação do HUD do Jarvis.
00:00:33Quer que eu faça a auditoria diária da caixa de entrada ou você tem outra coisa em mente?
00:00:37Então, o que exatamente estamos vendo aqui?
00:00:39Bem, este é o Jarvis, nosso SO Claude Fable 5.
00:00:43Agora, quando dizemos Fable 5, quero dizer que isso foi construído usando o Fable 5, mas não requer que tenhamos o Fable 5 para realmente executar isso.
00:00:51Na verdade, muito do que você está vendo aqui é completamente local, e pode ser executado em praticamente qualquer modelo que você quiser.
00:00:58Agora, se você viu meus vídeos anteriores sobre SO Agêntico, você já sabe como funciona.
00:01:01Pegamos o Cloud Code e adicionamos outra camada sobre ele, o que nos dá algumas coisas que você simplesmente não consegue obter dentro do terminal.
00:01:08Coisas como métricas visuais, coisas como habilidades que se transformam em botões, e isso não é teatro de produtividade.
00:01:15Isso é algo que nos dá um verdadeiro impulso se formos alguém que opera em vários domínios diferentes, e também é algo que podemos facilmente empacotar para clientes ou membros da nossa equipe que não são particularmente técnicos.
00:01:26E o Jarvis é apenas a próxima evolução deste modelo de SO Agêntico.
00:01:30Sua espinha dorsal ainda é essa arquitetura de habilidades do Claude Code robusta e completamente personalizável, que pega tudo o que você faz no seu dia a dia, seus fluxos de trabalho manuais, suas tarefas diárias, e transforma isso em habilidades e automações.
00:01:43E é sobre esse alicerce que construímos isso.
00:01:46E no vídeo de hoje, vou mostrar como funciona, onde está o verdadeiro valor e como você pode criar algo assim para si mesmo.
00:01:53E acho que há muitas coisas que você pode tirar deste projeto, especialmente a dinâmica de modelo de voz local que temos.
00:01:58Antes de mergulhar em tudo isso, uma palavra rápida do patrocinador de hoje, eu mesmo.
00:02:02Então, dentro do Chase AI+, você não apenas tem acesso à minha configuração exata que você vê no vídeo de hoje, você também obtém a masterclass de Claude Code, que é a maneira número um de ir do zero ao desenvolvedor de IA, especialmente se você não vem de uma formação técnica.
00:02:14Eu atualizo isso toda semana, e também inclui uma masterclass de Codex.
00:02:18Então, se você é alguém que está tentando ficar na vanguarda da IA, este é o lugar para você.
00:02:23Estamos fazendo algumas ofertas na assinatura, então se você quiser dar uma olhada, é só verificar o comentário fixado.
00:02:28Então, vamos começar com uma visão geral rápida do Jarvis para que você possa entender o que você está realmente vendo aqui.
00:02:34Depois de fazermos isso, vamos dar uma olhada no que está por baixo do capô, ver como isso está funcionando, para que você entenda como personalizá-lo e como construí-lo você mesmo.
00:02:41Então, bem no centro, temos todo o aspecto de voz, novamente, completamente local, o que permite que seja relativamente rápido e ágil em comparação com rotear tudo através de algo como o 11Labs, por exemplo.
00:02:53E no início deste vídeo, você ouviu o Jarvis me dar toda uma explicação sobre o que está acontecendo com meus vídeos mais recentes, o que está acontecendo com minha contagem de seguidores, notícias de IA, esse tipo de coisa.
00:03:01Isso não é um script codificado.
00:03:03O que acontece é que quando eu pergunto ao Jarvis, ei, me dê o resumo de hoje ou o que está acontecendo hoje, ele dá uma olhada nos vários relatórios que são gerados automaticamente dentro do meu Obsidian Vault e determina o que é realmente importante nesses relatórios e o que eu deveria saber.
00:03:18Enquanto ele fazia isso, você se lembrará, houve alguns pop-ups diferentes, e esses pequenos pop-ups são relatórios ou links para coisas que são relevantes com base no que ele está falando com você.
00:03:29Então, lembre-se, ele disse como, ei, seu último vídeo está fazendo X, Y e Z, então ele tem esse pop-up de implantação mais recente, que me leva ao referido vídeo.
00:03:37Ele menciona coisas sobre a Anthropic, sabe, essencialmente fazendo com que o Fable 5 seja cancelado pelo governo.
00:03:42O que ele faz?
00:03:43Ele traz o artigo fonte para isso.
00:03:44Ele também falou sobre mais coisas relacionadas a notícias de IA e o que está em alta, e tudo isso veio do relatório da manhã.
00:03:49Então, se eu clicar aqui, você vê todo esse texto.
00:03:52Este texto vive dentro do Obsidian.
00:03:54Todo esse sistema está vinculado ao Obsidian.
00:03:56Então, embora eu possa lê-lo aqui, também posso clicar em Abrir no Obsidian, e ele traz o relatório original dentro do Obsidian.
00:04:04Posso clicar nos diferentes links, então há toda uma conexão.
00:04:07Você também se lembra que ele perguntou ao final de sua fala, ei, você quer que eu faça essa triagem da caixa de entrada para você?
00:04:12Você quer que eu vá ao seu Gmail e veja o que é importante, ao que precisamos responder?
00:04:15Bem, essa é uma habilidade, e essas habilidades e automações são representadas aqui à direita.
00:04:21Isso me permite executar instantaneamente qualquer skill ou automação de Cloud Code com o clique de um botão.
00:04:26E, novamente, se você se lembra do que fizemos com nosso Cloud OS que criamos no Obsidian na outra semana, é exatamente a mesma ideia.
00:04:33O valor agregado aqui é mais para o caso de você estar usando isso com uma equipe não técnica ou um cliente não técnico,
00:04:39e eles quiserem ser capazes de executar skills e automações com Cloud Code, mas não são do tipo que abriria o terminal.
00:04:44Isso permite que eles obtenham todo esse poder com o clique de um botão e, novamente, totalmente personalizável.
00:04:49Então digamos que eu quisesse obter um resumo completo da caixa de entrada.
00:04:52Se eu apenas clicar em resumo da caixa de entrada aqui no canto superior direito, você pode ver que ele menciona que está na fila imediatamente.
00:05:00Nós o vemos aqui, e então também vemos um novo pop-up mostrando o resumo da caixa de entrada, e temos uma pequena barra de progresso mostrando que ele está trabalhando na referida automação.
00:05:09E assim que terminar, ele não só gerará um relatório escrito, como também pode me dar um resumo verbal de, ei, aqui está o que está acontecendo, aqui está o que você deve se preocupar.
00:05:16Então ele me deu o resumo verbal rápido do que encontrou, e então posso ver o relatório real, que, como sempre, está vinculado dentro do Obsidian.
00:05:34Então esses pop-ups são úteis, eles são relevantes, e eles nos vinculam a coisas com as quais realmente nos importamos e, a qualquer momento, posso limpá-los.
00:05:39Agora vamos olhar um pouco mais para a direita.
00:05:41Então, meio que já falamos sobre isso.
00:05:43Temos essas habilidades diferentes que podemos trocar a qualquer momento.
00:05:45A um clique de distância, ele as executa.
00:05:47Abaixo disso, temos o cronograma.
00:05:50Então, este é apenas o meu cronograma diário que está vinculado ao meu Google Agenda.
00:05:53Se eu clicar, ele abre meu calendário.
00:05:56Temos uma pequena seção de áudio.
00:05:58Então, se você estava prestando atenção quando ele estava realmente falando conosco, podíamos vê-lo meio que apenas se movendo para cima e para baixo, e apenas deixa você saber se ele está realmente funcionando.
00:06:05E abaixo disso, temos um resumo do que está acontecendo em termos de notícias de IA.
00:06:10Agora, tudo o que você vê aqui, junto com tudo o que conversamos, é completamente personalizável.
00:06:15Talvez você não se importe em ter seu cronograma do Google Agenda aqui.
00:06:18Talvez você não se importe em mostrar o áudio ou ter um feed de notícias de IA.
00:06:21Tudo bem.
00:06:22A beleza desses sistemas de tipo SO agêntico é o fato de que não é um tamanho único para todos.
00:06:29Este é apenas um conjunto de ferramentas que estou mostrando a você que você pode pegar e fazer o que quiser com elas.
00:06:34Sabe, suas métricas serão diferentes das minhas.
00:06:36O tipo de coisas que você quer ter a um clique de distância serão muito diferentes das minhas.
00:06:40Tudo depende do tipo de seus fluxos de trabalho diários e do que você ou sua empresa faz.
00:06:44Mas o lado positivo de algo assim é que, quando falamos sobre criar isso para clientes ou até mesmo membros da equipe, é que você pode torná-lo o que quiser para eles.
00:06:51Aqui do lado esquerdo, meio que a mesma coisa.
00:06:53Para meus sinais vitais, mostro coisas como minhas contagens de inscritos, o que está acontecendo com meu último vídeo.
00:06:58Tenho um pequeno rastreador para meus tokens Claude nas últimas cinco horas.
00:07:01E algumas coisas como diretivas.
00:07:03Então diretivas são apenas, ei, aqui estão as três principais coisas nas quais você deveria estar trabalhando hoje.
00:07:06Novamente, totalmente dinâmico e o Claude Code descobre isso com base na minha agenda.
00:07:10E então eu tenho uma pequena trilha de documentos.
00:07:13Então tudo o que é criado ou referenciado pelo Jarvis não apenas aparece como um pop-up.
00:07:18Está aqui.
00:07:18Então, se eu quiser clicar, novamente, como o relatório da manhã, está logo ali.
00:07:22Então essa é a interface do usuário.
00:07:23Esse é o lado visual do Jarvis.
00:07:25Agora vamos falar sobre as porcas e parafusos reais.
00:07:28O que está realmente acontecendo sob o capô aqui?
00:07:29Porque é isso que realmente importa, sejamos honestos.
00:07:32Se meio que parássemos por aqui e fosse uma interface de usuário elegante, bem, novamente, estamos meio que apenas falando sobre teatro de produtividade.
00:07:37Se isso for algo que realmente move o ponteiro em vez de ficar sentado no terminal o tempo todo, precisa de uma espinha dorsal adequada.
00:07:43E é isso que estamos vendo aqui.
00:07:45Então, vamos percorrer o que acontece quando você fala com o Jarvis e pede para ele fazer algo, porque ele pode seguir vários caminhos diferentes.
00:07:53Então aqui está você, e digamos que você diga ao Jarvis, me dê uma atualização sobre o resumo da manhã de hoje.
00:08:00Você tem algum tipo de automação que você executa todas as manhãs.
00:08:03Ele pega qualquer informação que seja relevante para você, e você quer que o Jarvis lhe conte sobre isso.
00:08:07Você não quer ler.
00:08:07Você quer que ele realmente a execute ou, se já foi executada, conte sobre isso.
00:08:12Então você diz isso audivelmente ao Jarvis, ei, o que está acontecendo no relatório da manhã de hoje?
00:08:18Essa voz, porque novamente, você usou seu microfone para isso, esse áudio vai para o Faster Whisper.
00:08:25Agora, o Faster Whisper é um programa gratuito, de origem local, que vai pegar o que você falou e transcrevê-lo.
00:08:34Agora, existem um milhão e um, sabe, transcritores de áudio locais diferentes.
00:08:39Você pode substituir isso pelo que quiser.
00:08:40Este é apenas o que escolhi porque funciona muito bem.
00:08:42Então ele está pegando sua voz e transformando-a em uma transcrição.
00:08:46Agora, o que fazemos com isso?
00:08:47Porque falamos um pouco sobre o Fable 5 e todas essas coisas.
00:08:50Cada transcrição precisa ser enviada ao Cloud Code para rodarmos o Fable 5 e ele analisar?
00:08:55Não, claro que não.
00:08:56Tudo isso é construído com Fable 5, mas a maioria das coisas que estão rodando sob o capô será ou Opus ou Sonnet,
00:09:02ou, francamente, você poderia usar um modelo local para muitas dessas coisas porque o Jarvis não é, embora possa fazer isso,
00:09:08você pode dizer para ele usar o Fable e você usa muito bem.
00:09:11Não é como se você estivesse criando projetos com isso.
00:09:13Isso está mais no reino do assistente pessoal ou para uma equipe não técnica que só quer que ele faça
00:09:17muitas das coisas semelhantes o tempo todo com uma interface agradável e fácil de entender.
00:09:22Então, apenas, isso é meio que o panorama geral.
00:09:24Mas então pegamos o que você falou, transformamos em uma transcrição.
00:09:26Agora precisamos descobrir o que fazer com isso.
00:09:28E temos meio que três opções.
00:09:30Agora, a primeira pergunta que será feita é, podemos rotear esta transcrição ou esta pergunta através de expressões regulares ou regex?
00:09:39Então, o que vai acontecer é que este script essencialmente, este pedaço determinístico de código, a IA não está envolvida aqui,
00:09:45ele vai olhar para sua transcrição e dizer, hmm, combinou com algumas dessas fases pré-codificadas específicas
00:09:52que sabemos que precisam fazer algo automaticamente?
00:09:55O que queremos dizer com isso?
00:09:56Bem, na introdução, o que eu disse?
00:09:58Eu disse o resumo para hoje, certo?
00:10:00Eu uso o termo resumo.
00:10:03Resumo é uma palavra de gatilho específica, por assim dizer, que o regex detecta e roteia automaticamente para fazer algo específico.
00:10:11E essa coisa específica é o que você ouviu no começo.
00:10:14Dê uma olhada nos relatórios, me diga o que está acontecendo, me dê um resumo para o dia, certo?
00:10:19Um resumo básico, então ele detecta automaticamente essa palavra-chave e faz uma coisa específica.
00:10:24Nós gostamos disso porque, como é apenas código, não nos custa dinheiro, a IA não está envolvida e é muito, muito rápido, certo?
00:10:32Em um mundo perfeito, poderíamos fazer tudo assim, e teríamos respostas muito, muito rápidas.
00:10:36Mas isso não é tudo, porque na maioria das vezes o que você está dizendo ao sistema de IA para fazer pode ser um pouco obscuro, certo?
00:10:43Requer um pouco de inteligência para descobrir o que fazer e como rotear.
00:10:47E é aí que entra a opção dois, e é aí que trazemos o Haiku.
00:10:51Agora, por que estamos usando o Haiku?
00:10:52Por que estamos usando o modelo antrópico mais simples que existe?
00:10:54Bem, porque é barato e rápido.
00:10:57O que estamos fazendo aqui nesta seção inteira é simplesmente rotear.
00:11:01Não estou fazendo nada, a menos que sejam expressões regulares que eu sei que posso rotear imediatamente.
00:11:06Estamos apenas tentando descobrir nesta fase para onde essa resposta precisa ir e quem precisa fazê-la.
00:11:11Então o Haiku é muito bom nisso.
00:11:13A maioria das coisas que você pedirá ao Jarvis para fazer não são muito complicadas.
00:11:18Ele só precisa entender qual caminho seguir, e o Haiku descobre isso para nós.
00:11:22Novamente, estamos falando de frações de centavo para cada solicitação.
00:11:26Agora, a terceira opção, e uma que incluo no meu sistema, mas, sabe, depende apenas do que você quer fazer, é ter isso como um modelo completamente local.
00:11:34Você não precisa usar o Haiku de jeito nenhum.
00:11:35Você pode usar um modelo no seu computador local, que, novamente, se inclina para o lado local de todo este sistema, e faz a mesma coisa.
00:11:42Ele vai dar uma olhada na transcrição para descobrir onde roteá-la.
00:11:45Estamos apenas roteando aqui.
00:11:46Então, para recapitular, você fala, isso é transcrito, e então usamos expressões regulares, Haiku ou um modelo local para descobrir o que fazer com isso.
00:11:54Então, ampliando aqui, agora demos ao Jarvis esse pedido.
00:11:59Me diga o que está acontecendo no relatório da manhã.
00:12:01Então o que vai acontecer é que o Haiku vai dizer, ok, vamos dar uma olhada no Obsidian.
00:12:06Isso já existe?
00:12:08Se este é um relatório que já está no disco, bem, isso é algo que podemos ver, ler e responder muito rápida e facilmente.
00:12:16Se não existe dentro do Obsidian, bem, o que ele vai fazer?
00:12:19Bem, ele então vai dizer ao Claude Code para criar o relatório da manhã.
00:12:24Agora, novamente, o Haiku está roteando, mas o Haiku não será o responsável por executar isso.
00:12:28Queremos um modelo mais forte.
00:12:30Então, por padrão, será Opus, mas você pode mudar isso para Sonnet.
00:12:34E se você estiver louco, pode mudar isso para Fable 5 quando ele eventualmente retornar.
00:12:38Então, se ainda não foi criado, o que vamos fazer?
00:12:42Temos uma versão headless do Claude Code.
00:12:44É como abrir o Claude Code, mas é invisível.
00:12:47E usa dash P.
00:12:49Agora, note que usar o Claude Code headless com dash P em um dia ou mais não vai descontar da sua assinatura.
00:12:57Ok?
00:12:57Vai descontar daqueles 200 dólares, como créditos de API adicionais que você recebe todo mês.
00:13:02Isso pode ser um problema?
00:13:04Em grande escala?
00:13:05Sim.
00:13:06E é por isso que você quer fazer muitas dessas coisas com o Sonnet.
00:13:10Isso vai ser um problema na realidade?
00:13:13Eu diria que não realmente.
00:13:15Qual é o propósito de algo como o Jarvis?
00:13:17É atuar neste assistente pessoal, como gerenciador de tarefas.
00:13:21Não estamos construindo o Facebook com o Jarvis.
00:13:24Sabe, se você estivesse realmente fazendo isso, você estaria no terminal, com certeza.
00:13:27Isso é coisa de assistente pessoal, coisas para membros de equipe não técnicos.
00:13:31Em uma certa complexidade, você não usaria isso.
00:13:33Esta não é a ferramenta certa para o trabalho.
00:13:35Dito isso, por causa disso, é provável que você gaste 200 dólares em créditos se estiver usando o Sonnet na maior parte?
00:13:44Eu diria que não.
00:13:46Não é um grande problema, mas algo para se pensar.
00:13:48E novamente, se isso for um problema para você, então simplesmente não use o Cloud Code para isso.
00:13:52Isso se chama Fable 5 OS, mas sejamos honestos.
00:13:55Você poderia substituir isso pelo Codex.
00:13:56Você poderia substituir tudo isso por modelos locais.
00:13:59Sabe, não precisa ser o Cloud Code.
00:14:02A infraestrutura é personalizável e pode ser trocada pelo que você quiser.
00:14:07Mas voltando ao nosso exemplo, dissemos que queríamos o relatório matinal.
00:14:10Não estava dentro do Obsidian, então agora ele vai gerar uma versão headless do Cloud Code para criar o relatório para nós.
00:14:16Esse relatório é então enviado para o Obsidian, ele lê o relatório e, em seguida, gera uma resposta com esse resumo.
00:14:25Esse resumo vai para o Kokoro.
00:14:29O Kokoro é outro modelo local de código aberto que vai pegar a transcrição do resumo que o Cloud Code criou e transformá-la em palavras, transformá-la em uma voz.
00:14:39Pense nisso como um mini 11labs no nosso computador.
00:14:43Então Kokoro vai dizer, ei, no relatório matinal de hoje, blá, blá, blá, blá, blá, e isso vai até você.
00:14:49A voz que você ouviu hoje com o Jarvis é do Kokoro.
00:14:53Isso pode ser substituído por qualquer voz que você quiser.
00:14:55Então, novamente, local, personalizável.
00:14:56Mas é assim que tudo isso funciona em termos de você pedir ao Jarvis para fazer algo, e é esse o caminho que percorre.
00:15:04Então, para resumir mais uma vez, já que tenho certeza de que muitos de vocês estão muito confusos, o que acontece?
00:15:10Você pede ao Jarvis para fazer algo.
00:15:13Esse pedido precisa ser transformado em uma transcrição.
00:15:16O Faster Whisper faz isso de graça.
00:15:18Uma vez que temos a transcrição, precisamos descobrir, como roteamos isso?
00:15:22Usamos expressões regulares, um modelo barato como o Haiku, ou um modelo local.
00:15:28A partir daí, geralmente precisamos descobrir se isso é algo que já existe no Obsidian, ou se precisamos solicitar ao Cloud Code que gere esse relatório, esse pedido para nós.
00:15:38Uma vez que gera o que precisa gerar, ou vai criar um relatório dentro do Obsidian, ou talvez seja uma página HTML.
00:15:44De qualquer forma, vai fazer o que tem que fazer, vai enviar a resposta para o Kokoro, que transforma isso em uma voz que podemos ouvir, e isso volta para nós.
00:15:53Simples o suficiente.
00:15:54Agora, indo um passo além, tudo o que está acontecendo por baixo do capô.
00:15:57Quando dizemos relatório matinal, quando dizemos faça a habilidade A, B e C, do que estamos realmente falando?
00:16:01Bem, estamos falando disso.
00:16:03Estamos falando da arquitetura de habilidades que é realmente a espinha dorsal de tudo.
00:16:08Porque o que é um relatório matinal?
00:16:09Bem, isso pode significar qualquer coisa.
00:16:10O que isso é, é uma habilidade, é uma habilidade composta por outras habilidades em miniatura que me dão um relatório grande dizendo, vá verificar essas fontes para obter esta informação, vá verificar essas redes sociais para obter esta informação, blá, blá, blá.
00:16:24Mas, como continuo insistindo, essa arquitetura de habilidades só é tão forte quanto você a torna.
00:16:30E como fazemos isso?
00:16:31E se você assistiu aos meus outros vídeos, você conhece meu discurso sobre isso.
00:16:34O que você precisa fazer é encontrar uma maneira de pegar seus fluxos de trabalho diários.
00:16:38Quando digo seus fluxos de trabalho diários, o que estou dizendo?
00:16:40Estou dizendo, o que você faz no dia a dia em sua vida pessoal ou em seus negócios?
00:16:43Tipo, quais são essas tarefas comuns que são repetidas continuamente?
00:16:47Você, alguém a esta altura que provavelmente sabe como usar o Cloud Code, você realmente se sentou com o Cloud Code e disse, ei, aqui está o que eu faço todos os dias.
00:16:55Podemos separar todas essas coisas em tarefas individuais?
00:16:58E então podemos transformar essas tarefas em habilidades?
00:17:01E se fizer sentido, transforme essas habilidades em automações.
00:17:04É assim que você constrói uma arquitetura de habilidades como esta.
00:17:06E é onde reside todo o poder disso.
00:17:08Por exemplo, e o que você vê aqui é muito do que faço nas minhas diferentes habilidades, algo como pesquisa de conteúdo.
00:17:14Novamente, a maioria de vocês não está criando conteúdo, então será algo completamente diferente.
00:17:17Mas, o ponto permanece.
00:17:19Então, o que eu faço para pesquisar?
00:17:20Bem, obviamente, preciso dar uma olhada em coisas como o YouTube.
00:17:24E então, transformei a pesquisa no YouTube por informações em algo chamado minha habilidade de Pipeline de YT, onde ele dá uma olhada nos vídeos do YouTube, envia-os para o Notebook LM e depois me dá resumos.
00:17:35Preciso ser capaz de fazer pesquisas profundas sobre certos tópicos que vão além do YouTube, que dão uma olhada em outras coisas, seja o Twitter, a internet em geral, etc.
00:17:43Bem, transformei isso em uma habilidade de pesquisa profunda totalmente personalizada.
00:17:47Tenho todo um sistema GraphRag com LightRag, que tem muitas informações sobre o que fiz no passado.
00:17:52Então, o que eu fiz?
00:17:53Transformei todo esse sistema de consulta em uma habilidade.
00:17:56E assim por diante, e assim por diante.
00:17:58Então repeti isso em todos os diferentes domínios da minha vida pessoal e profissional, seja conteúdo, minha comunidade, minha agência, vendas, etc., etc., etc.
00:18:07E em termos práticos, como você faria isso é literalmente, você simplesmente abriria o Cloud Code, e daria a ele um fluxo de consciência dizendo, aqui está o que eu faço todos os dias.
00:18:15E então você diria, ei, podemos transformar isso em habilidades?
00:18:17E dentro do Chase Heia Plus e no link abaixo, tenho um script completo que você pode conectar ao Cloud Code, e ele o guiará por isso, se precisar.
00:18:25E para meio que amarrar tudo isso acima, quando falamos sobre essas habilidades, se você então disser ao Jarvis, ei, faça as habilidades X, Y e Z, e ele passa pelo processo de transcrição e roteamento, a parte onde trazemos o Cloud Code headless, você sabe, e ele está executando isso em segundo plano para fazer algo.
00:18:42Se o que está fazendo é apenas uma habilidade simples, você sabe que obterá um resultado que é A, correto, e B, consistente, porque você já mapeou o processo.
00:18:53Não resta nada ao acaso.
00:18:55E sempre que conseguimos criar sistemas de IA que são mais determinísticos por natureza, melhor.
00:19:02Quanto menos estivermos sujeitos apenas aos problemas da IA em geral, como, bem, talvez faça o que eu quero, talvez não, certo?
00:19:08Quando criamos habilidades, codificamos certas coisas.
00:19:11E assim você junta tudo isso, e tem o Jarvis, sabe, e pode ver por baixo do capô, é muito mais do que apenas uma interface de usuário chique com algumas métricas que são legais, que são apenas boas de ter.
00:19:22Há muita coisa acontecendo por baixo.
00:19:23E novamente, o verdadeiro poder de algo assim, porque é um aplicativo da web, é o fato de que podemos agrupá-lo e compartilhá-lo com membros da equipe e compartilhá-lo com clientes.
00:19:30Eles só precisam dizer a você, se você é quem está criando para eles, o que eles querem no lado da personalização.
00:19:36E o verdadeiro, verdadeiro poder é toda a arquitetura de habilidades, e o fato de que você vai meio que guiá-los através da codificação de diferentes tarefas.
00:19:46Porque então eles podem sentar aqui, ou qualquer um poderia sentar nesta cadeira em que estou aqui, e obter cerca de 80, 90% do poder do Claude code da maneira que uso todos os dias, que são essas diferentes habilidades e automações.
00:19:56Está literalmente a um clique de distância deles.
00:19:58É isso que você realmente dá a eles.
00:20:00E então, se eles quiserem outra coisa, sabe, temos toda a parte de voz nisso.
00:20:03Mas isso, no final, é uma camada chique sobre tudo isso.
00:20:07Então, esse é todo o sistema em poucas palavras.
00:20:09Eu realmente gosto disso, principalmente por causa da personalização e do fato de que podemos adicionar muitas coisas locais.
00:20:14Então você pode ser bem criativo com o que é capaz de fazer e ao que é capaz de se conectar.
00:20:18Novamente, nada o impede de trazer mais fontes externas de algo assim, como transformá-lo em um agente do Slack e coisas desse tipo.
00:20:26É aqui que vou deixar vocês com isso, pessoal.
00:20:30Se vocês quiserem, novamente, minha configuração exata dentro do Chase AM+, há um link para isso no comentário fixado.
00:20:36Mas, fora isso, me digam o que acharam, e vejo vocês por aí.

Key Takeaway

O Jarvis é um sistema operacional agêntico personalizável que transforma fluxos de trabalho manuais em habilidades acionáveis e determinísticas via Claude Code, permitindo que usuários não técnicos executem automações complexas com apenas um clique.

Highlights

  • O Jarvis funciona como um sistema operacional agêntico que adiciona uma camada de interface visual e métricas sobre o Claude Code.

  • A transcrição de voz local é realizada pelo Faster Whisper, enquanto a síntese de voz utiliza o modelo de código aberto Kokoro.

  • O sistema utiliza expressões regulares ou o modelo Haiku para rotear tarefas automaticamente, economizando custos e tempo de processamento.

  • A integração com o Obsidian permite que o Jarvis consulte, crie e exiba relatórios de texto diretamente de um cofre local.

  • A execução de habilidades em segundo plano utiliza o modo headless do Claude Code com a flag -p para automação sem necessidade de abrir o terminal.

  • O custo operacional é otimizado priorizando o modelo Haiku para roteamento e o Sonnet para execução, mantendo o uso de créditos dentro dos limites mensais de 200 dólares.

Timeline

Visão geral e funcionalidades do Jarvis

  • O Jarvis oferece uma camada de interface visual sobre o Claude Code, incluindo botões para habilidades e métricas em tempo real.
  • O sistema opera localmente em grande parte, integrando-se nativamente ao Obsidian para gerenciamento de relatórios e dados.
  • A interface permite que usuários não técnicos acessem automações avançadas sem interagir com o terminal.

O sistema centraliza informações como métricas de redes sociais, notícias de IA e agenda pessoal em uma única tela. Os pop-ups contextuais conectam diretamente os resumos gerados pelo sistema aos documentos fonte dentro do Obsidian, eliminando a necessidade de scripts rígidos.

Arquitetura técnica e processamento sob o capô

  • O Faster Whisper transcreve o áudio do usuário localmente e de forma gratuita.
  • O sistema roteia solicitações usando expressões regulares para comandos simples ou o modelo Haiku para lógica complexa.
  • O modelo Kokoro converte respostas de texto em áudio local, funcionando como uma alternativa leve e ágil ao 11Labs.

Ao receber um comando de voz, o sistema decide o caminho mais eficiente. Comandos simples são processados deterministicamente via regex sem custo de IA. Quando necessária, a lógica é enviada ao modelo Haiku para roteamento e, posteriormente, ao Claude Code (geralmente Opus ou Sonnet) para execução, garantindo velocidade e economia.

Criação e otimização de habilidades

  • A arquitetura de habilidades transforma tarefas repetitivas diárias em automações modulares.
  • A criação de habilidades exige o mapeamento detalhado dos fluxos de trabalho reais do usuário para o Claude Code.
  • Sistemas baseados em habilidades aumentam a previsibilidade e a consistência dos resultados em comparação com a IA genérica.

O verdadeiro poder reside na personalização das habilidades para domínios específicos como pesquisa de conteúdo ou gestão de vendas. Ao codificar tarefas diárias como habilidades, o usuário obtém resultados padronizados e consistentes, minimizando a dependência da variabilidade inerente aos modelos de linguagem.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video