Vercel acaba de revelar a maior vantagem do Claude Code

Portuguêsالعربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Русский 中文

Computing/SoftwareSmall Business/StartupsAdult EducationInternet Technology

Transcript

00:00:00Desde que os modelos se tornaram poderosos, muita gente começou a criar produtos incríveis,

00:00:04integrando modelos a eles e resolvendo vários problemas para nós. Mas esses sistemas consomem muitos

00:00:09tokens, especialmente se você estiver integrando um modelo usando uma API. A solução para isso é bem mais

00:00:15simples do que você imagina. A melhor arquitetura não é um pipeline extremo ou um ajuste de escala enorme,

00:00:20mas sim uma antiga filosofia que serve de base para o sistema Unix: a de que tudo é um arquivo.

00:00:25Eu sei que eles não estavam falando de custos de modelos, mas sim de dispositivos e arquivos. No entanto,

00:00:30por incrível que pareça, a solução para esse problema de alto custo segue exatamente o mesmo princípio. E é

00:00:35justamente sobre isso que um engenheiro de software da Vercel fala. Antes de explorarmos por que arquivos são a solução,

00:00:41vamos entender algumas coisas sobre como esses modelos realmente funcionam. Os modelos foram treinados

00:00:46em quantidades massivas de código. É por esse motivo que eles são ótimos em entender código,

00:00:50estruturas de diretórios e scripts bash nativos que desenvolvedores usam para navegar em arquivos e encontrar o

00:00:56que precisam. Quando um agente usa grep e ls, ele não está fazendo algo novo. Está simplesmente fazendo algo que

00:01:01já sabe fazer, só que de forma mais controlada. Essa abordagem não se limita a código; agentes podem

00:01:06navegar em qualquer diretório com qualquer conteúdo, seja código ou não, pois já estão familiarizados

00:01:11com comandos e entendem sistemas de arquivos. Sempre que um agente precisa de algo, ele busca no arquivo

00:01:17sistema usando comandos nativos do bash, como ls e find. Quando o agente localiza o arquivo exato com o find,

00:01:23ele busca o conteúdo relevante dentro desse arquivo usando correspondência de padrões com grep e cat.

00:01:27Apenas uma pequena fatia relevante de informação é enviada ao modelo, enquanto o restante fica fora da memória,

00:01:32mantendo a janela de contexto limpa. Isso significa que não estamos queimando tokens com dados

00:01:36irrelevantes que o modelo não precisa. Usando essa abordagem, o agente retorna um resultado estruturado.

00:01:41Esse padrão funciona tão bem que a Vercel acabou lançando uma ferramenta de bash em código aberto feita especificamente

00:01:46para isso, dando aos agentes a capacidade de explorar sistemas de arquivos da mesma forma que um desenvolvedor faria.

00:01:51Ao criar sistemas de modelos de linguagem grandes, há duas formas de fornecer a informação correta

00:01:56ao modelo: ou por meio de um prompt de sistema detalhado, esperando que o agente realmente o siga,

00:02:00ou alimentando um banco de dados vetorial com muitos dados e usando busca semântica para extraí-los. Mas cada

00:02:06abordagem tem limitações. Prompts de sistema têm uma janela de tokens limitada, o que restringe o quanto

00:02:10de informação podemos enviar ao modelo por vez. Para lidar com conjuntos de dados maiores, usamos busca semântica,

00:02:15que encontra informações com base na similaridade de significado com a consulta. Mas a busca vetorial é usada para

00:02:20similaridade semântica, e não para buscas exatas. Ela retorna blocos de dados que correspondem ao contexto

00:02:25geral da consulta, não necessariamente ao valor específico que buscamos. Isso deixa a extração do

00:02:30conteúdo correto de todos esses blocos para o próprio modelo. Sistemas de arquivos, no entanto, oferecem uma

00:02:35abordagem diferente. Com eles, a estrutura realmente mapeia o seu domínio. Frequentemente há relações

00:02:40entre arquivos na estrutura de pastas que espelham as relações entre as pastas superiores. Com sistemas

00:02:45de arquivos, você não precisa achatar essas relações em blocos vetoriais para o modelo entender,

00:02:49o que ajuda a evitar a perda de relações que geralmente somem na busca semântica. Essas conexões

00:02:54hierárquicas são preservadas naturalmente, mantendo a lógica organizacional que já existe nos

00:02:59seus dados. Outra vantagem é que a recuperação é precisa, pois as ferramentas de grep e bash retornam correspondências

00:03:05exatas, ao contrário da busca vetorial, que retorna todos os blocos parecidos e deixa

00:03:10para o modelo decidir qual usar. Você obtém apenas o valor necessário. O contexto é mínimo

00:03:15quando os agentes usam ferramentas de bash, pois recebem o bloco específico de que precisam, e muitos outros blocos

00:03:20não entram na memória. Isso permite que eles fiquem alinhados e focados na informação exata

00:03:25sem se perderem em dados não relacionados. Essa ideia não é algo novo para você. Esse

00:03:30conceito já é usado no Claude Code e em todos os agentes de CLI, onde usam funções de bash para

00:03:36refinar os resultados usando correspondência de padrões. Já vínhamos usando o sistema de arquivos e

00:03:41as capacidades do Claude Code para fins de pesquisa em qualquer ideia que avaliamos. Geralmente passamos

00:03:46a ferramenta de software que encontramos por este pipeline, que contém várias fases com

00:03:51nossos critérios de avaliação pelos quais a pesquisa deve passar. Tudo isso é definido em um arquivo markdown

00:03:56contendo os requisitos e objetivos da ferramenta que estamos testando, como escrever o documento final,

00:04:01e todas as informações necessárias para cada fase. Também fornecemos ao Claude certos documentos como

00:04:06amostras, que servem de guia para o estilo, e o documento final é salvo em uma pasta de resultados de pesquisa.

00:04:11Para guiar a pesquisa, temos um arquivo Claude.md explicando como passar a ideia

00:04:17por cada fase, uma a uma, resultando em um documento de pesquisa que atende a todas as nossas verificações.

00:04:22Sempre que temos algo para pesquisar, eu vou ao Claude e digo a ideia ou a ferramenta a

00:04:27ser pesquisada. Ele então executa o processo de validação em seis fases, primeiro entendendo a

00:04:32ferramenta ou ideia e depois passando por cada fase individualmente. Quando a ideia passa por

00:04:37todas as fases, o Claude gera um relatório final que podemos ler para verificar se a ideia tem

00:04:42potencial ou não. Essa abordagem de sistema de arquivos nos poupa muito tempo ao automatizar um processo de pesquisa

00:04:47que, de outra forma, teríamos que fazer passo a passo. Se você quiser testar esse pipeline para o seu

00:04:52próprio caso de uso, pode obter um template pronto para criar seu próprio pipeline de pesquisa

00:04:57semelhante ao nosso em nossa comunidade recém-lançada, chamada AI Labs Pro. Para este e para todos os

00:05:03vídeos anteriores, você terá templates prontos, prompts, todos os comandos e habilidades que pode

00:05:08conectar diretamente aos seus projetos. Se você vê valor no que fazemos e quer apoiar o canal,

00:05:12essa é a melhor forma. Links na descrição. Eu estava analisando o estudo de caso deles,

00:05:17onde explicavam como construir um agente de resumo de vendas usando esta arquitetura. Eles também

00:05:22disponibilizaram o código, mas isso me deu uma ideia muito interessante que eu quis testar por

00:05:27conta própria. Eu estava criando um projeto de política da empresa com muitos dados em formato

00:05:32JSON, Markdown e TXT, todos separados por departamento. Normalmente, eu teria implementado

00:05:39esse sistema usando um banco de dados vetorial como o Chroma, mas decidi dar uma chance a essa ferramenta. Eu fui

00:05:44lá e implementei essa arquitetura. No back-end, incluí o caminho para a pasta de documentos

00:05:49contendo os dados da empresa e dei ao agente acesso aos comandos ls, cat, grep e find,

00:05:55além de um guia sobre como usar a ferramenta e quando usar cada comando. Usei o modelo Gemini 2.5 Flash,

00:06:01forneci a ferramenta de bash da Vercel e dei o caminho para os documentos dentro da ferramenta. E,

00:06:06assim, quando testei o agente fazendo qualquer pergunta relacionada aos dados, ele basicamente

00:06:11respondeu com base no conteúdo exato das políticas da empresa, incluindo o manual e

00:06:16documentos de política de folgas. Para verificar como estava funcionando, registrei o uso da ferramenta no terminal.

00:06:21O agente primeiro usou o comando ls para ver quais documentos estavam disponíveis e depois usou o grep com

00:06:27correspondência de padrões para procurar por folgas ou termos semelhantes. Esse conjunto de comandos resolveu nossa consulta e

00:06:32nos deu resultados com o mesmo nível de precisão que um sistema RAG daria. Se você quiser o código-fonte deste

00:06:38projeto, pode encontrá-lo em nossa comunidade para baixar e testar você mesmo.

00:06:43Agora, a primeira pergunta que me veio à mente ao analisar esta ferramenta foi:

00:06:47é realmente seguro equipar agentes para executar comandos no servidor? Nós vimos literalmente uma

00:06:52vulnerabilidade em React Server Components em dezembro passado que atingiu 10.0, a nota máxima na

00:06:57escala, e envolvia a execução de código no servidor. Então, essa é uma capacidade muito poderosa e potencialmente

00:07:03perigosa para se dar aos agentes. Então, por que eu confiei nesta ferramenta? É porque ela roda em

00:07:08um sandbox e possui isolamento. Ela acessa apenas o diretório específico que fornecemos. Ela não

00:07:14modifica nada além disso. No artigo, eles também mencionam que o agente explora os arquivos sem

00:07:19acesso ao sistema de produção, então seu código de produção permanece seguro mesmo se o agente tentar rodar

00:07:24comandos prejudiciais no servidor. Ela oferece dois tipos de isolamento. O primeiro é um ambiente

00:07:29em memória. Nesse setup, usa-se apenas a ferramenta de bash, que roda scripts apenas nos arquivos aos quais tem

00:07:35acesso, como fizemos ao criar nosso agente. O segundo tipo é um ambiente de sandbox totalmente

00:07:40compatível, oferecendo isolamento completo de máquina virtual usando o Vercel Sandbox. Podemos escolher

00:07:46qualquer um deles conforme nossas necessidades. A abordagem em memória é mais leve e rápida para casos simples,

00:07:51enquanto o isolamento total por VM é melhor quando você precisa de garantias de segurança mais fortes. Embora esta

00:07:56abordagem seja excelente para economizar custos por chamada de modelo, não é a solução ideal para todos os tipos

00:08:01de problemas. Definitivamente não é o ideal se você precisar buscar pelo significado das palavras, pois as ferramentas bash

00:08:06são para correspondência exata. Como vimos ao chamar nosso agente, ele usou palavras-chave específicas para localizar os

00:08:11dados necessários. Também não é adequado para estruturas de arquivos desorganizadas, onde o agente teria que

00:08:17se esforçar com múltiplas chamadas de ferramentas. Uma estrutura que o agente possa navegar facilmente é bem melhor. Minha

00:08:22sugestão pessoal é usar a ferramenta bash quando você tiver dados altamente estruturados e seus pedidos

00:08:27forem claros quanto ao que você deseja. Use RAG quando você se importar mais com o significado do que está

00:08:32escrito nos arquivos ou quando suas consultas puderem ser confusas. Antes de terminarmos, uma palavra do

00:08:37nosso patrocinador: Brilliant. Os melhores engenheiros não conhecem apenas a sintaxe. Eles decompõem problemas a partir

00:08:42de princípios fundamentais. É por isso que fizemos uma parceria com a Brilliant. A filosofia deles é que você aprende melhor

00:08:47colocando a mão na massa. Eles priorizam a resolução ativa de problemas para que você lide com conceitos em vez de apenas

00:08:52memorizar. Por exemplo, no curso deles chamado "Como a IA Funciona", você não apenas lê, você manipula a

00:08:57lógica real. Você terá contato com detalhes técnicos como calcular perdas no espaço de perda e

00:09:02visualizar interpolação, criando uma intuição profunda que você simplesmente não consegue em uma aula em vídeo. Através

00:09:07de seus cursos técnicos interativos, você obtém a maneira mais eficaz de realmente dominar os conceitos

00:09:12de que falamos. Você também terá 20% de desconto na assinatura premium anual, desbloqueando todo o catálogo

00:09:17de cursos de matemática, dados e CS, oferecendo um roteiro completo para se atualizar. Clique no link na descrição

00:09:22ou escaneie o código QR na tela para garantir seu teste gratuito de 30 dias. Isso nos traz ao fim

00:09:28deste vídeo. Se você quiser apoiar o canal e nos ajudar a continuar fazendo vídeos como este, você pode

00:09:32fazer isso usando o botão "Valeu demais" abaixo. Como sempre, obrigado por assistir e vejo você no próximo.

Key Takeaway

A Vercel demonstra que utilizar o sistema de arquivos e comandos bash nativos é uma alternativa mais precisa, barata e organizada do que bancos de dados vetoriais para alimentar contextos de agentes de IA.

Highlights

A filosofia Unix de que "tudo é um arquivo" é a base para reduzir custos de tokens em modelos de IA.
Agentes de IA são naturalmente bons em navegar em sistemas de arquivos devido ao seu treinamento massivo em código e scripts bash.
A Vercel lançou uma ferramenta de bash em código aberto para permitir que agentes explorem diretórios de forma eficiente.
Diferente da busca vetorial (RAG)

Timeline

A Filosofia Unix e a Redução de Custos de IA

O vídeo inicia abordando o problema do alto consumo de tokens em sistemas que integram modelos de IA via API. O narrador sugere que a solução não está em arquiteturas complexas, mas na antiga filosofia Unix de que tudo é um arquivo. Esta abordagem simplifica a interação entre o modelo e os dados, otimizando o pipeline de informação. Ao tratar dados como arquivos, é possível reduzir drasticamente os custos operacionais. O engenheiro da Vercel citado defende que essa lógica é a chave para a próxima geração de agentes.

Por que Modelos de Linguagem Entendem Arquivos

Nesta seção, explica-se que modelos de IA são excelentes em entender estruturas de diretórios porque foram treinados em vastas quantidades de código. Eles já possuem familiaridade nativa com comandos como ls, grep, find e cat para localizar informações. Quando um agente usa essas ferramentas, ele extrai apenas a "fatia" relevante do arquivo, mantendo a janela de contexto limpa e sem ruídos. Isso evita o desperdício de tokens com dados irrelevantes que o modelo não utilizaria de qualquer forma. A Vercel transformou essa lógica em uma ferramenta de bash de código aberto para facilitar essa exploração.

Sistemas de Arquivos vs. Busca Vetorial (RAG)

O palestrante compara o uso de sistemas de arquivos com os tradicionais bancos de dados vetoriais e busca semântica. Enquanto a busca vetorial foca em similaridade e pode retornar blocos de dados imprecisos, o sistema de arquivos oferece correspondência exata e preserva relações hierárquicas. Arquivos organizados em pastas mantêm a lógica do domínio de negócio sem a necessidade de "achatar" os dados. Isso garante que o agente receba apenas o valor específico necessário, evitando que ele se perca em informações não relacionadas. A precisão do grep acaba superando a incerteza estatística de alguns sistemas RAG em dados estruturados.

Aplicações Práticas e o Caso Claude Code

Esta parte detalha como o conceito já é aplicado em ferramentas como o Claude Code para automatizar fluxos de pesquisa. O processo é guiado por arquivos Markdown que definem fases de validação, critérios de avaliação e objetivos da pesquisa. O agente executa um pipeline de seis fases, movendo a ideia através de cada etapa até gerar um relatório final de potencial. Essa automação economiza um tempo considerável que seria gasto em processos manuais de análise. O uso de documentos de amostra ajuda a guiar o estilo e a precisão do resultado final gerado pela IA.

Implementação Prática e Segurança no Servidor

O narrador descreve sua própria experiência ao implementar essa arquitetura em um projeto de políticas de empresa com arquivos JSON e TXT. Ele utilizou o modelo Gemini 1.5 Flash junto com a ferramenta de bash da Vercel para substituir um banco de dados Chroma. O agente foi capaz de navegar pelas pastas usando ls e encontrar termos específicos com grep, entregando resultados tão precisos quanto um sistema RAG. O autor destaca que a configuração no back-end envolve apenas fornecer o caminho da pasta e as permissões de comando. O código-fonte desse experimento foi disponibilizado para a comunidade AI Labs Pro.

Segurança, Sandboxing e Conclusão

A seção final aborda a preocupação crítica com a segurança ao permitir que agentes executem comandos no servidor. O vídeo explica que a ferramenta da Vercel utiliza ambientes de sandbox e isolamento em memória ou via VM para evitar acesso ao sistema de produção. Apesar de eficiente, o método não é recomendado para buscas baseadas em significado semântico ou para diretórios totalmente desorganizados. A sugestão final é usar a ferramenta bash para dados estruturados e RAG para consultas ambíguas. O vídeo encerra com uma recomendação da plataforma Brilliant e um agradecimento aos apoiadores do canal.

Community Posts

Write about this video