A Camada de Memória que Faltava para Codificação com IA (Graphify)

Portuguêsالعربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Русский 中文

컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00Esta pode ser uma das formas mais insanas de dar vida à sua base de código.

00:00:04Se você usa o Claude Code ou o Cursor em um projeto real, acha que a parte difícil é escrever código.

00:00:09Bem, não é. A parte difícil é apenas entender o seu próprio repositório.

00:00:13Você faz uma pergunta e sua IA queima seus tokens só para descobrir o que está acontecendo.

00:00:18É lento, caro e, na metade do tempo, ainda é superficial.

00:00:22E se, em vez de enviar seu projeto todo de cada vez, você desse à IA um mapa dele?

00:00:27É exatamente isso que o Grafi faz, e ele pode reduzir o uso de tokens em mais de 70%.

00:00:32Deixe-me mostrar como tudo isso funciona.

00:00:34No momento, sua IA vê seu projeto assim. Apenas uma pilha de arquivos.

00:00:44Não há conexões reais. Não há estrutura. Não há memória.

00:00:48Então, toda vez que você faz uma pergunta, ela tem que reaprender tudo do zero.

00:00:53É por isso que as respostas parecem próximas, mas não totalmente certas.

00:00:56E sim, foi exatamente isso que Karpathy apontou no problema da "pasta bruta".

00:01:01O Grafi surgiu logo depois disso. Ele é mais uma camada de memória.

00:01:06Se você gosta de ferramentas e dicas de programação como esta, não se esqueça de se inscrever.

00:01:09Temos vídeos saindo o tempo todo.

00:01:11Certo, agora deixe-me mostrar. Eu tenho um pequeno repositório aqui. Diagrama de docs de código.

00:01:16Normalmente, eu teria que explicar tudo isso para a IA todas as vezes.

00:01:20Em vez disso, eu executo um comando, Grafi, bem aqui. Espere um segundo. Agora olhe para isto.

00:01:27Depois que o Claude executa o Grafi, isso não são apenas arquivos. É um gráfico real.

00:01:33Tudo está conectado. Eu posso clicar e dissecar exatamente o que está acontecendo

00:01:38e o que está vinculado aqui dentro do arquivo HTML que ele gerou.

00:01:42Então, em vez de pedir à IA para ler tudo de novo, posso perguntar o que se conecta à camada de API.

00:01:50E agora ela responde usando relações, usando o arquivo MD que gerou com essa chamada.

00:01:56Não são palpites, são relações. E aqui está a parte que me surpreendeu.

00:02:00Antes disso, cerca de 14.000 tokens, ok, seja lá quantos foram usados.

00:02:04Depois disso, após a primeira execução, caímos para talvez algumas centenas.

00:02:09A mesma pergunta, custo completamente diferente. Tudo por causa deste mapa gerado.

00:02:14Então, o que isso está fazendo na verdade? O Grafi é basicamente como o Google Maps para sua base de código.

00:02:20Em vez de texto bruto, você obtém nós e conexões.

00:02:24Por baixo de tudo, ele usa tree-sitters para entender a estrutura e um LLM para extrair o significado.

00:02:30Então ele agrupa tudo em clusters, e não é apenas código.

00:02:35Ele lê PDFs, diagramas e até áudio e vídeo. Tudo localmente, nada sai da máquina.

00:02:41O que você ganha com isso é simples. Temos um gráfico visual, um relatório escrito

00:02:46e uma base de conhecimento que podemos realmente explorar.

00:02:49Este gráfico visual é enorme para muitos de nós, pois podemos ver como as coisas se conectam.

00:02:54Agora, aqui é onde isso muda como a codificação com IA costuma funcionar.

00:02:57A maioria das ferramentas usa RAG, o que basicamente significa encontrar trechos de texto semelhantes.

00:03:03Bem, o Grafi não faz isso. Ele constrói relacionamentos reais.

00:03:07Esta função chama aquela. Este módulo depende daquele.

00:03:11Esta ideia veio deste documento, e ele até diz o quão confiante está.

00:03:16Então, em vez de "isso parece relacionado", temos algo como "isso está realmente conectado"

00:03:21em uma representação visual real do que está vinculado.

00:03:24E a maior diferença aqui: ele também se lembra, já que gerou aquele arquivo MD

00:03:30que ele pode consultar. Não estamos começando do zero todas as vezes.

00:03:33Ele atualiza apenas o que mudou, então sua IA finalmente tem um contexto que permanece.

00:03:38Tudo bem, eu achei tudo isso muito legal.

00:03:42Mas quais são os pontos positivos e negativos aqui e agora?

00:03:44Primeiro de tudo, a eficiência se acumula.

00:03:47Cada pergunta fica mais barata. E como ele conecta código,

00:03:51documentos e diagramas, você começa a achar relações que nem sabia que existiam.

00:03:56Isso é enorme para o onboarding nesses projetos bagunçados em que somos jogados.

00:04:00Isso é ótimo. Agora, as desvantagens de tudo isso são estas.

00:04:03A primeira execução pode ser lenta e custar tokens, especialmente com muitos documentos.

00:04:08Depois disso, fica em cache. Mas sim, esse impacto inicial é real.

00:04:12Também está no início, então o suporte de longo prazo ainda é algo incerto e pequeno.

00:04:17Quando você for instalar, é Grafyy com dois Ys, não um.

00:04:20Portanto, verifique a ortografia. As relações nem sempre são perfeitas,

00:04:23mas ele as rotula claramente: extraída, inferida, ambígua,

00:04:28para que você saiba no que pode realmente confiar. E se seu repositório for minúsculo,

00:04:32isso será um pouco de exagero. Então, vale a pena?

00:04:35Digo, sim, se você estiver usando IA em algo real, isso é bacana.

00:04:38Eu achei que valia a pena. Porque seu maior problema não é rodar o código,

00:04:42é realmente entendê-lo entre arquivos, no tempo e no contexto.

00:04:46E é exatamente isso que isto resolve. A economia de tokens por si só já faz valer a tentativa,

00:04:51mas a maior vitória é esta: sua IA para de adivinhar e começa a raciocinar.

00:04:56Se você trabalha solo, faz pesquisa ou lida com grandes sistemas, este é um upgrade sério.

00:05:01Se você estiver apenas trabalhando em scripts menores, provavelmente é exagero,

00:05:04então você não precisa testar. Mas para a maioria dos devs que testarem,

00:05:07esta será uma ferramenta incrível. Se você gosta de ferramentas de código e dicas

00:05:10que aceleram seu fluxo de trabalho, não deixe de se inscrever no canal Better Stack.

00:05:14Nos vemos em outro vídeo.

Key Takeaway

O Graphify elimina a necessidade de reprocessar o repositório inteiro a cada consulta ao criar uma camada de memória persistente baseada em grafos que reduz o custo de tokens em 70%.

Highlights

O Graphify reduz o consumo de tokens em mais de 70% ao substituir o envio de arquivos brutos por um mapa estruturado do código.
A ferramenta utiliza tree-sitters para entender a estrutura sintática e um modelo de linguagem para extrair o significado semântico dos arquivos.
Diferente do RAG tradicional que busca trechos por similaridade, o Graphify constrói grafos de relacionamentos reais entre funções, módulos e documentos.
O sistema processa localmente múltiplos formatos de mídia, incluindo código, PDFs, diagramas, áudio e vídeo, sem enviar dados para fora da máquina.
Uma consulta que consumia 14.000 tokens pode cair para algumas centenas após a geração e o cache do mapa de contexto.
As relações identificadas são classificadas em categorias claras como extraída, inferida ou ambígua para indicar o nível de confiabilidade.

Timeline

O gargalo do entendimento de código por IA

A dificuldade real no desenvolvimento com IA reside na compreensão da estrutura do repositório em vez da escrita de código isolada.
Enviar projetos como pilhas de arquivos brutos resulta em respostas superficiais e desperdício de tokens.
Ferramentas como Claude Code e Cursor perdem eficiência ao reaprender o contexto do zero em cada interação.

Modelos de linguagem frequentemente falham ao lidar com a chamada "pasta bruta", onde a falta de conexões estruturais impede uma análise profunda. Esse processo consome recursos excessivos porque a IA tenta reconstruir mentalmente o projeto toda vez que recebe uma nova pergunta. A solução reside em fornecer um mapa pré-processado em vez de apenas dados não estruturados.

Funcionamento técnico e mapeamento de relações

O Graphify atua como uma camada de memória que transforma arquivos em um grafo interativo de nós e conexões.
A extração de significado ocorre localmente através de tree-sitters e processamento de múltiplos tipos de arquivos como MD e HTML.
A ferramenta substitui suposições por relacionamentos concretos entre a camada de API e outros componentes do sistema.

Ao executar o comando, o sistema gera um arquivo Markdown que serve como base de conhecimento para a IA. Isso permite que o desenvolvedor clique e disseque componentes específicos, como arquivos HTML ou rotas de API, vendo exatamente o que está vinculado. A análise local garante que PDFs, diagramas e até arquivos de áudio sejam integrados à base de conhecimento sem comprometer a privacidade dos dados.

Diferenças entre Graphify e RAG tradicional

O Graphify foca em relacionamentos lógicos de dependência em vez de apenas buscar trechos de texto semanticamente semelhantes.
O sistema mantém a memória persistente atualizando apenas as partes do código que sofreram alterações recentes.
A representação visual permite identificar quais funções chamam outras e quais módulos dependem de documentos específicos.

Enquanto o Retrieval-Augmented Generation (RAG) comum foca em similaridade de texto, esta abordagem prioriza a arquitetura do software. O sistema quantifica o nível de confiança nas conexões encontradas, oferecendo uma visão técnica precisa. Por gerar arquivos de referência que permanecem no contexto da IA, não há necessidade de reiniciar o processo de compreensão a cada nova mensagem no chat.

Análise de viabilidade e eficiência

O uso recorrente da ferramenta torna cada pergunta progressivamente mais barata devido ao sistema de cache.
A primeira execução demanda um investimento inicial maior de tempo e tokens para o mapeamento completo do repositório.
O benefício é máximo em sistemas complexos e grandes bases de código, sendo desnecessário para scripts simples ou projetos pequenos.

A eficiência acumulada é um dos principais pontos positivos para desenvolvedores que lidam com onboarding em projetos legados ou sistemas desorganizados. No entanto, é necessário atentar para a grafia correta do nome da ferramenta (Graphify com dois 'y') e para o fato de que as relações inferidas podem nem sempre ser perfeitas. O ganho final reside na transição da IA de um estado de adivinhação para um estado de raciocínio baseado em fatos estruturais.

Community Posts

Write about this video