A Camada de Memória que Faltava para Codificação com IA (Graphify)

BBetter Stack
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00Esta pode ser uma das formas mais insanas de dar vida à sua base de código.
00:00:04Se você usa o Claude Code ou o Cursor em um projeto real, acha que a parte difícil é escrever código.
00:00:09Bem, não é. A parte difícil é apenas entender o seu próprio repositório.
00:00:13Você faz uma pergunta e sua IA queima seus tokens só para descobrir o que está acontecendo.
00:00:18É lento, caro e, na metade do tempo, ainda é superficial.
00:00:22E se, em vez de enviar seu projeto todo de cada vez, você desse à IA um mapa dele?
00:00:27É exatamente isso que o Grafi faz, e ele pode reduzir o uso de tokens em mais de 70%.
00:00:32Deixe-me mostrar como tudo isso funciona.
00:00:34No momento, sua IA vê seu projeto assim. Apenas uma pilha de arquivos.
00:00:44Não há conexões reais. Não há estrutura. Não há memória.
00:00:48Então, toda vez que você faz uma pergunta, ela tem que reaprender tudo do zero.
00:00:53É por isso que as respostas parecem próximas, mas não totalmente certas.
00:00:56E sim, foi exatamente isso que Karpathy apontou no problema da "pasta bruta".
00:01:01O Grafi surgiu logo depois disso. Ele é mais uma camada de memória.
00:01:06Se você gosta de ferramentas e dicas de programação como esta, não se esqueça de se inscrever.
00:01:09Temos vídeos saindo o tempo todo.
00:01:11Certo, agora deixe-me mostrar. Eu tenho um pequeno repositório aqui. Diagrama de docs de código.
00:01:16Normalmente, eu teria que explicar tudo isso para a IA todas as vezes.
00:01:20Em vez disso, eu executo um comando, Grafi, bem aqui. Espere um segundo. Agora olhe para isto.
00:01:27Depois que o Claude executa o Grafi, isso não são apenas arquivos. É um gráfico real.
00:01:33Tudo está conectado. Eu posso clicar e dissecar exatamente o que está acontecendo
00:01:38e o que está vinculado aqui dentro do arquivo HTML que ele gerou.
00:01:42Então, em vez de pedir à IA para ler tudo de novo, posso perguntar o que se conecta à camada de API.
00:01:50E agora ela responde usando relações, usando o arquivo MD que gerou com essa chamada.
00:01:56Não são palpites, são relações. E aqui está a parte que me surpreendeu.
00:02:00Antes disso, cerca de 14.000 tokens, ok, seja lá quantos foram usados.
00:02:04Depois disso, após a primeira execução, caímos para talvez algumas centenas.
00:02:09A mesma pergunta, custo completamente diferente. Tudo por causa deste mapa gerado.
00:02:14Então, o que isso está fazendo na verdade? O Grafi é basicamente como o Google Maps para sua base de código.
00:02:20Em vez de texto bruto, você obtém nós e conexões.
00:02:24Por baixo de tudo, ele usa tree-sitters para entender a estrutura e um LLM para extrair o significado.
00:02:30Então ele agrupa tudo em clusters, e não é apenas código.
00:02:35Ele lê PDFs, diagramas e até áudio e vídeo. Tudo localmente, nada sai da máquina.
00:02:41O que você ganha com isso é simples. Temos um gráfico visual, um relatório escrito
00:02:46e uma base de conhecimento que podemos realmente explorar.
00:02:49Este gráfico visual é enorme para muitos de nós, pois podemos ver como as coisas se conectam.
00:02:54Agora, aqui é onde isso muda como a codificação com IA costuma funcionar.
00:02:57A maioria das ferramentas usa RAG, o que basicamente significa encontrar trechos de texto semelhantes.
00:03:03Bem, o Grafi não faz isso. Ele constrói relacionamentos reais.
00:03:07Esta função chama aquela. Este módulo depende daquele.
00:03:11Esta ideia veio deste documento, e ele até diz o quão confiante está.
00:03:16Então, em vez de "isso parece relacionado", temos algo como "isso está realmente conectado"
00:03:21em uma representação visual real do que está vinculado.
00:03:24E a maior diferença aqui: ele também se lembra, já que gerou aquele arquivo MD
00:03:30que ele pode consultar. Não estamos começando do zero todas as vezes.
00:03:33Ele atualiza apenas o que mudou, então sua IA finalmente tem um contexto que permanece.
00:03:38Tudo bem, eu achei tudo isso muito legal.
00:03:42Mas quais são os pontos positivos e negativos aqui e agora?
00:03:44Primeiro de tudo, a eficiência se acumula.
00:03:47Cada pergunta fica mais barata. E como ele conecta código,
00:03:51documentos e diagramas, você começa a achar relações que nem sabia que existiam.
00:03:56Isso é enorme para o onboarding nesses projetos bagunçados em que somos jogados.
00:04:00Isso é ótimo. Agora, as desvantagens de tudo isso são estas.
00:04:03A primeira execução pode ser lenta e custar tokens, especialmente com muitos documentos.
00:04:08Depois disso, fica em cache. Mas sim, esse impacto inicial é real.
00:04:12Também está no início, então o suporte de longo prazo ainda é algo incerto e pequeno.
00:04:17Quando você for instalar, é Grafyy com dois Ys, não um.
00:04:20Portanto, verifique a ortografia. As relações nem sempre são perfeitas,
00:04:23mas ele as rotula claramente: extraída, inferida, ambígua,
00:04:28para que você saiba no que pode realmente confiar. E se seu repositório for minúsculo,
00:04:32isso será um pouco de exagero. Então, vale a pena?
00:04:35Digo, sim, se você estiver usando IA em algo real, isso é bacana.
00:04:38Eu achei que valia a pena. Porque seu maior problema não é rodar o código,
00:04:42é realmente entendê-lo entre arquivos, no tempo e no contexto.
00:04:46E é exatamente isso que isto resolve. A economia de tokens por si só já faz valer a tentativa,
00:04:51mas a maior vitória é esta: sua IA para de adivinhar e começa a raciocinar.
00:04:56Se você trabalha solo, faz pesquisa ou lida com grandes sistemas, este é um upgrade sério.
00:05:01Se você estiver apenas trabalhando em scripts menores, provavelmente é exagero,
00:05:04então você não precisa testar. Mas para a maioria dos devs que testarem,
00:05:07esta será uma ferramenta incrível. Se você gosta de ferramentas de código e dicas
00:05:10que aceleram seu fluxo de trabalho, não deixe de se inscrever no canal Better Stack.
00:05:14Nos vemos em outro vídeo.

Key Takeaway

O Graphify elimina a necessidade de reprocessar o repositório inteiro a cada consulta ao criar uma camada de memória persistente baseada em grafos que reduz o custo de tokens em 70%.

Highlights

  • O Graphify reduz o consumo de tokens em mais de 70% ao substituir o envio de arquivos brutos por um mapa estruturado do código.

  • A ferramenta utiliza tree-sitters para entender a estrutura sintática e um modelo de linguagem para extrair o significado semântico dos arquivos.

  • Diferente do RAG tradicional que busca trechos por similaridade, o Graphify constrói grafos de relacionamentos reais entre funções, módulos e documentos.

  • O sistema processa localmente múltiplos formatos de mídia, incluindo código, PDFs, diagramas, áudio e vídeo, sem enviar dados para fora da máquina.

  • Uma consulta que consumia 14.000 tokens pode cair para algumas centenas após a geração e o cache do mapa de contexto.

  • As relações identificadas são classificadas em categorias claras como extraída, inferida ou ambígua para indicar o nível de confiabilidade.

Timeline

O gargalo do entendimento de código por IA

  • A dificuldade real no desenvolvimento com IA reside na compreensão da estrutura do repositório em vez da escrita de código isolada.
  • Enviar projetos como pilhas de arquivos brutos resulta em respostas superficiais e desperdício de tokens.
  • Ferramentas como Claude Code e Cursor perdem eficiência ao reaprender o contexto do zero em cada interação.

Modelos de linguagem frequentemente falham ao lidar com a chamada "pasta bruta", onde a falta de conexões estruturais impede uma análise profunda. Esse processo consome recursos excessivos porque a IA tenta reconstruir mentalmente o projeto toda vez que recebe uma nova pergunta. A solução reside em fornecer um mapa pré-processado em vez de apenas dados não estruturados.

Funcionamento técnico e mapeamento de relações

  • O Graphify atua como uma camada de memória que transforma arquivos em um grafo interativo de nós e conexões.
  • A extração de significado ocorre localmente através de tree-sitters e processamento de múltiplos tipos de arquivos como MD e HTML.
  • A ferramenta substitui suposições por relacionamentos concretos entre a camada de API e outros componentes do sistema.

Ao executar o comando, o sistema gera um arquivo Markdown que serve como base de conhecimento para a IA. Isso permite que o desenvolvedor clique e disseque componentes específicos, como arquivos HTML ou rotas de API, vendo exatamente o que está vinculado. A análise local garante que PDFs, diagramas e até arquivos de áudio sejam integrados à base de conhecimento sem comprometer a privacidade dos dados.

Diferenças entre Graphify e RAG tradicional

  • O Graphify foca em relacionamentos lógicos de dependência em vez de apenas buscar trechos de texto semanticamente semelhantes.
  • O sistema mantém a memória persistente atualizando apenas as partes do código que sofreram alterações recentes.
  • A representação visual permite identificar quais funções chamam outras e quais módulos dependem de documentos específicos.

Enquanto o Retrieval-Augmented Generation (RAG) comum foca em similaridade de texto, esta abordagem prioriza a arquitetura do software. O sistema quantifica o nível de confiança nas conexões encontradas, oferecendo uma visão técnica precisa. Por gerar arquivos de referência que permanecem no contexto da IA, não há necessidade de reiniciar o processo de compreensão a cada nova mensagem no chat.

Análise de viabilidade e eficiência

  • O uso recorrente da ferramenta torna cada pergunta progressivamente mais barata devido ao sistema de cache.
  • A primeira execução demanda um investimento inicial maior de tempo e tokens para o mapeamento completo do repositório.
  • O benefício é máximo em sistemas complexos e grandes bases de código, sendo desnecessário para scripts simples ou projetos pequenos.

A eficiência acumulada é um dos principais pontos positivos para desenvolvedores que lidam com onboarding em projetos legados ou sistemas desorganizados. No entanto, é necessário atentar para a grafia correta do nome da ferramenta (Graphify com dois 'y') e para o fato de que as relações inferidas podem nem sempre ser perfeitas. O ganho final reside na transição da IA de um estado de adivinhação para um estado de raciocínio baseado em fatos estruturais.

Community Posts

View all posts