Die fehlende Memory-Ebene für KI-Coding (Graphify)

BBetter Stack
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00Dies könnte einer der verrücktesten Wege sein, Ihre Codebasis zum Leben zu erwecken.
00:00:04Wenn Sie Claude Code oder Cursor in einem echten Projekt nutzen, denken Sie, das Coden sei schwer.
00:00:09Ist es nicht. Der schwierige Teil ist, das eigene Repo überhaupt zu verstehen.
00:00:13Sie stellen eine Frage, und Ihre KI verbraucht Unmengen an Token, nur um zu kapieren, was los ist.
00:00:18Es ist langsam, teuer und die Hälfte der Zeit immer noch unfertig.
00:00:22Was wäre, wenn Sie der KI eine Karte geben würden, statt jedes Mal das ganze Projekt zu senden?
00:00:27Genau das macht Grafi, und es kann den Token-Verbrauch um über 70 % senken.
00:00:32Ich zeige Ihnen jetzt, wie das Ganze funktioniert.
00:00:34Im Moment sieht Ihre KI Ihr Projekt so: Einfach nur ein Haufen Dateien.
00:00:44Es gibt keine echten Verbindungen, keine Struktur und kein Gedächtnis.
00:00:48Bei jeder Frage muss sie also alles wieder von Grund auf neu lernen.
00:00:53Deshalb fühlen sich die Antworten zwar nah dran, aber nicht ganz richtig an.
00:00:56Und ja, genau das hat Karpathy mit dem Problem des "rohen Ordners" aufgezeigt.
00:01:01Grafi tauchte direkt danach auf. Es ist eher eine Art Gedächtnisschicht.
00:01:06Wenn Ihnen solche Coding-Tools und Tipps gefallen, sollten Sie unbedingt abonnieren.
00:01:09Wir veröffentlichen ständig neue Videos.
00:01:11Alles klar, schauen wir mal. Ich habe hier ein kleines Repo mit Code, Docs und Diagramm.
00:01:16Normalerweise müsste ich der KI das alles jedes Mal aufs Neue erklären.
00:01:20Stattdessen führe ich hier einen Befehl aus: Grafi. Einen Moment... Sehen Sie sich das an.
00:01:27Nachdem Claude Grafi ausgeführt hat, sind das nicht mehr nur Dateien. Es ist ein echter Graph.
00:01:33Alles ist vernetzt. Ich kann anklicken und sezieren, was genau vor sich geht
00:01:38und was hier innerhalb der generierten HTML-Datei miteinander verknüpft ist.
00:01:42Statt die KI alles neu lesen zu lassen, frage ich sie nun, was mit der API-Schicht verbunden ist.
00:01:50Sie antwortet nun basierend auf Beziehungen und der MD-Datei, die bei diesem Aufruf erstellt wurde.
00:01:56Es sind keine Vermutungen, sondern Zusammenhänge. Und hier ist der Teil, der mich überrascht hat:
00:02:00Davor waren es etwa 14.000 Token, okay, wie viele auch immer verbraucht wurden.
00:02:04Danach, nach der ersten Ausführung, sinkt das auf vielleicht ein paar Hundert.
00:02:09Gleiche Frage, völlig andere Kosten. Alles nur wegen dieser generierten Karte.
00:02:14Was passiert hier also wirklich? Grafi ist im Grunde wie Google Maps für Ihren Code.
00:02:20Statt purem Text erhalten Sie Knoten und Verbindungen.
00:02:24Im Hintergrund nutzt es Tree-Sitter für die Struktur und ein LLM für die Bedeutung.
00:02:30Dann gruppiert es alles in Cluster, und das nicht nur bei Code.
00:02:35Es liest PDFs, Diagramme, sogar Audio und Video. Alles lokal, nichts verlässt den Rechner.
00:02:41Das Ergebnis ist simpel: Wir erhalten einen visuellen Graphen, einen schriftlichen Bericht
00:02:46und eine Wissensdatenbank, die wir tatsächlich erkunden können.
00:02:49Dieser visuelle Graph ist für viele von uns enorm hilfreich, um Zusammenhänge zu sehen.
00:02:54Hier ändert sich nun, wie KI-gestütztes Coden normalerweise abläuft.
00:02:57Die meisten Tools nutzen RAG, was im Grunde heißt: Finde ähnliche Textabschnitte.
00:03:03Grafi macht das nicht. Es baut echte Beziehungen auf.
00:03:07Diese Funktion ruft jene auf. Dieses Modul hängt von diesem ab.
00:03:11Diese Idee stammt aus jenem Dokument, und es zeigt sogar das Vertrauenslevel an.
00:03:16Statt "das sieht verwandt aus" bekommen wir: "Das ist tatsächlich verbunden"
00:03:21in einer echten visuellen Darstellung der Verknüpfungen.
00:03:24Und der größte Unterschied: Es merkt sich Dinge. Dank der generierten MD-Datei
00:03:30kann es darauf zurückgreifen. Wir fangen nicht jedes Mal bei Null an.
00:03:33Es aktualisiert nur Geändertes, sodass Ihre KI endlich Kontext hat, der bleibt.
00:03:38Alles klar, ich fand das alles schon ziemlich genial.
00:03:42Aber was sind die Vor- und Nachteile im Hier und Jetzt?
00:03:44Zuerst einmal: Die Effizienz potenziert sich.
00:03:47Jede Frage wird billiger. Und da es Code, Docs und Diagramme verknüpft,
00:03:51entdecken Sie Beziehungen, von denen Sie gar nicht wussten, dass sie existieren.
00:03:56Das ist Gold wert beim Onboarding für unübersichtliche Projekte, die man vorgesetzt bekommt.
00:04:00Das ist super. Kommen wir nun zu den Nachteilen.
00:04:03Der erste Durchlauf kann langsam sein und Token kosten, besonders bei vielen Dokumenten.
00:04:08Danach ist es gecached, aber ja, der erste Aufwand ist spürbar.
00:04:12Es ist auch noch in einem frühen Stadium, Langzeitsupport ist also noch ein kleines Fragezeichen.
00:04:17Bei der Installation: Es schreibt sich "Grafyy" mit zwei Y.
00:04:20Achten Sie also auf die Schreibweise. Die Beziehungen sind nicht immer perfekt,
00:04:23aber sie werden klar markiert: Extrahiert, abgeleitet, mehrdeutig,
00:04:28damit Sie wissen, was Sie wirklich trauen können. Und falls Ihr Repo winzig ist,
00:04:32wäre das Ganze wohl etwas Overkill. Lohnt es sich also?
00:04:35Ich meine, ja. Wenn Sie KI für echte Projekte nutzen, ist das cool.
00:04:38Ich fand, es lohnt sich. Denn das größte Problem ist nicht das Ausführen des Codes,
00:04:42sondern ihn über Dateien, Zeit und Kontexte hinweg wirklich zu verstehen.
00:04:46Genau das löst dieses Tool. Allein die Token-Ersparnis macht den Versuch wert,
00:04:51aber der größere Gewinn ist: Ihre KI hört auf zu raten und fängt an zu schlussfolgern.
00:04:56Für Einzelkämpfer, Forscher oder bei großen Systemen ist das ein echtes Upgrade.
00:05:01Wenn Sie nur an kleinen Skripten arbeiten, ist es wahrscheinlich Overkill
00:05:04und Sie brauchen es nicht wirklich. Aber für die meisten Entwickler,
00:05:07wird dies ein fantastisches Werkzeug sein. Wenn Ihnen Coding-Tools und Tipps
00:05:10für einen schnelleren Workflow gefallen, abonnieren Sie den Better Stack Kanal.
00:05:14Wir sehen uns im nächsten Video.

Key Takeaway

Grafify löst das Problem des fehlenden Kontextes bei KI-Coding-Tools, indem es Codebasen in einen vernetzten Wissensgraphen umwandelt und so den Token-Verbrauch um über 70 % reduziert.

Highlights

  • Grafify senkt den Token-Verbrauch bei KI-gestützten Coding-Anfragen um über 70 % durch eine persistente Wissensdatenbank.

  • Das Tool nutzt Tree-Sitter für die strukturelle Analyse und ein Large Language Model für die semantische Bedeutung des Codes.

  • Ein typischer Token-Verbrauch sinkt nach der ersten Indexierung von 14.000 auf nur wenige Hundert Token pro Anfrage.

  • Das System verarbeitet neben Quellcode auch PDFs, Diagramme, Audio- und Videodateien vollständig lokal auf dem Rechner.

  • Die generierte Karte markiert die Qualität von Beziehungen explizit als extrahiert, abgeleitet oder mehrdeutig.

  • Grafify ersetzt herkömmliches RAG durch einen echten Wissensgraphen, der Funktionsaufrufe und Modulabhängigkeiten visuell darstellt.

Timeline

Das Problem der rohen Ordnerstruktur

  • KI-Modelle wie Claude oder Cursor betrachten Projekte standardmäßig als isolierte Dateisammlungen ohne tieferes Verständnis.
  • Das ständige Neulernen der Projektstruktur führt zu hohen Kosten und langsamen Antwortzeiten.
  • Ungenaue Antworten resultieren aus fehlenden Informationen über die tatsächlichen Verbindungen innerhalb des Repositories.

Herkömmliche Coding-Assistenten verbrauchen bei jeder Anfrage immense Mengen an Token, da sie den Kontext des gesamten Projekts immer wieder von Grund auf erfassen müssen. Dieser Prozess ist ineffizient und führt oft zu unvollständigen Ergebnissen. Die KI agiert ohne Gedächtnis und sieht lediglich Dateien, anstatt die zugrunde liegende Architektur zu begreifen.

Funktionsweise der Graphen-basierten Memory-Ebene

  • Grafify erstellt aus einfachen Dateien einen interaktiven Graphen mit echten logischen Verknüpfungen.
  • Die KI antwortet auf Basis einer generierten Markdown-Datei, die als Wissensbasis dient.
  • Die Kosten pro Anfrage sinken drastisch, da die Karte die notwendigen Informationen gezielt bereitstellt.

Nach der Ausführung des Grafify-Befehls verwandelt sich das Repository in ein visuelles Netzwerk. Nutzer können Zusammenhänge innerhalb generierter HTML-Dateien sezieren und gezielt nach Abhängigkeiten in der API-Schicht fragen. Anstatt auf Vermutungen basieren die Antworten nun auf expliziten Beziehungen, was den Token-Verbrauch von etwa 14.000 auf ein Minimum reduziert.

Technische Architektur und Datenverarbeitung

  • Tree-Sitter analysiert die Code-Struktur, während ein LLM die inhaltliche Bedeutung der Komponenten erfasst.
  • Die Verarbeitung erfolgt ausschließlich lokal, wodurch keine sensiblen Daten den Rechner verlassen.
  • Das System unterscheidet sich von klassischem RAG durch den Aufbau echter hierarchischer Beziehungen zwischen Modulen.

Grafify fungiert wie ein Navigationssystem für Code, indem es Informationen in Clustern gruppiert. Es integriert unterschiedliche Medientypen wie PDFs und Videos in die Wissensdatenbank und zeigt das Vertrauenslevel jeder Verbindung an. Änderungen am Code werden inkrementell aktualisiert, sodass der Kontext dauerhaft erhalten bleibt, ohne jedes Mal bei Null zu beginnen.

Analyse der Vor- und Nachteile in der Praxis

  • Die Effizienz des Workflows steigt mit jeder gestellten Frage durch das Caching der Informationen.
  • Der initiale Indexierungsprozess ist zeitaufwendig und verursacht einmalig höhere Token-Kosten.
  • Für kleine Skripte oder winzige Repositories ist der Einsatz des Tools unverhältnismäßig.

Das Tool ist besonders effektiv für das Onboarding in komplexe, unübersichtliche Projekte, da es verborgene Beziehungen zwischen Code und Dokumentation aufdeckt. Trotz des frühen Entwicklungsstadiums und möglicher Ungenauigkeiten in der automatischen Extraktion bietet die visuelle Darstellung einen großen Mehrwert. Während Einzelentwickler bei großen Systemen profitieren, bleibt das Werkzeug für Kleinstprojekte Overkill.

Community Posts

View all posts