Log in to leave a comment
No posts yet
Das Beängstigendste am Einstieg in das agentenbasierte Coding ist nicht die Performance, sondern die Kreditkartenabrechnung des nächsten Monats. Die Dual-Agenten-Systeme, die man in Videos sieht, sind fantastisch, aber wer sie unbedacht einsetzt, riskiert eine API-Kostenexplosion. Im Jahr 2026 liegt der Eingangspreis für Claude 4.6 Opus bei 3.00). Die Ausgabekosten schießen bis auf $25.00 hoch. Bei einem Legacy-Projekt mit über 100.000 Token kostet jeder Schleifendurchlauf quasi so viel wie eine Tasse Kaffee.
Um die Kosten unter Kontrolle zu halten, sollten Sie nicht stur nur auf Opus setzen, sondern eine Slot-Zuweisungsmethode verwenden. Setzen Sie Opus nur für die 20 % der Aufgaben ein, die Design- und Architektur-Entscheidungen betreffen, und überlassen Sie die restlichen 80 % der einfachen Implementierung Sonnet.
--model opus hoch. Machen Sie es sich zur Gewohnheit, jeden Montagmorgen den API-Report zu prüfen, um zu sehen, ob die tatsächlichen Ausgaben der Prognosekurve entsprechen.Tatsächlich werden 70 % der von Agenten verbrauchten Token damit verschwendet, unnötige Dateien zu durchsuchen und Verzeichnisse zu explorieren. LLMs zeigen einen rapiden Leistungsabfall (Performance Cliff), sobald der Kontext 100.000 Token überschreitet. Den gesamten Quellcode einfach hineinzukippen, ist der schnellste Weg, Geld zu verbrennen und die Performance zu ruinieren. Interne Testergebnisse von Anthropic zeigen, dass die Qualität der Schlussfolgerungen erhalten bleibt, während die Eingangskosten um über 50 % sinken, wenn der Kontext komprimiert übermittelt wird.
Erstellen Sie eine ARCH.md als KI-spezifische Spezifikation, um dem Agenten eine Landkarte an die Hand zu geben.
tree -L 3 -I 'node_modules|dist|.git' > tree.md. Verwenden Sie dann Tools wie Repomix, um eine Signature-Map zu erstellen, die die eigentliche Logik weglässt und nur Funktionssignaturen sowie Interface-Definitionen beibehält. Tragen Sie schließlich Assets wie .svg oder .json explizit in die .claudeignore-Datei ein, um sie aus dem Sichtfeld des Agenten zu entfernen.Der Kern eines Dual-Agenten-Systems besteht darin, Design (Advisor) und Implementierung (Executor) zu trennen, um Sicherheitsmechanismen zu schaffen. Wenn Sie einfach nur sagen "Reviewe den Code", erhalten Sie oft nur seelenlose Antworten wie "Sieht gut aus". Als Senior Engineer müssen Sie dem Advisor zwingend die Rolle eines griesgrämigen Kritikers zuweisen. Wenn Sie diesen Schritt konsequent durchführen, lässt sich die Zeit für nachträgliche Bugfixes, die oft mehr als 5 Stunden pro Woche in Anspruch nimmt, massiv reduzieren.
Bevor das ausführende Modell den Code anfasst, sollten Sie einen Mechanismus für ein kritisches Review durch Opus vorschalten.
Wenn Advisor und Executor hintereinander geschaltet sind, entstehen bei jeder Validierung Wartezeiten. Bei groß angelegten Refactorings, die Hunderte von Dateien betreffen, ist dieser Ansatz zu langsam. Wenn Sie Bibliotheken mit mehr als 50.000 Zeilen migrieren, benötigen Sie eine Orchestrierung, die Aufgaben aufteilt und parallel verarbeitet.
Ein paralleler Prozess zur Beschleunigung sieht wie folgt aus:
git worktree add unabhängige Verzeichnisse für verschiedene Features. Starten Sie in jedem Worktree eine separate Claude-Code-Sitzung, um unterschiedliche Module gleichzeitig zu refactoren. Führen Sie diese am Ende mit Tools wie Clash in den Main-Branch zusammen, um Konflikte zwischen den Worktrees zu lösen.Wenn sich von der KI geschriebener Code ansammelt, entstehen irgendwann technische Schulden, die die Gesamtstruktur ruinieren. Agenten können eine einzelne Datei hervorragend fixieren, übernehmen aber keine Verantwortung für die strategische Richtung des gesamten Systems. Die wahre Aufgabe eines Senior Engineers im Jahr 2026 besteht nicht darin, Code selbst zu tippen, sondern den Ordnungszustand der von Agenten erstellten Ergebnisse zu verwalten.
Führen Sie jeden Freitag vor Feierabend eine "Architektur-Audit"-Routine durch.