Diese Fault-Loops fangen 90 % aller Coding-Fehler ab

AAI LABS
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00Was passiert eigentlich, wenn man einen KI-Coding-Agenten zwingt, Regeln zu befolgen?
00:00:03Wir alle kennen das Problem bei der Arbeit mit Claude und anderen Coding-Agenten.
00:00:07Sie neigen dazu, Anweisungen zu ignorieren und die Claude.md-Datei völlig außer Acht zu lassen.
00:00:11Selbst wenn wir TDD erzwingen wollten, versuchte der Agent einfach, die Testdateien selbst zu ändern.
00:00:15Dann stießen wir auf dieses Plugin, das gerade extrem populär wurde – 58.000 Sterne in nur 24 Stunden.
00:00:21Aber das zeigt nur, wie extrem der Hype-Zyklus bei KI-Tools aktuell ist.
00:00:25Dieses Plugin verspricht die strikte Durchsetzung von Softwareentwicklungsmethoden im Workflow.
00:00:30Die Frage war jedoch, ob es dieses Versprechen auch wirklich hält.
00:00:33Unser Team hat schon oft ähnliche Workflows gesehen, die sich am Ende als reiner Hype herausstellten.
00:00:37Also haben wir das Plugin in echten Workflows getestet, um zu sehen, ob es sich für reale Projekte lohnt.
00:00:43Superpowers ist ein Plugin, das traditionelle Entwicklungsmethoden direkt in deiner KI-IDE erzwingt.
00:00:50Einige denken vielleicht, dass Agile-Frameworks wie BMAD oder OpenSpec bereits dasselbe tun.
00:00:56Dieses hier ist jedoch anders, da es nicht nur ein Agentensystem zum Schreiben von Spezifikationen ist.
00:01:01Es erzwingt die agile Methodik direkt im Workflow mit strikten Gates, die den nächsten Schritt blockieren.
00:01:10Diese Gates sind explizite Checkpoints, die verhindern, dass Claude von den Anweisungen abweicht.
00:01:15Die Kernphilosophie dieses Plugins ist TDD und ein systematischer Prozess statt bloßem Raten.
00:01:20Es verifiziert alles, bevor ein Projektschritt als Erfolg gilt, und adressiert gezielt typische KI-Fehler.
00:01:28Der Prozess geht erst weiter, wenn der Nutzer explizit grünes Licht gibt.
00:01:32Kurz gesagt: Es nutzt Best Practices nativ, ohne dass man sie wie früher mühsam manuell einrichten muss.
00:01:40Das Plugin setzt auf echtes Red-Green-TDD und Prinzipien wie DRY und YAGNI.
00:01:50Es ist für alle gängigen KI-Plattformen verfügbar.
00:01:52Da unser Team Claude Code nutzt, haben wir den Marketplace-Befehl kopiert und das Plugin dort installiert.
00:02:02Nach der Installation und einem Neustart von Claude Code war Superpowers einsatzbereit.
00:02:08Wir gaben den Prompt, eine Projektmanagement-Software ähnlich wie Trello zu bauen.
00:02:15Es aktivierte selbstständig den Brainstorming-Skill und analysierte erst einmal alle Anforderungen.
00:02:24Es stellte viele Fragen zur Zielgruppe und zum Tech-Stack und wog potenzielle Probleme ab.
00:02:33Bei der Datenbankwahl warnte es etwa vor Sicherheitsproblemen unserer Wahl bei Server-Side-Zugriffen.
00:02:44Es klärte alle Details so lange, bis wir mit den Optionen wirklich zufrieden waren.
00:02:48Danach schlug es drei verschiedene Ansätze vor, von denen wir einen für die Umsetzung wählen mussten.
00:02:55Wir wählten unseren Favoriten aus und gaben direkt noch ein paar Änderungswünsche mit.
00:02:58Sobald das erledigt war, lieferte uns das Tool auch direkt das Architektur-Design.
00:03:02Als Nächstes folgte das UX-Design, inklusive der Handhabung der Boards.
00:03:06Zudem wurde die gesamte Projektstruktur noch einmal mit uns abgestimmt.
00:03:09Nach der Genehmigung wurde alles sauber in einem Dokumentationsordner abgelegt.
00:03:13Hier schlägt das Plugin andere Tools, da es Git-Befehle nutzt, um jeden Schritt automatisch zu committen.
00:03:22Nach dem Brainstorming wurde der Planungs-Skill aktiv, erstellte den Implementierungsplan und committete ihn.
00:03:29Der Plan unterteilte die große Anwendung in kleine, leicht umsetzbare Teilaufgaben.
00:03:33Man könnte meinen, dass Claudes integrierter Planungsmodus das ohnehin schon tut.
00:03:37Der Hauptunterschied ist jedoch, dass Claudes Standard-Planung eher eine lose Orientierungshilfe ist.
00:03:44Claude stellt dort nur notwendige Fragen und entscheidet Dinge wie UI-Libraries oft einfach selbst.
00:03:52Superpowers hingegen ist eine Erzwingung: Ohne Abschluss des aktuellen Schritts geht es nicht weiter.
00:04:01Nach der Planung wählten wir die sub-agenten-gesteuerte Implementierung als Methode aus.
00:04:09Claude startete Sub-Agenten, die für jeden Task automatisch einen eigenen Git-Worktree erstellten.
00:04:20Diese Isolation ist wichtig, damit sich die Agenten nicht gegenseitig die Arbeit überschreiben.
00:04:28Das ist eines der Kernfeatures, das das Plugin nativ im Hintergrund regelt.
00:04:31Sobald die Planung stand, ging Claude in die eigentliche Implementierungsphase über.
00:04:34Nach jedem Task wurde ein separater Review-Task gestartet, um alles gegen die Specs zu prüfen.
00:04:41Nach dem Commit kam ein weiteres Superpower-Feature zum Einsatz: der Code Reviewer.
00:04:46Erst wenn die Qualität bestätigt wurde, durfte der nächste Task starten oder es wurde nachgebessert.
00:04:54Am Ende fragte uns das System, ob es alles in den Main-Branch mergen oder ein PR erstellen soll.
00:05:04Wir entschieden uns für den schnellen Merge direkt in den Main-Branch.
00:05:06Es entfernte alle temporären Worktrees und committete das gesamte Projekt in den Hauptzweig.
00:05:11Dieser Prozess verbraucht viel Context-Window; eine Iteration fraß bei uns fast 50 % des Speichers.
00:05:24Das Ergebnis war ein einfaches Projekt mit den grundlegenden Funktionen.
00:05:27Wir wollten, dass die Listen nach Status sortiert sind: To Do, In Progress und Done.
00:05:32Zusätzlich zu den Karten sollten auch die gesamten Listen verschiebbar sein.
00:05:36Wir baten Claude Code darum, doch zuerst agierte es im Standardmodus ohne die Plugin-Skills.
00:05:42Wahrscheinlich lag das am hohen Kontextverbrauch; wir mussten es an das Plugin erinnern.
00:05:48Nach diesem Hinweis arbeitete es wieder nach dem gewohnten, strukturierten Prozess.
00:05:52Die Sub-Agenten in den Worktrees sind hier besonders stark, da sie nativ TDD anwenden.
00:06:02Diese Agenten schreiben für jedes zu implementierende Teil zuerst die entsprechenden Tests.
00:06:05Danach wurde sichergestellt, dass der Code die Tests besteht, ohne die Testfälle selbst zu manipulieren.
00:06:13Starke Prompt-Anweisungen verhinderten, dass Claude Ausreden erfand, um Schritte zu überspringen.
00:06:23Diese Anweisungen lauten etwa: “Nutze einen Skill selbst dann, wenn die Chance dafür nur bei 1 % liegt.”
00:06:29Das garantierte eine absolut strukturierte Durchführung jeder einzelnen Aufgabe.
00:06:32Allerdings arbeiten die Agenten sequenziell, was deutlich länger dauert als der native Claude-Modus.
00:06:41Dafür stellten die strikten Richtlinien sicher, dass die Anwendung am Ende exakt wie gewünscht funktionierte.
00:06:45Wie erwähnt, sinkt der freie Kontext schnell; nach wenigen Aufgaben waren nur noch 5 % übrig.
00:06:53Bevor wir weitermachten, nutzten wir den “Compact”-Befehl, um den Kontext für das Brainstorming zu leeren.
00:07:01Nach der Komprimierung gaben wir das nächste Feature in Auftrag und der Prozess startete erneut.
00:07:07Besonders gut: Es riet nicht einfach, sondern stellte viele gezielte Fragen zur Umsetzung.
00:07:17Es wurden selbst kleinste Details geklärt, wie das Design leerer Spalten – Dinge, die Claude sonst oft rät.
00:07:29Detaillierte Anleitungen zur optimalen Nutzung des Plugins findet ihr bei AI Labs Pro.
00:07:33Das ist unsere neue Community mit fertigen Templates, die ihr direkt in eure Projekte einbinden könnt.
00:07:42Wenn ihr unsere Arbeit unterstützen wollt, ist das der beste Weg. Den Link findet ihr in der Beschreibung.
00:07:48Eine weitere Stärke des Plugins ist das extrem systematische Debugging.
00:07:52Wir hatten einen Fehler beim Speichern nach einem Refresh und gaben Claude nur einen vagen Hinweis.
00:08:01Das Tool lud den Debugging-Skill, der die Arbeit in vier klare Phasen unterteilte.
00:08:06In Phase eins wurde die Ursache durch gezielte Rückfragen an uns ermittelt.
00:08:10Basierend auf unseren Antworten wurde die fehlerhafte Datei präzise lokalisiert.
00:08:16Phase zwei isolierte den Fehler, während Phase drei den exakten Grund für das Auftreten analysierte.
00:08:25In Phase vier wurde der Fix angewendet und das Ganze mit einem abschließenden Test bestätigt.
00:08:35Nicht jede Aufgabe braucht diesen vollen Workflow – etwa wenn man nur kurz das UI anpassen will.
00:08:47Niemand möchte 15 Minuten auf eine kleine Design-Änderung warten; dafür gibt es Abkürzungen.
00:08:51Wir baten um UI-Verbesserungen, aber nur um das Brainstorming und die Planung, nicht die Umsetzung.
00:09:01Claude fragte nach der visuellen Richtung und klärte verschiedene Designaspekte vorab.
00:09:08Nach der Planung stoppte Claude wie befohlen. Wir wiesen es dann an, dies ohne den starren Prozess umzusetzen.
00:09:15Das UI wurde so viel schneller angepasst, aber die Änderungen wurden trotzdem sauber in Git committet.
00:09:25Die App wechselte von einem minimalen Layout zu einem modernen Design mit Hover-Effekten.
00:09:32Genau das macht das Framework praxistauglich: Flexibilität für Einfaches und Strenge für Komplexes.
00:09:43Das war's für heute. Wenn ihr uns unterstützen wollt, nutzt gerne den Super-Thanks-Button unten.
00:09:51Danke fürs Zuschauen und bis zum nächsten Mal!

Key Takeaway

Das Superpowers-Plugin transformiert KI-Coding-Agenten von unzuverlässigen Assistenten zu disziplinierten Entwicklern, indem es bewährte Software-Methodiken durch technische Barrieren und strukturierte Workflows erzwingt.

Highlights

Das "Superpowers

Timeline

Einführung in die Problematik von KI-Coding-Agenten

Der Sprecher thematisiert das weitverbreitete Problem, dass KI-Agenten wie Claude oft Anweisungen ignorieren oder Testdateien eigenmächtig manipulieren. Als Lösung wird ein neues Plugin vorgestellt, das innerhalb von nur 24 Stunden 58.000 Sterne auf GitHub erreichte. Trotz des enormen Hypes hinterfragt das Team kritisch, ob das Tool die versprochene strikte Durchsetzung von Workflows in realen Projekten halten kann. Es wird betont, dass viele KI-Tools oft nur kurzlebige Trends sind, weshalb ein Praxistest unter echten Bedingungen durchgeführt wurde. Dieser Abschnitt legt den Grundstein für die Notwendigkeit von mehr Kontrolle im KI-gestützten Entwicklungsprozess.

Kernfunktionen und Philosophie von Superpowers

Das Plugin namens Superpowers wird als Werkzeug eingeführt, das agile Methoden wie TDD (Test-Driven Development) nativ in der IDE erzwingt. Im Gegensatz zu herkömmlichen Systemen nutzt es strikte "Gates", die den Fortschritt blockieren, bis der Nutzer explizit grünes Licht gibt. Die Kernphilosophie basiert auf systematischen Prozessen sowie den Prinzipien DRY (Don't Repeat Yourself) und YAGNI (You Ain't Gonna Need It). Damit adressiert das Tool gezielt typische KI-Fehlermuster wie das Raten von Lösungen statt systematischer Verifizierung. Es stellt sicher, dass Best Practices ohne mühsame manuelle Einrichtung direkt im Workflow verankert sind.

Installation und Projektstart am Beispiel einer Trello-Alternative

Nach der Demonstration der Installation für Claude Code startet das Team ein Testprojekt für eine Projektmanagement-Software. Das Tool aktiviert selbstständig einen Brainstorming-Skill, der Anforderungen analysiert und kritische Fragen zum Tech-Stack stellt. Besonders hervorzuheben ist die Warnung der KI vor Sicherheitsrisiken bei der Datenbankwahl, was die Tiefe der Analyse unterstreicht. Erst nach der Klärung aller Details und der Wahl eines von drei Architektur-Ansätzen wird die Projektstruktur erstellt. Alle Entwürfe und Dokumente werden automatisch mittels Git-Befehlen committet, was die Nachvollziehbarkeit erheblich steigert.

Strukturierte Planung und isolierte Implementierung

In dieser Phase wird der Unterschied zwischen Claudes Standard-Planung und der erzwungenen Planung durch das Plugin deutlich. Während Claude normalerweise UI-Entscheidungen oft willkürlich trifft, verlangt Superpowers den Abschluss jedes Teilschritts, bevor es weitergeht. Zur Implementierung werden Sub-Agenten in isolierten Git-Worktrees eingesetzt, um Code-Konflikte zu vermeiden. Ein integrierter Code-Reviewer prüft jeden Task gegen die Spezifikationen, bevor ein Merge in den Main-Branch erlaubt wird. Der Sprecher weist jedoch darauf hin, dass dieser komplexe Prozess das Context-Window der KI stark beansprucht, was bis zu 50 % des Speichers verbrauchen kann.

TDD-Erzwingung und Umgang mit Kontext-Limits

Das Team fügt weitere Funktionen wie die Sortierung von Aufgabenlisten hinzu und muss die KI explizit daran erinnern, die Plugin-Skills zu nutzen, da diese aufgrund des hohen Kontextverbrauchs in den Standardmodus zurückfiel. Die Sub-Agenten demonstrieren hier ihre Stärke durch echtes TDD, indem sie erst Tests schreiben und diese dann erfolgreich bestehen müssen. Starke Prompt-Anweisungen, wie die Nutzung eines Skills selbst bei geringer Erfolgswahrscheinlichkeit, garantieren eine absolut strukturierte Durchführung ohne Ausreden der KI. Da der freie Kontext schnell auf 5 % sinken kann, wird der "Compact"-Befehl genutzt, um den Speicher für neue Aufgaben zu leeren. Zusätzlich wird auf die AI Labs Pro Community für detaillierte Anleitungen und Templates verwiesen.

Systematisches Debugging und flexibles UI-Design

Der letzte Abschnitt beleuchtet den Debugging-Skill, der Fehler in vier klaren Phasen von der Ursachenermittlung bis zum finalen Test-Fix behebt. Es wird erklärt, dass nicht jede kleine Aufgabe den vollen, zeitintensiven Workflow benötigt, weshalb Abkürzungen für UI-Anpassungen möglich sind. Durch die Kombination aus strenger Planung und schnellerer manueller Umsetzung konnte das Design der App effizient modernisiert werden. Diese Flexibilität macht das Framework praxistauglich, da es Strenge für komplexe Logik und Geschwindigkeit für einfache Änderungen bietet. Das Video endet mit einem Dank an die Zuschauer und dem Hinweis auf Unterstützungsmöglichkeiten via Super-Thanks.

Community Posts

View all posts