Anthropic hat eine neue Methode zum "Vibe Code" veröffentlicht

AAI LABS
Internet TechnologyComputing/Software

Transcript

00:00:00Das Hauptproblem von KI-Agenten ist ihr begrenztes Kontextfenster,
00:00:02das einschränkt,
00:00:03wie viel sie sich von früheren Aktionen merken können.
00:00:06Wenn wir Claude Code eine größere Aufgabe geben,
00:00:08komprimiert es sich mehrmals,
00:00:09während es versucht,
00:00:10eine einzelne Funktion umzusetzen.
00:00:12Dabei vergisst es die eigentliche Hauptaufgabe,
00:00:14was es für langwierige Projekte weniger effektiv macht..
00:00:17Anthropic hat gerade eine Lösung vorgestellt,
00:00:19die sich an der Arbeitsweise echter Teams in einer realen Entwicklungsumgebung orientiert.
00:00:22Sie haben zwei Hauptgründe identifiziert,
00:00:24warum es bei langwierigen Aufgaben versagt.
00:00:26Viele von uns haben versucht,
00:00:27ganze Anwendungen oder große Funktionen in einem Rutsch zu erstellen.
00:00:30Doch zu viel auf einmal führt dazu,
00:00:32dass dem Modell der Kontext ausgeht..
00:00:34Nach wiederholter Komprimierung wird das Kontextfenster zwar aktualisiert,
00:00:37aber die Funktion ist nur halb implementiert,
00:00:39und der Fortschritt ist vergessen.
00:00:41Das führt zu unvollständigen Umsetzungen..
00:00:43Das zweite Problem ist,
00:00:44dass Claude aufgrund mangelnder Testmöglichkeiten ungetestete Funktionen als abgeschlossen markiert.
00:00:49Es geht davon aus,
00:00:49dass die Funktion vollständig ist,
00:00:51selbst wenn sie tatsächlich nicht richtig funktioniert.
00:00:53Ihre Lösung war der harmonische Einsatz eines Initialisierungs- und eines Coding-Agenten,
00:00:57inspiriert von der Arbeitsweise echter Softwareteams.
00:00:59Dieser Workflow ist ursprünglich für selbst entwickelte Agenten gedacht,
00:01:02aber ich habe erkannt,
00:01:03dass er auch auf Claude-Code-Instanzen anwendbar ist.
00:01:06Der erste Agent konzentriert sich darauf,
00:01:08Ihren Coding-Agenten korrekt zu initialisieren.
00:01:10Hier ist Geduld gefragt, denn das braucht etwas Zeit..
00:01:12Ich habe ein leeres Next.js-Projekt und möchte einen Online-Python-Compiler entwickeln.
00:01:16Bevor Sie beginnen,
00:01:17erstellen Sie eine Claude.md-Datei mit dem 'init'-Befehl.
00:01:20Diese Datei dient als Dokumentation für Ihre Codebasis und liegt im Stammverzeichnis Ihres Projekts.
00:01:24Sie enthält eine Übersicht und alle wichtigen Informationen..
00:01:27Als Nächstes generieren Sie die JSON-Datei mit der Feature-Liste im Projektstammverzeichnis.
00:01:30Sie sollte alle Features und die zugehörigen Testschritte auflisten,
00:01:33wobei alle Tests zunächst als fehlerhaft markiert sind,
00:01:36damit Claude gezwungen ist,
00:01:37sie zu testen.
00:01:38Wir verwenden JSON statt Markdown,
00:01:39da JSON-Dateien im Kontext einfacher zu handhaben sind.
00:01:43Da Claude nur den Code testen kann,
00:01:44nicht die Benutzeroberfläche im Browser,
00:01:46habe ich Puppeteer für das Browser-Testing integriert.
00:01:49Danach erstellen Sie ein Init-Skript,
00:01:51das den Start des Dev-Servers steuert,
00:01:53und eine Fortschrittsdatei,
00:01:54damit das System den Projektstatus verfolgen kann.
00:01:57Als Richtlinie muss Claude nach jedem Durchlauf die Datei 'progress.md' aktualisieren und jedes Feature nach der Implementierung testen.
00:02:04Die wichtigste Vorgehensweise ist das Committen in Git.
00:02:07Wir unterschätzen,
00:02:07wie entscheidend es ist,
00:02:08in einem merge-fähigen Zustand zu committen.
00:02:10Git-Commits mit aussagekräftigen Logs zeigen,
00:02:12was abgeschlossen ist,
00:02:13und ermöglichen ein Zurücksetzen,
00:02:14falls die Implementierung fehlschlägt.
00:02:15Schließlich sollte Claude die Feature-Liste nicht ändern,
00:02:18außer Features als implementiert zu markieren.
00:02:20Nachdem die Umgebung vorbereitet ist,
00:02:22gehen wir zum Coding über.
00:02:23Die Idee war,
00:02:23jedes Feature einzeln aus der Features-JSON-Datei zu implementieren.
00:02:27Claude erstellte nach jedem getesteten Feature aussagekräftige Commit-Nachrichten und startete bei Bedarf auch den Browser.
00:02:33Sobald die App funktionierte,
00:02:35aktualisierte es die JSON-Felder von 'false' auf 'true' und die Datei 'progress.md' mit dem bisherigen Fortschritt.
00:02:42Schließlich committete es die Änderungen und verifizierte,
00:02:44dass der Commit erfolgreich war.
00:02:45Der Vorteil dieses inkrementellen Ansatzes ist,
00:02:47dass Sie,
00:02:48selbst wenn die Sitzung beendet wird,
00:02:49genau dort fortfahren können,
00:02:50wo Sie aufgehört haben.
00:02:51Alles wird in den Git-Logs nachverfolgt,
00:02:53sodass Sie sich keine Sorgen machen müssen,
00:02:55Code zu beschädigen.
00:02:55Claude kann das Projekt anhand der Git-Logs und der Fortschrittsdatei verstehen,
00:02:59nicht anhand des Codes selbst,
00:03:00sodass Sie die Sitzung problemlos fortsetzen können.
00:03:02Ihr nächster Prompt ist einfach,
00:03:04das nächste als 'Nicht erledigt' markierte Feature zu implementieren.
00:03:06Dieser Ansatz reduziert auch Claudes Tendenz,
00:03:08Features ohne ordnungsgemäße Tests als abgeschlossen zu markieren.
00:03:11Jede Iteration stellt sicher,
00:03:13dass die App End-to-End mit echten Tests erstellt wird,
00:03:15was hilft,
00:03:15Fehler zu identifizieren,
00:03:17die allein aus dem Code nicht ersichtlich sind.
00:03:19Wir wiederholen diesen Zyklus,
00:03:20bis alle Features als 'true' markiert sind.
00:03:22Man könnte meinen, das ähnelt der BMAD-Methode.
00:03:24Es gibt Ähnlichkeiten,
00:03:25aber ich denke,
00:03:26Claudes Workflow ist in mancher Hinsicht besser.
00:03:28Es war einfacher,
00:03:29da man Agenten nicht separat aufrufen musste,
00:03:31und auch die Kontextauslastung war besser.
00:03:33Nach der Implementierung so vieler Features wurden nur 84 % des Kontexts genutzt,
00:03:37während BMAD aufgrund der umfangreichen Stories,
00:03:39die es generiert,
00:03:40bereits zweimal komprimiert hätte.
00:03:42Allerdings ist BMAD immer noch ein sofort einsatzbereites Gesamtsystem,
00:03:45während dies hier noch eine Idee ist,
00:03:46die umgesetzt werden muss.
00:03:48Aber BMAD könnte sich einige Dinge davon abschauen,
00:03:50wie zum Beispiel das Git-System.
00:03:51Nachdem wir Millionen von Menschen gezeigt haben,
00:03:53wie man mit KI entwickelt,
00:03:55haben wir diese Workflows selbst implementiert.
00:03:57Wir haben entdeckt,
00:03:57dass wir bessere Produkte schneller als je zuvor entwickeln konnten.
00:04:00Wir helfen Ihnen,
00:04:01Ihre Ideen zum Leben zu erwecken – sei es für Apps oder Websites.
00:04:04Vielleicht haben Sie unsere Videos gesehen und gedacht: 'Ich habe eine großartige Idee,
00:04:07aber kein Tech-Team,
00:04:08um sie umzusetzen.' Genau hier kommen wir ins Spiel.
00:04:10Sehen Sie uns als Ihren technischen Co-Piloten.
00:04:12Wir wenden dieselben Workflows,
00:04:14die wir Millionen gelehrt haben,
00:04:15direkt auf Ihr Projekt an und verwandeln Konzepte in echte,
00:04:18funktionierende Lösungen – ohne den Aufwand,
00:04:20ein Entwicklerteam einzustellen oder zu verwalten.
00:04:22Bereit, Ihre Idee schnell in die Realität umzusetzen?
00:04:25Kontaktieren Sie uns unter hello@autometer.dev.
00:04:27Damit sind wir am Ende dieses Videos angelangt..
00:04:29Wenn Sie den Kanal unterstützen und uns helfen möchten,
00:04:32weiterhin solche Videos zu erstellen,
00:04:33können Sie dies über den 'Super Thanks'-Button unten tun.
00:04:36Wie immer,
00:04:36vielen Dank fürs Zuschauen,
00:04:37und bis zum nächsten Mal!

Key Takeaway

Anthropic hat einen innovativen Zwei-Agenten-Workflow entwickelt, der das Problem des Kontextverlusts bei KI-Code-Agenten durch eine strukturierte Initialisierung und inkrementelle, Git-basierte Feature-Implementierung mit End-to-End-Tests löst, was zu effizienterer und zuverlässigerer Softwareentwicklung führt.

Highlights

Anthropic hat eine neue Methode für KI-Agenten vorgestellt, um das Problem des begrenzten Kontextfensters und des Vergessens von Hauptaufgaben bei der Code-Entwicklung zu lösen.

Die Lösung basiert auf einem Zwei-Agenten-Workflow (Initialisierungs- und Coding-Agent), der von echten Softwareentwicklungsteams inspiriert ist.

Der Initialisierungs-Agent bereitet die Entwicklungsumgebung vor, indem er Dokumentation, eine Feature-Liste mit Testschritten, Browser-Tests (Puppeteer) und ein Fortschritts-Tracking-System einrichtet.

Der Coding-Agent implementiert Features inkrementell, testet sie End-to-End, aktualisiert den Fortschritt und nutzt Git-Commits für eine robuste Versionskontrolle.

Der inkrementelle Ansatz ermöglicht es, jederzeit fortzufahren, reduziert Kontextverlust und stellt sicher, dass Features gründlich getestet werden, bevor sie als abgeschlossen markiert werden.

Der Workflow von Anthropic zeigt im Vergleich zu Methoden wie BMAD eine effizientere Kontextnutzung und einfachere Handhabung.

Das Unternehmen Autometer.dev bietet Dienstleistungen an, um diese KI-gestützten Entwicklungsworkflows für die schnelle Umsetzung von App- und Website-Ideen zu nutzen.

Timeline

Das Problem des begrenzten Kontextfensters bei KI-Agenten

Der Abschnitt beginnt mit der Erläuterung des Hauptproblems von KI-Agenten, nämlich ihres begrenzten Kontextfensters. Dies führt dazu, dass Modelle wie Claude Code bei größeren Aufgaben, die mehrere Komprimierungsschritte erfordern, die ursprüngliche Hauptaufgabe vergessen. Infolgedessen sind diese Agenten für langwierige Entwicklungsprojekte weniger effektiv, da sie nur halb implementierte Funktionen liefern und den Fortschritt verlieren. Das Kernproblem ist die Unfähigkeit, sich über längere Interaktionen hinweg an den Gesamtkontext zu erinnern.

Anthropic's Lösung und die Ursachen des Scheiterns

Anthropic stellt eine neue Lösung vor, die sich an der Arbeitsweise realer Softwareentwicklungsteams orientiert. Es werden zwei Hauptgründe für das Versagen von KI-Agenten bei langwierigen Aufgaben identifiziert: Erstens führt das Versuchen, zu viel auf einmal zu implementieren, zu Kontextverlust und vergessenem Fortschritt nach wiederholter Komprimierung. Zweitens markiert Claude aufgrund fehlender Testmöglichkeiten ungetestete Funktionen fälschlicherweise als abgeschlossen, selbst wenn sie nicht korrekt funktionieren. Die Lösung sieht den harmonischen Einsatz eines Initialisierungs- und eines Coding-Agenten vor.

Der Zwei-Agenten-Workflow: Initialisierung und Coding

Anthropic's Ansatz basiert auf einem Zwei-Agenten-Workflow, der von der Zusammenarbeit echter Softwareteams inspiriert ist. Dieser Workflow ist zwar ursprünglich für selbst entwickelte Agenten konzipiert, lässt sich aber auch auf Claude-Code-Instanzen anwenden. Der erste Agent, der Initialisierungs-Agent, konzentriert sich darauf, den Coding-Agenten korrekt einzurichten und vorzubereiten. Dieser Schritt erfordert Geduld, da eine gründliche Initialisierung entscheidend für den späteren Erfolg ist.

Detaillierte Schritte des Initialisierungs-Agenten

Dieser Abschnitt beschreibt die konkreten Schritte des Initialisierungs-Agenten anhand eines Beispiels (Next.js-Projekt, Online-Python-Compiler). Zuerst wird eine 'Claude.md'-Datei als Projektdokumentation erstellt, gefolgt von einer 'features.json'-Datei, die alle Features und zugehörigen Testschritte auflistet, wobei alle Tests zunächst als fehlerhaft markiert sind. Puppeteer wird für Browser-Tests integriert, da Claude die Benutzeroberfläche nicht direkt testen kann. Abschließend werden ein Init-Skript und eine 'progress.md'-Datei erstellt, um den Projektstatus zu verfolgen. Wichtige Richtlinien für Claude sind die Aktualisierung von 'progress.md' nach jedem Durchlauf, das Testen jedes Features nach der Implementierung und die Nutzung von Git-Commits mit aussagekräftigen Logs.

Der inkrementelle Coding-Workflow und seine Vorteile

Nach der Initialisierung beginnt der Coding-Agent mit der inkrementellen Implementierung jedes Features aus der 'features.json'-Datei. Claude erstellt nach jedem getesteten Feature aussagekräftige Commit-Nachrichten und startet bei Bedarf den Browser für Tests. Sobald eine Funktion korrekt arbeitet, aktualisiert der Agent die 'features.json' von 'false' auf 'true' und die 'progress.md' mit dem Fortschritt, bevor die Änderungen in Git committet werden. Der große Vorteil dieses Ansatzes ist die Möglichkeit, jederzeit genau dort fortzufahren, wo man aufgehört hat, da der Projektstatus über Git-Logs und die Fortschrittsdatei nachvollzogen wird. Dies reduziert auch die Tendenz von Claude, Features ohne ordnungsgemäße Tests als abgeschlossen zu markieren und gewährleistet End-to-End-Tests.

Vergleich mit BMAD und Ausblick

Der Sprecher vergleicht den vorgestellten Workflow mit der BMAD-Methode und stellt fest, dass es Ähnlichkeiten gibt, aber Claudes Ansatz in einigen Aspekten überlegen ist. Insbesondere war die Handhabung einfacher, da keine separaten Agenten aufgerufen werden mussten, und die Kontextauslastung war effizienter (84% Kontextnutzung im Vergleich zu zweimaliger Komprimierung bei BMAD). Obwohl BMAD ein sofort einsatzbereites Gesamtsystem ist und der hier vorgestellte Ansatz noch eine Idee zur Umsetzung darstellt, könnte BMAD von Elementen wie dem Git-System profitieren.

Autometer.dev: KI-gestützte Entwicklung als Dienstleistung

Das Unternehmen Autometer.dev hat diese KI-gestützten Workflows selbst implementiert und festgestellt, dass sie dadurch bessere Produkte schneller entwickeln können. Sie bieten ihre Dienste als 'technischer Co-Pilot' an, um Ideen für Apps oder Websites in funktionierende Lösungen zu verwandeln. Der Service richtet sich an Personen mit großartigen Ideen, denen ein Tech-Team zur Umsetzung fehlt. Autometer.dev wendet die gleichen Workflows, die sie Millionen gelehrt haben, direkt auf Kundenprojekte an, wodurch der Aufwand für die Einstellung und Verwaltung eines Entwicklerteams entfällt. Interessenten können das Unternehmen unter hello@autometer.dev kontaktieren.

Abschluss und Kanalunterstützung

Der Sprecher beendet das Video und bedankt sich bei den Zuschauern. Er weist darauf hin, dass der Kanal über den 'Super Thanks'-Button unterstützt werden kann, um die Erstellung weiterer solcher Videos zu ermöglichen. Dies ist ein üblicher Aufruf zur Interaktion und Unterstützung am Ende von YouTube-Videos.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video