Claude Code: Neues Brain-Upgrade inspiriert von Beads

BBetter Stack
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00Das Claude Code-Team hat vor Kurzem die To-dos zu Aufgaben hochgestuft, was eine riesige Neuigkeit ist, denn
00:00:05das bedeutet, dass jede Aufgabe ihre eigene JSON-Datei hat, die aktualisiert und auf GitHub committet werden kann.
00:00:11Diese Aufgaben können parallel mit Sub-Agenten laufen, und mehrere Claude Code-Sitzungen können
00:00:16dieselbe Aufgabenliste gemeinsam nutzen.
00:00:17Perfekt für komplexe Projekte mit vielen Aufgaben, die zahlreiche Sitzungen erfordern.
00:00:22Aber was bedeutet das für den extrem populären Ralph-Wiggum-Loop?
00:00:26Wird er dadurch überflüssig?
00:00:28Nicht ganz.
00:00:29Abonniert den Kanal und lasst uns direkt einsteigen.
00:00:32Opus 4.5 hat das Spiel in vielerlei Hinsicht verändert.
00:00:35Eine Sache, die es kann und die ihr vielleicht noch nicht wisst, ist die Fähigkeit, viel länger autonom zu laufen,
00:00:39wobei es seinen Status besser im Blick behält als andere Modelle.
00:00:44Das heißt, die klassische To-do-Liste, die ihr bisher von Claude Code kennt, ist für
00:00:48kleine Aufgaben praktisch nicht mehr nötig.
00:00:50Bei längeren Aufgaben gibt es aber weiterhin ein 200k-Kontextfenster, was bedeutet, dass es eine “Smart Zone” und
00:00:56eine “Dumb Zone” hat – ab der 80%-Marke liefert es also eher schwache Ergebnisse.
00:01:02Schaut euch mein Ralph-Wiggum-Video an, um mehr über den intelligenten und den weniger intelligenten Bereich
00:01:07eines Modells basierend auf seinem Kontext zu erfahren.
00:01:08In diesem Stadium greift man vielleicht zu einem Tool wie Beads, das Aufgaben in einer SQLite-Datenbank
00:01:14speichert und sie für die Versionskontrolle in einer JSONL-Datei ablegt.
00:01:19Das Beads-Tool hat das Claude Code-Team maßgeblich dazu inspiriert, die To-dos auf dieses
00:01:24neue Aufgabenverwaltungssystem umzustellen, das alles Mögliche tut – vom Speichern in JSON-Dateien
00:01:30bis hin zur Ausführung in mehreren Sitzungen und vielem mehr.
00:01:34Doch so cool dieses Upgrade auch ist, es funktioniert etwas anders als Beads und Ralph Wiggum.
00:01:39Ich zeige es euch am besten einfach.
00:01:41Hier ist eine Planungsdatei, die Claude Code geschrieben hat. Sie enthält drei große Änderungen,
00:01:46die ich einem Tool namens XDL hinzufügen möchte, mit dem man Videos von X oder Twitter per CLI herunterladen kann.
00:01:54Damit die Aufgaben funktionieren, benötigt ihr Claude Code Version 2.1.6 oder höher, die
00:02:00diese Aufgabenverwaltungs-Tools enthält.
00:02:03Ich werde Claude nun bitten, die Planungsdatei in eine Liste abzuarbeitender Aufgaben umzuwandeln.
00:02:08Wie ihr seht, wurden die Aufgaben erstellt und Abhängigkeiten hinzugefügt – also Aufgaben, die
00:02:13von anderen blockiert werden. Gelb markiert sind hier die Aufgaben,
00:02:18die die jeweilige spezifische Aufgabe blockieren.
00:02:20Wenn wir in das .claud-Verzeichnis im Root-Verzeichnis schauen, sehen wir einen Aufgaben-Ordner
00:02:26mit einem weiteren Unterordner für unser Projekt.
00:02:29Öffnen wir diesen, sehen wir alle erstellten Aufgaben mit ID, Betreff und Beschreibung,
00:02:36sowie die Info, welche Aufgaben diese blockieren und welche von ihr blockiert werden.
00:02:41Jetzt bitten wir Claude, jede Aufgabe in einem Sub-Agenten auszuführen, was es
00:02:45auch prompt erledigt hat.
00:02:46Aufgabe 1 wird gerade bearbeitet, ebenso wie die Aufgaben 8, 9 und 10, da diese nicht von anderen
00:02:52Aufgaben blockiert werden.
00:02:53Hier oben sehen wir zudem die verschiedenen Sub-Agenten, die an unterschiedlichen Aufgaben arbeiten.
00:02:57Nachdem nun alle Aufgaben erledigt sind, kann ich prüfen, wie viel Kontext verbraucht wurde.
00:03:01Wir sehen: Es waren nur 18 %, da alle Aufgaben in Sub-Agenten erledigt wurden.
00:03:06Aber das neue Aufgabenverwaltungssystem kann noch mehr.
00:03:09Wenn ich mehrere Claude-Sitzungen laufen lassen wollte – hier in verschiedenen Split-Panes, aber es
00:03:14könnten auch verschiedene Tabs oder Server sein –, die auf dieselbe Aufgabenliste zugreifen,
00:03:19könnte ich diese Umgebungsvariable nutzen: Claude Code Task List ID, gefolgt von der ID,
00:03:26die dem Verzeichnis der gewünschten Aufgabenliste entspricht.
00:03:30So sollte Claude Zugriff auf alle Aufgaben in diesem Verzeichnis haben, und ich könnte
00:03:34dasselbe in dieser Sitzung tun.
00:03:36Ich könnte also eine Sitzung bitten, die Aufgaben durchzugehen, und eine andere,
00:03:41den Abschluss der Aufgaben zu verifizieren.
00:03:43Wenn ich die linke Sitzung starte, sollte die rechte Sitzung den Fortschritt
00:03:48jeder einzelnen Aufgabe sehen können.
00:03:49Und da es auf dieser Seite fertig ist, kann diese Sitzung hier drüben nun prüfen,
00:03:53ob die Aufgabe tatsächlich abgeschlossen wurde.
00:03:55Das ist wirklich cool, denn man könnte eine Aufgabe an einem Rechner beginnen, aufhören,
00:04:00die Aufgaben auf GitHub oder ein anderes System pushen und dann auf einem anderen
00:04:06Rechner alles pullen und genau dort weitermachen, wo man aufgehört hat.
00:04:10Wer Erfahrung mit Beads hat, weiß, dass das so ähnlich funktioniert –
00:04:15aber eben nicht exakt gleich, denn Beads speichert Aufgaben für den schnellen Abruf in einer SQLite-Datenbank
00:04:23und synchronisiert diese mit einer einzigen JSONL-Datei statt mit vielen JSON-Dateien.
00:04:29Man kann diese eine Datei also einfach zum Projekt hinzufügen und mit dem Team teilen.
00:04:33Es unterscheidet sich auch ein wenig vom Ralph-Wiggum-Loop, allein schon von der Philosophie her.
00:04:39Beim Ralph-Loop hat man einen einzelnen Prompt und eine Liste von Aufgaben,
00:04:43die dabei helfen sollen, diesen Prompt zu erfüllen, den man immer und immer wieder
00:04:48an das Modell sendet.
00:04:49Beim neuen System hat man eine Aufgabenliste und bittet das Modell,
00:04:54einfach die nächste anstehende Aufgabe auszuwählen.
00:04:57Es liest also alle Aufgaben durch, um herauszufinden, was als Nächstes kommt.
00:05:02Das wird etwas abgemildert, wenn ein Sub-Agent an einer Aufgabe arbeitet, aber wenn ihr
00:05:07einen autonomen Loop wollt, der endlos laufen kann, wobei das Modell einem
00:05:12festen Ziel in eurer Prompt-MD-Datei folgt, um das Projekt stetig zu verbessern – selbst mit
00:05:17Aufgaben, die ihr gar nicht hinzugefügt habt –, dann ist das neue System nichts für euch.
00:05:22Außerdem gibt es noch das Problem mit der Dokumentation. Zum Zeitpunkt dieser Aufnahme
00:05:27befinden sich alle Informationen zu diesem Feature in einem einzigen Tweet.
00:05:30Im Vergleich zu Beads fehlen bisher Visualisierungs-Tools oder eine Art Kanban-Board,
00:05:34um den Fortschritt zu sehen, aber ich bin sicher, dass die Claude Code-Community
00:05:40bereits daran arbeitet.
00:05:42Und bei all diesen neuen Systemen zur Software-Erstellung müsst ihr sicherstellen,
00:05:47dass ihr euren Nutzern keine fehlerhafte Software liefert.
00:05:50Hier kommt Better Stack ins Spiel. Es bietet euch Möglichkeiten, Fehler im Backend
00:05:56und Frontend eures Projekts mit einem KI-gestützten Error-Tracker zu überwachen,
00:06:02inklusive Statusseite bei Ausfällen und einem großartigen Incident-Management-System.
00:06:08Schaut euch Better Stack also am besten noch heute an.

Key Takeaway

Das neue Aufgabenverwaltungssystem in Claude Code 2.1.6 revolutioniert die parallele Entwicklung durch JSON-basierte Task-Strukturen und Sub-Agenten, während spezialisierte Techniken wie Ralph Wiggum für autonome Loops weiterhin ihre Berechtigung haben.

Highlights

Claude Code hat To-dos zu einem fortschrittlichen Aufgaben-System mit individuellen JSON-Dateien aufgewertet.

Das System erlaubt die parallele Ausführung von Aufgaben durch Sub-Agenten

Timeline

Einführung in das neue Claude Code Aufgaben-System

Das Claude Code-Team hat eine bedeutende Aktualisierung vorgenommen, indem herkömmliche To-dos in ein systematisches Aufgabensystem umgewandelt wurden. Jede Aufgabe wird nun in einer eigenen JSON-Datei gespeichert, was die Verfolgung und Synchronisation über GitHub erheblich erleichtert. Diese Struktur erlaubt es mehreren Sitzungen und Sub-Agenten, gleichzeitig an derselben Liste zu arbeiten. Der Sprecher stellt direkt die Frage, ob diese Neuerung die populäre "Ralph-Wiggum"-Technik ersetzen wird. Es wird deutlich, dass dieses Upgrade vor allem für komplexe Projekte mit vielen Abhängigkeiten konzipiert wurde.

Opus 4.5 und die Grenzen des Kontextfensters

Mit der Einführung von Opus 4.5 hat sich die Autonomie von KI-Modellen verbessert, da sie ihren Status über längere Zeiträume besser verwalten können. Dennoch weist der Sprecher auf die Problematik des 200k-Kontextfensters hin, das er in eine "Smart Zone" und eine "Dumb Zone" unterteilt. Ab einer Füllung von etwa 80 % sinkt die Qualität der Ergebnisse spürbar, was eine effiziente Aufgabenverwaltung unerlässlich macht. Für kleine Aufgaben sind To-do-Listen kaum noch nötig, doch bei großen Projekten bleibt das Kontextmanagement kritisch. Diese technische Einschränkung ist der Hauptgrund für die Entwicklung strukturierterer Task-Systeme.

Inspiration durch Beads und technische Hintergründe

Der Sprecher erklärt, dass das Tool "Beads" als wesentliche Inspiration für die neuen Claude Code-Funktionen diente. Beads nutzt eine SQLite-Datenbank für den schnellen Abruf und eine JSONL-Datei für die Versionskontrolle. Das Claude Code-Team hat diesen Ansatz übernommen, nutzt jedoch ein System aus vielen einzelnen JSON-Dateien im ".claud"-Verzeichnis. Dies ermöglicht eine detaillierte Speicherung von Aufgaben-IDs, Beschreibungen und Abhängigkeiten. Obwohl die Systeme ähnlich sind, gibt es feine Unterschiede in der Handhabung und Datenspeicherung, die für Entwickler relevant sind.

Praktische Demonstration und Sub-Agenten

In einer Live-Demo zeigt der Sprecher, wie eine Planungsdatei in eine Liste von aktiven Aufgaben in Claude Code 2.1.6 umgewandelt wird. Besonders hervorgehoben wird die Visualisierung von Abhängigkeiten, bei der blockierte Aufgaben farblich markiert werden. Claude kann diese Aufgaben dann autonom an Sub-Agenten delegieren, die parallel an verschiedenen Problemen arbeiten. Dies führt dazu, dass der Hauptkontext des Modells geschont wird, da im Beispiel nur 18 % des Kontextfensters verbraucht wurden. Die automatische Erstellung der Ordnerstruktur im Projektverzeichnis sorgt für eine klare Trennung der Arbeitsschritte.

Multi-Session-Management und Synchronisation

Ein mächtiges Feature ist die Möglichkeit, mehrere Claude-Sitzungen über verschiedene Terminals oder Rechner hinweg zu synchronisieren. Durch das Setzen der Umgebungsvariable "Claude Code Task List ID" können unterschiedliche Instanzen auf denselben Aufgabenpool zugreifen. Dies erlaubt Szenarien, in denen eine Sitzung Aufgaben abarbeitet, während eine zweite Sitzung die Ergebnisse in Echtzeit verifiziert. Da die Daten in JSON-Dateien liegen, können sie einfach via Git gepusht und auf anderen Geräten gepullt werden. Der Workflow wird dadurch extrem flexibel und teamfähig, da der Fortschritt jederzeit lokal oder remote einsehbar ist.

Vergleich mit Ralph Wiggum und abschließende Tipps

Abschließend wird der konzeptionelle Unterschied zum Ralph-Wiggum-Loop erläutert, der eher auf einen festen Ziel-Prompt in einer MD-Datei setzt. Während das neue System explizite Aufgaben abarbeitet, eignet sich der Ralph-Loop besser für endlose Optimierungsprozesse ohne vordefinierte To-dos. Der Sprecher weist darauf hin, dass die Dokumentation für das neue Feature aktuell noch spärlich ist und meist auf Social-Media-Posts basiert. Dennoch wird ein großer Nutzen für die Softwareentwicklung prognostiziert, sofern Tools wie Better Stack zur Fehlerüberwachung eingesetzt werden. Das Video endet mit dem Rat, trotz KI-Automatisierung stets die Qualität der Software durch externes Monitoring sicherzustellen.

Community Posts

View all posts