Opus 4.6 + Agent Teams macht Claude Code wahnsinnig gut

BBetter Stack
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00Letzte Woche haben wir ein Video über die Agent-Swarm-Funktion von Claude Code gemacht,
00:00:03bei der spezialisierte Sub-Agenten für bestimmte Aufgaben erstellt werden,
00:00:07die wiederum mit dem Haupt-Orchestrator oder Teamleiter kommunizieren können.
00:00:11Damals war das noch ein verstecktes Feature, das man nur mit cleveren Hacks nutzen konnte.
00:00:15Doch jetzt wurde es offiziell unter dem Experimental-Flag veröffentlicht,
00:00:19inklusive offizieller Dokumentation, Teamwork-Unterstützung
00:00:21und der Möglichkeit für Teammitglieder, sich gegenseitig herauszufordern oder zu widersprechen.
00:00:25Abonniert den Kanal und lasst uns direkt loslegen.
00:00:28Anthropic hat diese Woche richtig abgeliefert – vom Release von Opus 4.6
00:00:32bis hin zu den Super-Bowl-Werbespots, die Sam Altman wohl gar nicht gefallen haben.
00:00:35Aber die Agenten-Teams sind wohl eines der größten Features für Claude Code,
00:00:40da sie die Aufgabenverwaltung mit parallelen Sub-Agenten kombinieren.
00:00:44Wobei Teams deutlich leistungsfähiger sind als bloße Sub-Agenten.
00:00:48Ich zeige es euch mal.
00:00:48Damit die Agenten-Teams funktionieren, benötigt ihr Version 2.1.32 oder höher
00:00:54und müsst diese Zeile in eure settings.json im .Claude-Verzeichnis einfügen.
00:00:58Okay, ich habe hier den Plan, ein Web-Interface für ein Tool namens XDL zu erstellen,
00:01:03mit dem man Videos von Twitter herunterladen kann.
00:01:05Ich habe den Agenten angewiesen, den Plan zu lesen, Aufgaben zu erstellen und einen Frontend- sowie Designer-Kollegen zu spawnen.
00:01:11Bevor ich Enter drücke: Ihr seht unten, dass ich Tmux verwende.
00:01:16Das liegt daran, dass die Agenten Tmux oder iTerm2 nutzen können, um Split-Panes zu erstellen,
00:01:21damit ich genau sehe, woran jedes Teammitglied gerade arbeitet.
00:01:24Drücken wir also Enter und schauen uns das Ganze an.
00:01:26Alles klar, er liest jetzt den Plan und erstellt die Aufgaben,
00:01:30bevor er die Teammitglieder parallel startet.
00:01:33Und hier haben wir unser erstes Teammitglied: den Frontend-Entwickler.
00:01:35Ich zoome mal ein Stück raus, damit wir mehr sehen, denn hier passiert gerade eine Menge.
00:01:39Und hier unten ist unser zweites Teammitglied, verantwortlich für das UI-Styling.
00:01:43Wie ihr seht, kann ich direkt mit den Teammitgliedern interagieren,
00:01:47um ihnen während der Arbeit spezifische Befehle zu geben.
00:01:49Hätte ich einen größeren Monitor oder würde ich auf normaler Stufe zoomen,
00:01:53könnte ich alles gleichzeitig im Blick behalten.
00:01:55Aber durch den Zoom ist das gerade etwas schwierig.
00:01:58Sobald ein Teammitglied fertig ist,
00:02:00wird die Instanz vom Haupt-Agenten in Claude Code automatisch geschlossen.
00:02:04Jetzt sind beide fertig und wir können uns das Design ansehen,
00:02:08das so aussieht.
00:02:09Ich füge die URL eines Tweets ein, klicke auf Download, und das Video wird extrahiert,
00:02:14sodass wir es herunterladen und im Browser ansehen können.
00:02:18Ziemlich cool.
00:02:19Wenn wir in unser .claude/teams-Verzeichnis schauen,
00:02:22sehen wir einen Ordner mit dem Projektnamen und dem Branch.
00:02:26In diesem Ordner befindet sich eine config.json mit den Projektinfos,
00:02:31dem Teamleiter und dem verwendeten Modell – in diesem Fall Haiku.
00:02:36Obwohl ich Haiku nicht explizit gewählt habe, hielt das System es wohl für das beste Modell für diesen Job.
00:02:41Wenn ich denselben Prompt mit demselben Modell nun außerhalb von Tmux starte,
00:02:46geht er wieder an die Arbeit, plant die Aufgaben und erstellt das Team.
00:02:50Diesmal werden die Teammitglieder jedoch hier unten angezeigt.
00:02:53Wir haben den Designer, den Frontend-Entwickler und den Haupt-Teamleiter.
00:02:57Per Enter-Taste kann ich zu einem Mitglied wechseln und genau sehen, was es tut.
00:03:01Auch hier kann ich in diesem Fenster direkt mit ihnen kommunizieren.
00:03:04Es ähnelt also der Tmux-Ansicht, aber statt mehrerer Fenster nebeneinander
00:03:09haben wir ein großes Fenster und können unten zwischen den Mitgliedern umschalten.
00:03:13Sobald eine Aufgabe erledigt ist, schließt sich das Mitglied und der Teamleiter übernimmt wieder.
00:03:18Hier sehen wir die Liste der abgeschlossenen Aufgaben
00:03:21zusammen mit einer Zusammenfassung der Ergebnisse.
00:03:24Das wirkt zwar wie normale Sub-Agenten, ist aber tatsächlich grundverschieden.
00:03:28Werfen wir einen Blick in die Dokumentation, speziell in diesen Abschnitt,
00:03:31um die Unterschiede zu sehen: Agenten-Teams haben einen eigenen, unabhängigen Kontext.
00:03:35Sub-Agenten kommunizieren nur mit dem Haupt-Agenten,
00:03:38während Teammitglieder untereinander kommunizieren können und eine gemeinsame Aufgabenliste teilen.
00:03:43Bei Sub-Agenten verwaltet der Haupt-Agent hingegen alles zentral.
00:03:46Aber hier kommt der entscheidende Punkt:
00:03:47Sub-Agenten fassen das Ergebnis zusammen und senden es an den Hauptkontext zurück,
00:03:51während Team-Agenten jeweils eine eigene separate Claude-Instanz nutzen.
00:03:55Dadurch verbrauchen sie deutlich mehr Token.
00:03:57Das Agent-Teams- bzw. Agent-Swarm-Feature ist also offiziell da.
00:04:02Allerdings glaube ich nicht, dass ich es allzu oft nutzen werde.
00:04:04Die Kosten der Anthropic-Modelle, kombiniert mit der Tatsache, dass dieses Feature
00:04:09Token förmlich wegfrisst, schreckt mich etwas von der täglichen Nutzung ab.
00:04:13Ich werde es wohl auf Spezialfälle wie Recherche beschränken oder wenn ein Agent die Arbeit eines anderen prüfen soll.
00:04:19Schaut euch das hier mal an.
00:04:20Das war mein erster Versuch mit dem Agent-Teams-Feature.
00:04:23Vorhin im Video haben die zwei Teammitglieder (ohne den Haupt-Agenten)
00:04:27bereits 29 % meines Kontingents bei Opus 4.6 verbraucht – das sind etwa 13.000 Token.
00:04:34Man muss dazu sagen, dass parallele Agenten an sich nichts Neues sind.
00:04:37Open Code und andere Agent-Frameworks bieten das schon länger an.
00:04:41Es wird spannend sein, wie die Claude-Code-Nutzer das Feature annehmen,
00:04:47vor allem, da die Tmux-Shortcuts nicht gerade intuitiv sind.

Key Takeaway

Das neue Agent-Teams-Feature in Claude Code ermöglicht hocheffizientes, paralleles Arbeiten spezialisierter KI-Instanzen, erkauft dies jedoch durch einen massiven Token-Verbrauch und erhöhte Kosten.

Highlights

Offizielles Release des Agent-Teams-Features unter einem Experimental-Flag in Claude Code v2.1.32.

Unterscheidung zwischen einfachen Sub-Agenten und leistungsstärkeren Team-Agenten mit eigenem Kontext.

Integration von Tmux und iTerm2 für parallele Visualisierung der Agenten-Arbeit in Split-Panes.

Teammitglieder können untereinander kommunizieren und eine gemeinsame Aufgabenliste abarbeiten.

Hoher Token-Verbrauch: Ein kurzer Testlauf beanspruchte bereits 29 % des Opus 4.6-Kontingents.

Automatische Modellwahl durch das System

Timeline

Einführung in Agent-Teams und Opus 4.6

Der Sprecher stellt das neue offizielle Release der Agent-Teams-Funktion für Claude Code vor, die zuvor nur über Hacks zugänglich war. Neben dem Release von Opus 4.6 wird betont, dass die Agenten nun offiziell dokumentiert sind und sich gegenseitig herausfordern können. Die Team-Struktur geht weit über bloße Sub-Agenten hinaus, da sie parallele Aufgabenverwaltung und Teamwork unterstützt. Dies wird als eines der bedeutendsten Features für die Claude-Code-Plattform bezeichnet. Der Kontext umfasst auch die aktuelle Marktsituation und kleine Seitenhiebe gegen Konkurrenten wie OpenAI.

Technische Einrichtung und Tmux-Integration

Für die Nutzung der Agent-Teams ist mindestens die Version 2.1.32 von Claude Code sowie ein spezifischer Eintrag in der Konfigurationsdatei erforderlich. Der Sprecher demonstriert die Einrichtung anhand eines Projekts zur Erstellung eines Web-Interfaces für das Tool "XDL". Besonders hervorgehoben wird die Nutzung von Tmux, um die Arbeit der verschiedenen Agenten in separaten Terminal-Fenstern gleichzeitig zu verfolgen. Dies ermöglicht dem Nutzer eine visuelle Kontrolle über den Fortschritt der einzelnen Teammitglieder wie Frontend-Entwickler oder Designer. Die Vorbereitung zeigt, wie präzise die Aufgabenverteilung durch den Haupt-Orchestrator gesteuert wird.

Live-Demo: Paralleles Arbeiten der Agenten

In dieser Phase wird gezeigt, wie der Haupt-Agent Aufgaben plant und spezialisierte Teammitglieder für Frontend und UI-Styling startet. Der Nutzer kann in Echtzeit mit jedem einzelnen Agenten interagieren und spezifische Anweisungen geben, während diese parallel arbeiten. Sobald eine Teilaufgabe abgeschlossen ist, schließt der Haupt-Agent die entsprechende Instanz automatisch. Das Endergebnis ist eine funktionierende Web-Oberfläche, mit der Videos von Twitter extrahiert und im Browser angesehen werden können. Diese Demonstration verdeutlicht die praktische Effizienz der Agenten-Kollaboration bei komplexen Programmieraufgaben.

Konfiguration und Alternative Ansichten

Der Sprecher analysiert die Dateistruktur im Verzeichnis ".claude/teams", wo Konfigurationsdaten und Projektinfos gespeichert werden. Interessanterweise wählte das System eigenständig das Haiku-Modell für die Teilaufgaben, obwohl dies nicht explizit vorgegeben war. Es wird zudem gezeigt, wie das Feature ohne Tmux funktioniert, indem Nutzer über die Enter-Taste zwischen den Agenten-Ansichten umschalten können. Nach Abschluss der Arbeiten präsentiert der Teamleiter eine detaillierte Zusammenfassung aller erledigten Aufgaben. Dieser Abschnitt verdeutlicht die Flexibilität der Benutzeroberfläche für unterschiedliche Arbeitsumgebungen.

Technischer Vergleich und Kostenanalyse

Abschließend erfolgt eine kritische Gegenüberstellung von Agent-Teams und herkömmlichen Sub-Agenten basierend auf der offiziellen Dokumentation. Während Sub-Agenten zentral gesteuert werden, agieren Team-Agenten als völlig unabhängige Claude-Instanzen mit eigenem Kontext. Der Sprecher warnt jedoch vor den enormen Kosten, da das Feature ca. 13.000 Token oder 29 % seines Opus-Kontingents für einen einfachen Task verbraucht hat. Aufgrund dieses hohen Ressourcenverbrauchs wird die Nutzung primär für spezialisierte Fälle wie komplexe Code-Reviews oder Recherche empfohlen. Der Beitrag endet mit einem Ausblick auf die Akzeptanz des Features trotz der gewöhnungsbedürftigen Tmux-Steuerung.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video