ADLC: Der neue Lebenszyklus von Claude Code für KI-Programmierung

AAI LABS
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00Sie haben wahrscheinlich schon oft gehört, dass sich die Softwareentwicklung verändert hat,
00:00:03aber die bloße Einführung neuer Tools kratzt nur an der Oberfläche,
00:00:06weil sich die heute entwickelten Systeme nicht mehr so verhalten wie alte Software.
00:00:10Deshalb mussten sich auch die Frameworks ändern, auf denen Unternehmen aufbauen,
00:00:14denn wenn man weiter auf dem alten Prozess aufbaut, stößt man auf Probleme, die er nicht lösen kann.
00:00:18Um dieser sich verändernden Landschaft gerecht zu werden,
00:00:21ist in der Entwickler-Community ein neues Framework entstanden, das speziell für Agenten entwickelt wurde.
00:00:25Und bis zum Ende dieses Videos werden wir Sie durch dieses neue Lifecycle-Framework führen
00:00:29und Ihnen zeigen, warum Sie es übernehmen sollten.
00:00:31Seit vielen Jahren wird die Softwareentwicklung nach dem SDLC-Modell durchgeführt.
00:00:35Der Software Development Lifecycle ist ein strukturierter Prozess, der seit Jahrzehnten genutzt wird
00:00:39und mehrere Schritte wie Design, Entwicklung, Testen, Deployment, Wartung und fortlaufenden Support umfasst.
00:00:45Der Grundgedanke dahinter ist, dass Software unter Berücksichtigung von Geschäftszielen und Nutzeranforderungen entwickelt werden sollte,
00:00:51wobei das Ergebnis jeder Phase zum Input für die nächste wird.
00:00:54Das funktionierte jedoch nur so lange, bis die KI Einzug in die Technologiebranche hielt.
00:00:57Seitdem KI an Bedeutung gewinnt, war das Erste, was sie zu ersetzen begann, das Schreiben von Code.
00:01:02Vor der KI bestand Entwicklung aus dem unzähligen Schreiben von Code –
00:01:06oft ein repetitiver Prozess des Zusammenfügens von Snippets und Logik aus anderen Quellen, um ein System zur Problemlösung zu bauen.
00:01:12Als die Modelle besser wurden und Tools wie Claude Code und Cursor die Branche dominierten,
00:01:18ist der SDLC allein gescheitert.
00:01:20Er kann sich so nicht mehr halten und muss sich ändern, um echten Mehrwert zu bieten.
00:01:24Deshalb wurde der Agentic Development Lifecycle, oder ADLC, entwickelt.
00:01:28Er schließt die Lücke zwischen dem SDLC und der aktuellen Technologielandschaft.
00:01:32Der ADLC wurde nötig, weil man bei Systemen, die auf dem SDLC basierten,
00:01:36das Verhalten des Systems schon bei der Planung kannte und es Möglichkeiten gab, dies zu überprüfen.
00:01:41Einfach ausgedrückt: Der SDLC behandelt Software als statisches Element, während der ADLC sie als lebendiges System versteht.
00:01:47Da KI-Agenten unvorhersehbar sind und sich durch logisches Denken und die Anpassung von Aufgaben
00:01:53an ihre Umgebung weiterentwickeln, ist es schwer, sie mit den gleichen Metriken wie traditionelle Software zu bewerten.
00:01:59Der Hauptgrund für die Entwicklung des ADLC ist der Nicht-Determinismus eines KI-Agenten in der Produktionsumgebung.
00:02:05Bei KI-Agenten gibt es ständiges Lernen und eine kontinuierliche Weiterentwicklung,
00:02:09und man kann vorab nicht bestimmen, wie die Ausgabe des Agenten aussehen wird.
00:02:12Wenn man mit KI arbeitet, hängen die Entscheidungen vom Prompt, dem Kontext, den Modellen
00:02:16und all den angebundenen externen Tools ab.
00:02:18Modelle an sich sind immer noch unberechenbar, weshalb wir nicht mit 100-prozentiger Genauigkeit vorhersagen können, was ein Prompt zurückgibt.
00:02:25Dadurch hat man im Wesentlichen andere Erfolgsmetriken als beim SDLC.
00:02:29Es gibt 7 Phasen im ADLC, und jede Phase lässt sich auf die eine oder andere Weise genau einer SDLC-Phase zuordnen.
00:02:36Egal ob man an einem agentischen System arbeitet oder nicht: Der erste Schritt bleibt immer die Planung.
00:02:41Was sich ändert, ist die Art und Weise, wie man sie angeht.
00:02:43Für Agenten kann man nicht so planen wie für nicht-agentische Systeme,
00:02:46denn im Gegensatz zu traditionellen Systemen greift der logische Ablauf hier nicht auf dieselbe Weise.
00:02:51Die erste Phase des ADLC – Vorbereitung und Hypothese –
00:02:54zielt darauf ab, ein fundiertes Verständnis des Problems aufzubauen, bevor man sich auf ein Systemdesign oder Modell festlegt.
00:02:59Bei Agenten muss man verstehen, wie Nutzer mit dem System interagieren werden,
00:03:04und sich mit allen Stakeholdern abstimmen, um herauszufinden, wo der Workflow hakt
00:03:07und wie der wiederholte manuelle Aufwand aussieht – denn genau das wird der Agent letztendlich lösen.
00:03:12Dann überprüft man die bestehenden Workflows und Richtlinien, um zu sehen, wie die Dinge derzeit gehandhabt werden.
00:03:16Sobald das klar ist, formuliert man überprüfbare Hypothesen darüber, wo die Agenten den Workflow unterstützen oder automatisieren sollen.
00:03:22Wenn wir diese Phase komplett überspringen würden, würden wir am Ende die falsche Arbeit automatisieren,
00:03:26und anstatt das Problem zu lösen, könnte es alles nur noch schlimmer machen.
00:03:28Der Unterschied zum SDLC liegt hier im Verhalten.
00:03:31Im SDLC war das Verhalten vorhersagbar, weil derselbe Input immer zu demselben Output führte.
00:03:37Der ADLC ist jedoch probabilistisch, da ein Modell involviert ist,
00:03:40und dieselben Inputs führen fast nie zum exakt selben Output.
00:03:43Mit diesem Wissen besteht der erste Schritt darin, den Planungsmodus zu aktivieren
00:03:47und den genutzten Agenten das Verhalten des zu entwickelnden Agenten planen zu lassen, nicht die Implementierung.
00:03:52Weisen Sie ihn an, nicht über Code nachzudenken, sondern den gesamten Workflow abzubilden:
00:03:56Wie interagieren die Agenten mit den Nutzern, was könnte schiefgehen, welcher Overhead könnte entstehen
00:04:00und alle anderen Annahmen über das System.
00:04:03Auf diese Weise beginnt Ihr Agenten-Entwicklungsprozess mit den Kernannahmen,
00:04:06was ein besserer Leitfaden ist, als direkt in die Architekturplanung einzusteigen.
00:04:10Sobald die initiale Planung abgeschlossen ist, folgt direkt danach eine weitere Ebene,
00:04:13in der Sie den Umfang und das Problem richtig identifizieren.
00:04:16Dies entspricht der Analysephase oder Machbarkeitsstudie des SDLC,
00:04:20in der man die Geschäftsanforderungen analysierte und prüfte, ob die Umsetzung machbar war.
00:04:25Diese Phase des ADLC dient also dazu, die wichtigen Prozesse und die Rolle der KI bei deren Lösung zu identifizieren,
00:04:31die Einschränkungen und technischen Grenzen abzustecken
00:04:33und klare geschäftliche sowie technische KPIs im Vorfeld zu definieren, wie Zeit, Kosten, Latenz und Machbarkeit.
00:04:39An diesem Punkt definieren Sie auch die Kompromisse und wissen, welche Faktoren akzeptabel sind und welche nicht.
00:04:44Der wichtigste Teil dieser Phase ist jedoch die korrekte Abbildung des Mensch-Agenten-Verantwortungsmodells,
00:04:49da dies eine Rechenschaftsstruktur schafft.
00:04:52Ein Mensch muss sie immer noch überprüfen, da wir einem Agenten nicht alle Entscheidungen anvertrauen können.
00:04:56Am Ende dieser Phase verfügen Sie über eine ordnungsgemäße Dokumentation, in der die Workflow-Schritte mit klaren KPIs definiert sind
00:05:02und das Mensch-Agenten-Verantwortungsmodell eindeutig dargelegt ist.
00:05:05Das ist wichtig, denn im Falle eines Fehlers kann man die Schuld nicht gänzlich dem Modell zuschieben.
00:05:09Die Letztverantwortung muss letztlich beim Menschen verbleiben.
00:05:12Diese Planung der menschlichen Verantwortung war früher nicht nötig, da keine KI im Spiel war.
00:05:17Sie definiert die Autonomiegrenzen des Agenten. Wenn Sie diesen Schritt überspringen,
00:05:21riskieren Sie Ihre eigene Compliance und Rechenschaftspflicht in der Produktion.
00:05:24Um dies mit Agenten umzusetzen, nutzen Sie wieder den Planungsmodus und weisen ihn an, Workflows, Latenzen, Systemprobleme,
00:05:30alle in der Architektur benötigten Funktionen und mögliche Fehlerszenarien durchzuplanen.
00:05:34Sobald diese klar formuliert sind, versteht der Agent den richtigen Rahmen, um sich beim Bauen schrittweise voranzuarbeiten.
00:05:39Nachdem der Umfang und die übergeordneten Funktionen definiert sind, ist es an der Zeit, in die Designphase überzugehen.
00:05:43In dieser Phase definieren wir die Systemarchitektur für den Agenten selbst.
00:05:47Hier entscheiden Sie, welchem Muster der Agent folgen soll – wie ReAct, Plan-and-Act, einem Multi-Agenten-Setup oder welchem Ansatz auch immer.
00:05:54Dann planen Sie den Datenfluss von einem Punkt zum anderen, was bei der Einbindung mehrerer Agenten noch viel entscheidender wird.
00:06:00Der Agent muss die korrekten Daten erhalten, andernfalls wird er Probleme verursachen, statt zu helfen.
00:06:05Sie planen auch Kostenstrukturen wie die Token-Ökonomie, Funktionen zur Kontextbearbeitung und Kompaktierung
00:06:10und ermitteln, wie hoch die Kosten für das Deployment dieses Agenten in der Produktion sein werden
00:06:14und was passiert, wenn er beginnt, mehrere Nutzer gleichzeitig zu bedienen.
00:06:17Hier wählen Sie nun auch tatsächlich aus, welche Modelle Sie nutzen wollen, welches Orchestrierungs-Framework Sie verwenden,
00:06:23die Datenbank und all die anderen beteiligten Technologien. Und genau hier definieren Sie, wie Erfolg aussehen soll,
00:06:28bevor überhaupt Code geschrieben wird, damit Sie den Agenten mittels TDD entwickeln können.
00:06:32Bevor Ihr System live geht, haben Sie bereits die Kompromisse bei Latenz, Genauigkeit, Halluzinationen und ähnlichen Problemen abgewogen.
00:06:38Diese Phase erfordert ebenfalls den Planungsmodus Ihres Agenten.
00:06:41Sie geben ihm Prompts, um ein umfassendes Design zu entwerfen, das die Agentenarchitektur, den Datenfluss, das Kostenmodell
00:06:46und die gesamte technische Struktur abdeckt, sodass Sie mit einem konkreten Plan zum nächsten Schritt übergehen können.
00:06:51Nachdem die initialen Pläne stehen, folgt als nächster Schritt die Simulation und der Proof of Value.
00:06:55Hier nutzen Sie reale Daten, um die in den früheren Phasen getroffenen Annahmen zu testen.
00:06:59Sie erstellen Prototypen, um herauszufinden, ob es sich überhaupt lohnt, mit dem Bau dieses Agenten fortzufahren.
00:07:04Im Grunde entscheiden Sie in dieser Phase, ob Sie den Agenten überhaupt entwickeln sollten, da die Kosten eines Scheiterns hier noch viel geringer sind.
00:07:10Zu den Kernaktivitäten gehören hier das Vorbereiten des Datensatzes bzw. der Ground Truth für Verhaltenstests,
00:07:15das Bauen von Prototypen, um die zuvor dokumentierten risikoreichen Annahmen zu überprüfen,
00:07:19und das Validieren von Datenqualität, Halluzinationsrate, Genauigkeit, Antwortqualität und Benchmarks.
00:07:25Sie überprüfen auch die ursprüngliche Hypothese noch einmal, um festzustellen, ob sich die Investition auszahlen wird.
00:07:30Die Ergebnisse sind präzise gemessene Performance- und Kosten-Baselines
00:07:33zusammen mit dem zuvor erwähnten Ground-Truth-Dokument, das als Testgrundlage für Regressionstests und das Modell-Finetuning dient.
00:07:40Diese Phase fungiert als Validierungsschranke.
00:07:42Wenn die Ergebnisse hier überzeugen, können Sie die Arbeit an dem Agenten fortsetzen.
00:07:46Wenn nicht, ist das Projekt gescheitert. Es ist viel besser, das frühzeitig zu erkennen,
00:07:50denn wenn das System erst in der Produktion gelandet wäre, wäre der Schaden weitaus größer.
00:07:54Dazu fordern Sie Ihren KI-Agenten auf, den ersten Prototyp zu erstellen, damit Sie ihn gegen all Ihre Planungen testen können.
00:08:00Aber bevor wir fortfahren, ein kurzes Wort von unserem Sponsor: Softr.
00:08:04Vibe-Coding-Tools sind großartig, um eine Benutzeroberfläche zu generieren, aber sobald man echte Authentifizierung,
00:08:08Nutzerrollen, Berechtigungen oder eine wirklich skalierbare Datenbank braucht, bricht alles zusammen und man muss wieder selbst Code schreiben.
00:08:14Softr ist ein KI-App-Builder, der all das mit einem einzigen Prompt erledigt.
00:08:18Sie beschreiben auf einfachem Deutsch, was Sie brauchen, und der KI-Co-Builder generiert den gesamten Stack, die Datenbank, die Seiten, die Navigation, den Login und die rollenbasierten Berechtigungen in einem Rutsch.
00:08:28Das sind keine reinen Prototyp-Seiten, sie funktionieren tatsächlich.
00:08:30Sie können die App in der Vorschau prüfen, sehen, was jede Nutzerrolle sieht, und wenn Sie auf Veröffentlichen klicken, ist Ihre App live – inklusive Hosting, Nutzergruppen, Sicherheitsstandards auf Enterprise-Niveau und Zugriffskontrolle.
00:08:40Und Sie brauchen keinen Entwickler, um sie zu warten.
00:08:42Alles ist visuell aufgebaut, sodass Sie Workflows aktualisieren, Nutzer verwalten und Funktionen selbst hinzufügen können.
00:08:47Die wahren Kosten von Software entstehen nicht beim Erstellen, sondern bei der Wartung – und genau das löst Softr.
00:08:52Sichern Sie sich Ihre kostenlosen KI-Credits, indem Sie auf den Link in der Beschreibung klicken, und legen Sie los.
00:08:57Dies markiert das Ende der Planungsphase und bringt uns zu dem Teil, in den viele Leute direkt hineinspringen: die Implementierung.
00:09:03Die vorherigen Schritte sind enorm wichtig, denn wenn Sie sie richtig durchgeführt haben, stoßen Sie hier nicht auf jene Probleme, die die meisten durch das Überspringen dieser Phasen haben.
00:09:11Das ist also der Moment, in dem Sie Ihren Agenten tatsächlich entwickeln, die Kernlogik aufbauen und Ihren Entwicklungs-Workflow orchestrieren.
00:09:16Und hier sieht man eine der deutlichsten Trennlinien zwischen SDLC und ADLC.
00:09:20Im SDLC liegt die Logik im Code, in der Konfiguration und in Abhängigkeiten von Drittanbietern.
00:09:25Im ADLC verteilt sich diese Logik auf Code, Prompts, Modelle, Tools und externe Dienste.
00:09:30Sie verwalten also nicht mehr nur Software, sondern all diese Ebenen zusammen, und jede einzelne davon kann das Verhalten des Systems verändern.
00:09:38Wenn Sie Multi-Agenten-Systeme entwickeln müssen, ist die neue Agenten-Ansicht in Claude Code eine Möglichkeit, Ihre Workflows zu orchestrieren.
00:09:44Mit der Agenten-Ansicht können Sie Aufgaben viel besser delegieren als bei der regulären Nutzung von Claude.
00:09:49Denn anstatt verschiedene Claude-Code-Sitzungen einzeln zu verwalten, steuern Sie eine einzige Orchestrierungsebene und geben dem Agenten-Manager Prompts, um alle Agenten darüber zu koordinieren.
00:09:57An diesem Punkt integrieren Sie Tools wie MCPs und APIs.
00:10:01Wenn Sie beispielsweise einen persönlichen Assistenten bauen, wissen Sie, dass er so etwas wie einen Google Calendar MCP, einen Gmail MCP und vielleicht einen Notion MCP benötigen wird.
00:10:09Und das Wichtigste hierbei ist das Kontextmanagement.
00:10:11Sobald man nämlich einen Agenten für die Produktion baut, wird dies zu einem der kritischsten Aspekte.
00:10:16Selbst die größten derzeit verfügbaren Kontextfenster, wie die 1-Million-Token-Fenster in Gemini und Opus, erfordern immer noch eine sorgfältige Handhabung.
00:10:24Sie müssen sicherstellen, dass der Agent die richtigen Informationen im Gedächtnis behält und ein Verkommen des Kontextes vermieden wird.
00:10:28Denn wenn er am Ende zu viele irrelevante Informationen enthält, verzettelt sich seine Aufmerksamkeit und die Ergebnisse werden schlechter.
00:10:34In dieser Phase müssen Sie auch von Entwicklerseite aus testen, um die Verhaltenskonsistenz nach jeder Änderung durch manuelle Validierung des Agenten-Setups gegen die Anforderungen sicherzustellen.
00:10:44Entwicklung und Validierung sind in agentischen Systemen nicht voneinander getrennt.
00:10:48Ohne ständige Tests kann man nicht weitermachen, da selbst kleine Änderungen riesige Auswirkungen auf den gesamten Workflow haben können.
00:10:54Man braucht also parallel zur Entwicklung des Agenten eine Validierung auf Entwicklerebene, statt sich erst später auf einen separaten Testschritt zu verlassen.
00:11:01Nachdem Sie Ihr System fertiggestellt haben, folgt als nächste Phase das Testen.
00:11:05Wie bereits erwähnt, muss das Testen während des gesamten Entwicklungsprozesses fortlaufend erfolgen. Sobald Ihr System steht, testen Sie es unter produktionsnahen Bedingungen statt nur als einzelne Komponenten.
00:11:14Dies ist die Phase, in der Sie Integrationstests durchführen.
00:11:16Sie führen auch Benutzerakzeptanztests durch, bei denen Sie Feedback von echten Nutzern des Systems sammeln und dieses wieder in das System einfließen lassen.
00:11:24Sie testen über mehrere Faktoren wie Bias, Compliance, Performance und andere risikobezogene Dimensionen hinweg, um sicherzustellen, dass das Release vor dem Livegang sicher ist.
00:11:32Und genau hier verschieben sich die Erfolgsmetriken komplett.
00:11:35Im SDLC hat man die funktionale Korrektheit mit Tests gemessen, die einfach bestanden wurden oder fehlschlugen.
00:11:40Im ADLC misst man die Genauigkeitsverteilung, die Halluzinationsrate und die Kosten pro Ergebnis, da sich nichts davon einfach in ein simples “Bestanden” oder “Fehlgeschlagen” pressen lässt.
00:11:48Das gesamte Testparadigma verändert sich damit ebenfalls.
00:11:50Im SDLC validierten vordefinierte Tests bekannte Codepfade.
00:11:54Im ADLC wird daraus eine kontinuierliche Evaluierung von logischem Denken, Sicherheit und Tool-Nutzung, da der Agent denselben Pfad nie zweimal auf exakt dieselbe Weise durchläuft.
00:12:02Es gibt verschiedene Evaluierungs-Frameworks wie RAGAS und DEEPVAL, aber das Entscheidende für die Überprüfung der Korrektheit ist, wie Ihre Daten im Vergleich zu den zuvor definierten Metriken abschneiden.
00:12:12Es gibt mehrere Möglichkeiten, ein agentisches System zu testen, darunter funktionale, nicht-funktionale, strukturelle Tests und Lasttests.
00:12:18Jeder dieser Tests muss gründlich durchgeführt werden – oft unter Einsatz von agentischen Systemen selbst –, damit Randfälle richtig identifiziert und vor dem Produktionsstart behoben werden.
00:12:27Wenn Ihnen unsere Inhalte gefallen, drücken Sie gerne den Hype-Button, da uns das hilft, mehr solcher Inhalte zu erstellen und mehr Menschen zu erreichen.
00:12:34Sobald Ihr System bereit ist, ist es an der Zeit, es zu deployen und für die reale Welt verfügbar zu machen.
00:12:39Sie deployen es nicht einfach direkt und haken es ab, denn bei agentischen Systemen ist weit mehr involviert.
00:12:44Bei einem normalen System bedeutet Deployment meist, es in die Produktion zu pushen und den Systemzustand zu überwachen.
00:12:49Bei agentischen Systemen ist das völlig anders, und hier ändert sich die Bedeutung von Deployment selbst grundlegend.
00:12:54Im SDLC war das Deployment das Ende der Entwicklung und der Beginn einer stabilen Betriebsphase – der Punkt, an dem die Software in ihre ruhigen Jahre eintrat.
00:13:02Im ADLC ist das Deployment der Beginn einer aktiven Überwachung und Steuerung, die von Modell-Updates, Kontext-Drift und Umgebungsveränderungen geprägt ist, die sich auch nach dem Release ständig weiterbewegen.
00:13:11Auch wenn die Entwicklung abgeschlossen sein mag, ist diese Phase umso kritischer, da Sie nun Verhaltens- und Systemmetriken aktiv überwachen müssen.
00:13:19Sie benötigen außerdem Alarmierungsregeln, die Qualität, Sicherheit und Performance ständig im Auge behalten, damit Probleme frühzeitig erkannt werden, bevor sie zu großen Produktionsfehlern führen.
00:13:28Deployment ist im Wesentlichen eine kontrollierte Aktivierung mit kontinuierlicher Beobachtung, während echte Nutzer mit dem System interagieren.
00:13:34Anstatt sich nur auf den Systemzustand zu konzentrieren, fokussieren Sie sich auf die Verhaltensleistung, damit Probleme frühzeitig erkannt werden, bevor sie alle Nutzer betreffen.
00:13:41In der Praxis geben Sie das System zunächst für eine begrenzte Gruppe von Nutzern frei und lassen es unter realen Bedingungen testen.
00:13:46Dann beobachten Sie, wie das agentische System über die Zeit reagiert, bevor Sie es schrittweise für alle ausrollen.
00:13:52Nachdem die Implementierung alle Prozesse durchlaufen hat, wird sie zu einem fortlaufenden Zyklus aus Wartung, kontinuierlichem Lernen und Wachstum.
00:13:58Dies ist eine wichtige Phase, da sie den Agenten präzise hält und an den Anforderungen der realen Welt ausrichtet.
00:14:03Bei traditionellen Systemen sind Feedbackschleifen relativ einfach.
00:14:06Ein Nutzer meldet einen Fehler, und ein Entwickler überarbeitet und behebt ihn.
00:14:10Bei agentischen Systemen ist das ganz anders, da sie auf einem kontinuierlichen Verbesserungsprozess basieren, der zu keinem Zeitpunkt stoppt.
00:14:16Der Zyklus verfeinert das Modell fortlaufend, und alle negativen Signale werden zurückgespeist, damit es sein Verhalten im Laufe der Zeit verbessern kann.
00:14:22Dies geschieht in der Regel über UI-Signale wie “Daumen hoch” und “Daumen runter”, um zu erfassen, wie der Nutzer eine Antwort wahrnimmt.
00:14:29Viele Produktionssysteme nutzen bereits ähnliche Mechanismen, wie das Auswählen zwischen mehreren Ausgaben oder das Ranking von Antworten, wie man es von Tools wie ChatGPT oder den Feedback-Systemen in Claude kennt.
00:14:39Diese Signale werden dann in das agentische System zurückgespeist, damit es lernen und sich im Hinblick auf eine bessere Performance weiterentwickeln kann.
00:14:44Außerdem erfolgt eine regelmäßige Aktualisierung von Datenquellen und Embeddings, um sicherzustellen, dass das System aktuell bleibt und nicht unter veralteten Informationen leidet.
00:14:52Die Ausrichtung muss ständig überwacht werden, damit Sicherheit und Guardrails gegen alle Arten von Prompts wirksam bleiben, einschließlich Risiken wie Prompt Injection.
00:15:00Die Schlüsselvariablen hierbei sind fortlaufendes Kostenmanagement, Qualitätsverfolgung, Produktverbesserungs-Backlogs und Modell-Upgrades, die alle kontinuierlich gepflegt werden müssen, um das System über die Zeit stabil, sicher und betriebsbereit zu halten.
00:15:11Damit sind wir am Ende dieses Videos angelangt.
00:15:13Wenn Sie den Kanal unterstützen und uns dabei helfen möchten, weiterhin Videos wie dieses zu machen, können Sie dies über den Super Thanks-Button unten tun.
00:15:20Wie immer vielen Dank fürs Zuschauen, und wir sehen uns im nächsten Video.

Key Takeaway

Der Agentic Development Lifecycle (ADLC) ersetzt den statischen SDLC durch ein siebenteiliges, probabilistisches Framework, das den Nicht-Determinismus von KI-Agenten durch kontinuierliche Evaluation, Verhaltensplanung und Mensch-Agenten-Verantwortungsmodelle beherrscht.

Highlights

  • Kônstliche Intelligenz übernimmt zunehmend das Schreiben von Code, wodurch der traditionelle Software Development Lifecycle (SDLC) für autonome Systeme versagt.

  • Der Agentic Development Lifecycle (ADLC) führte ein probabilistisches Modell ein, da identische Inputs bei KI-Agenten aufgrund von Kontext und Modellen fast nie zu exakt denselben Outputs führen.

  • Die erste Phase des ADLC erfordert die Formulierung überprüfbarer Hypothesen und die Definition des Mensch-Agenten-Verantwortungsmodells, um die Letztverantwortung beim Menschen zu belassen.

  • Die Erfolgsmetriken verschieben sich im ADLC fundamental von funktionaler Korrektheit (Bestanden/Fehlgeschlagen) hin zu Genauigkeitsverteilung, Halluzinationsrate und Kosten pro Ergebnis.

  • Das Deployment stellt im ADLC nicht mehr den Abschluss der Entwicklung dar, sondern den Beginn einer aktiven Überwachung von Modell-Updates, Kontext-Drift und Verhaltensleistung.

  • Produktionssysteme nutzen kontinuierliche Feedbackschleifen wie UI-Signale (­Daumen hoch/runter) und regelmäßige Aktualisierungen von Embeddings, um das Verhalten des Agenten im Laufe der Zeit zu optimieren.

Timeline

Das Versagen des SDLC und die Notwendigkeit des ADLC

  • Traditionelle Softwareentwicklungsmodelle wie der SDLC stoben an unlösbare Probleme, da sich moderne KI-Systeme nicht mehr statisch verhalten.
  • KI-Tools wie Claude Code und Cursor verschieben den Fokus der Entwicklung weg vom rein repetitiven Schreiben von Code.
  • Der Hauptgrund für das Entstehen des ADLC ist der Nicht-Determinismus von KI-Agenten in der Produktionsumgebung.

Seit Jahrzehnten strukturiert der SDLC die Softwareentwicklung in Phasen von Design bis Wartung. Dieses Modell basiert auf der Annahme, dass das Systemverhalten deterministisch und vorab prüfbar ist. KI-Agenten agieren jedoch probabilistisch und verändern ihre Aufgaben durch logisches Denken und Kontextanpassung. Da die Ergebnisse von Prompts, Modellen und externen Tools abhängen, sind traditionelle Erfolgsmetriken nicht mehr anwendbar.

Vorbereitung, Hypothesenbildung und Analyse im ADLC

  • Die erste Phase des ADLC fokussiert sich auf das Verhaltensdesign des Agenten und das Aufstellen testbarer Hypothesen statt der direkten Code-Implementierung.
  • Die Machbarkeitsphase definiert geschäftliche und technische KPIs wie Latenz, Kosten, Token-Ökonomie und Autonomiegrenzen.
  • Das Mensch-Agenten-Verantwortungsmodell stellt eine verbindliche Rechenschaftsstruktur auf, die die Letztverantwortung beim Menschen belässt.

Im Gegensatz zum SDLC, wo derselbe Input stets denselben Output liefert, plant der ADLC das Systemverhalten probabilistisch. Die Aktivierung des Planungsmodus im KI-Agenten dient dazu, manuelle Workflows der Stakeholder zu analysieren und Fehlerquellen vorab zu identifizieren. Ohne die Definition von klaren KPIs und Autonomiegrenzen drohen Compliance-Verstöße in der Produktion. Die resultierende Dokumentation sichert ab, dass Fehler im System nicht blind auf das Modell geschoben werden.

Systemarchitektur und die Validierungsschranke der Simulation

  • In der Designphase wird das spezifische Agenten-Muster wie ReAct oder ein Multi-Agenten-Setup inklusive des Datenflusses festgelegt.
  • Die Simulationsphase nutzt reale Daten und Ground-Truth-Dokumente, um risikoreiche Annahmen als Prototyp kostengünstig zu validieren.
  • Das Ergebnis dieser Phase entscheidet als Validierungsschranke über die Fortführung oder den sofortigen Abbruch des Projekts.

Das Design erfordert eine exakte Token-Ökonomie und Funktionen zur Kontextkompaktierung, um die Kosten bei der Skalierung zu kontrollieren. Bevor Code geschrieben wird, legt Test-Driven Development (TDD) fest, wie Erfolg definiert ist. In der anschließenden Simulation werden Halluzinationsraten, Datenqualität und Antwortqualität gemessen. Das Erstellen von frühen Prototypen minimiert finanzielle Schäden, die durch ein unkontrolliertes Fehlverhalten in der Produktion entstehen würden.

Orchestrierung, Kontextmanagement und kontinuierliches Testen bei der Implementierung

  • Die Systemlogik verteilt sich im ADLC über Code, Prompts, Modelle, externe APIs und Model Context Protocols (MCP).
  • Die Steuerung komplexer Workflows erfolgt über eine zentrale Orchestrierungsebene wie die Agenten-Ansicht in Claude Code.
  • Das Testparadigma wandelt sich von vordefinierten Codepfaden zur kontinuierlichen Evaluierung von logischem Denken mittels Frameworks wie RAGAS oder DEEPVAL.

Die Implementierung erfordert ein striktes Kontextmanagement, da irrelevante Informationen im Kontextfenster die Aufmerksamkeit des Agenten verschlechtern. Entwicklung und Validierung sind in dieser Phase untrennbar miteinander verknühpft, da kleinste Änderungen massive Auswirkungen auf den gesamten Workflow haben. Getestet wird unter produktionsnahen Bedingungen auf funktionale, nicht-funktionale und strukturelle Faktoren. Statt einfacher Binärtests (Bestanden/Fehlgeschlagen) misst man kontinuierlich die Genauigkeitsverteilung.

Kontrolliertes Deployment und die Feedbackschleifen des kontinuierlichen Lernens

  • Das Deployment im ADLC markiert den Beginn einer kontinuierlichen Überwachung von Kontext-Drift, Umgebungsveränderungen und Modell-Updates.
  • Der schrittweise Rollout für begrenzte Nutzergruppen ermöglicht die Echtzeit-Analyse der Verhaltensleistung unter realen Bedingungen.
  • Kontinuierliches Lernen verarbeitet negative Nutzersignale und schützt das System durch adaptive Guardrails vor Risiken wie Prompt Injections.

Im SDLC führte das Deployment in eine stabile Betriebsphase, während der ADLC eine permanente Überwachung von Verhaltensmetriken erfordert. Alarmierungsregeln müssen Systemfehler abfangen, bevor sie alle Nutzer betreffen. Zur langfristigen Qualitätssicherung werden UI-Feedbackmechanismen wie Rankings oder Daumen-Signale direkt in das System zurückgespeist. Gleichzeitig müssen Datenquellen und Embeddings ständig aktualisiert werden, um veraltete Informationen zu verhindern und die Stabilität zu garantieren.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video