00:00:00Ich muss über noch einen weiteren Coding-Agenten sprechen. Und ich weiß, ich weiß, ich habe bereits Videos
00:00:07und Kurse zu Claude Code und Codex erstellt, weil beide fantastisch sind. Und dann gibt es natürlich noch
00:00:15Cursor und GitHub Copilot – dazu habe ich auch einen Kurs, Links findet ihr unten. Aber heute
00:00:21möchte ich über den Pi Coding-Agenten sprechen, auch weil er so viel mehr als nur ein Coding-Agent ist.
00:00:31Nochmals: All diese Tools führen ans Ziel. Es gibt keine falsche oder richtige Wahl. Und ich verstehe total,
00:00:38dass sich das alles wieder wie die Framework-Kriege anfühlt, die JavaScript-Framework-Kriege von 2019,
00:00:46als jede Woche ein neues, glänzendes Tool herauskam. Und ja, bis zu einem gewissen Grad ist es wohl so.
00:00:53Aber andererseits, genau wie damals: Wenn wir ehrlich sind, spielt es keine so große Rolle,
00:01:00welches man wählt. Dies ist auch kein gesponsertes Video und ich habe keinen Kurs dazu.
00:01:06Ich denke einfach aufrichtig, dass dieser Pi Coding-Agent ein Tool ist, das ihr euch mal ansehen solltet.
00:01:13Im Gegensatz zu Codex und Claude Code oder Open Code gibt es hier zum Beispiel kein festes Abo,
00:01:20das man abschließen muss. Open Code kann man natürlich auch ohne Abo nutzen, indem man ein anderes
00:01:27Abonnement wie das von Codex verwendet oder pro Nutzung zahlt. Beim Pi Coding-Agenten
00:01:32hat man nur die Wahl zwischen Pay-per-Use oder der Nutzung eines anderen Abos. Zum Beispiel
00:01:39habe ich es hier auf meinem System installiert und nutze es mit meinem Codex-Abo, das ich
00:01:45sonst mit der Codex-App oder dem CLI nutze, aber eben auch hier verwenden kann. Ich glaube, man kann es auch
00:01:50mit dem Anthropic- bzw. Claude-Code-Abo nutzen, aber ihr habt vielleicht gehört, dass die
00:01:55das nicht mögen und das Konto gesperrt werden könnte, soweit ich weiß. Nun, was ist so besonders
00:02:00an diesem Pi-Ding? Warum sollte man es anstelle des regulären Codex-CLI verwenden? Es gibt ein paar Gründe.
00:02:08Zum einen ist Pi – dieser Agent – auf eine positive Art super schlank und einfach gehalten. Er hat einen sehr minimalen System-Prompt
00:02:20und kommt nur mit wenigen Werkzeugen aus. Im Wesentlichen sind das, soweit ich weiß – falls sich das nicht geändert hat –
00:02:28nur Read, Write, Edit und ein Bash-Tool. Und das Bash-Tool ist natürlich das mächtigste,
00:02:36denn wenn man ein Bash-Tool hat, hat man im Grunde Zugriff auf alles. Man kann nämlich
00:02:44das gesamte System, die gesamte Maschine nur über die Bash, also die Kommandozeile, steuern,
00:02:50da man von dort aus eine Vielzahl anderer Tools aufrufen kann. Und wie sich herausstellt –
00:02:55was ich auch in einem anderen Video behandelt habe –, scheinen CLIs derzeit das Wichtigste zu sein,
00:03:03das man seinen Coding-Agenten zur Verfügung stellen sollte. Sie sind wirklich gut darin, CLIs zu bedienen,
00:03:10selbst solche, die sie noch nie zuvor gesehen haben. Und natürlich können Agenten über CLIs –
00:03:15Kommandozeilenschnittstellen oder Tools von Drittanbietern – eine Menge auf dem Computer erledigen. Sie können
00:03:21HTTP-Anfragen senden, Skripte erstellen und ausführen, JSON-Daten parsen und vieles mehr.
00:03:29Das ist die Philosophie hinter diesem Pi-Agenten: Sehr minimal, aber mit Zugriff auf das mächtigste Tool,
00:03:35die Bash, damit er im Grunde alles tun kann. Kombiniert mit einem sehr minimalen, integrierten System-Prompt,
00:03:41erhält man einen Agenten mit einem Kontextfenster, das nicht überladen und extrem flexibel ist,
00:03:50um genau das zu tun, was man von ihm verlangt. Und
00:03:57ihre ganze Philosophie ist wirklich: Statt alles vollzustopfen, bekommt man einen Agenten,
00:04:04der extrem erweiterbar ist. Man kann sogenannte Extensions installieren – darauf kommen wir noch zurück.
00:04:10Man kann Agent Skills nutzen. Ich beziehe mich hier auf diesen offiziellen Standard – was irgendwie ein Standard ist,
00:04:17schätze ich, auch wenn Tools ihn unterschiedlich implementieren. Aber die Kernidee hinter Agent Skills ist,
00:04:24dass man Skill-Verzeichnisse und Skill-MD-Dateien hat, die Prompts oder extra Kontext enthalten.
00:04:31Diese werden bei Bedarf geladen – nicht sofort alle, sondern erst dann, wenn sie für die Aufgabe benötigt werden.
00:04:39Zum Beispiel habe ich hier in dieser laufenden Pi-Session eine Reihe von Skills geladen.
00:04:46Einige globale Skills, mit denen ich experimentiert habe, und einige, die wirklich praktisch sind,
00:04:53wie zum Beispiel ein Code-Research-Skill. Wenn ich mir den mal ansehe,
00:04:59sieht man, dass das nur eine Markdown-Datei mit einem Namen und einer Beschreibung ist. Die Beschreibung ist
00:05:03bei diesen Skills natürlich super wichtig, denn sie bringt den Agenten letztlich dazu,
00:05:08einen Skill tatsächlich zu aktivieren und zu nutzen. Er lädt den Rest der Datei erst dann,
00:05:16wenn er anhand von Name und Beschreibung entscheidet, dass der Skill für die Aufgabe relevant ist. Und das ist dann
00:05:21wiederum nur etwas zusätzlicher Kontext oder ein Prompt. In diesem Fall sage ich jedem interessierten Agenten
00:05:26wie Pi oder auch Codex, falls er diesen Skill lädt, wie Code-Recherche durchgeführt werden soll.
00:05:32Dass das MC-Porter-Tool von Peter Steinberger genutzt werden soll, um auf andere MCP-Server zuzugreifen,
00:05:38wie den Deep Wiki MCP-Server. Das ist ein Server, mit dem man GitHub-Repositories erkunden und mehr
00:05:46über sie erfahren kann, sowie einige andere Tools für die Recherche. Und das ist ein weiterer wichtiger Punkt:
00:05:51Thema MCP. Der Pi-Agent hat keine direkte Unterstützung für MCP. Der Grund dafür ist,
00:05:58dass MCPs dazu neigen, das Kontextfenster extrem zu füllen. Es gibt sehr viele Informationen über
00:06:05verfügbare MCP-Tools und Ressourcen, die in das Kontextfenster geladen werden müssen,
00:06:10damit die KI sie kennt. Das Team bzw. die Person hinter Pi möchte das nicht.
00:06:18Das ist die Überlegung dahinter. Diese Meinung teilen viele andere Leute, ich eingeschlossen.
00:06:23Ich weiß, es gibt Lösungen wie die MCP-Suche dafür, aber dennoch: kein nativer MCP-Support hier.
00:06:28Man braucht ihn auch nicht, wenn man so etwas wie das MC-Porter-Tool verwendet. Und
00:06:35wenn ich “verwende” sage, meine ich, dass ich der KI sage, wie sie dieses Tool bei Bedarf aufrufen soll,
00:06:43wenn sie tatsächlich mit MCP arbeiten möchte. So muss nichts vorinstalliert oder permanent
00:06:49im Kontextfenster präsent sein. Ihr versteht das Prinzip: Es ist wirklich minimal und schlank.
00:06:54Das ist die Kernstory des Pi Coding-Agenten. Ich erwähnte es bereits:
00:07:01Ein weiterer großer Pluspunkt ist seine Erweiterbarkeit. Und das betrifft nicht nur Skills,
00:07:08sondern in erster Linie die Extensions. Die Idee dahinter ist, dass dieser Pi Coding-Agent
00:07:16First-Party-Support für Erweiterungen bietet. Man kann sich in verschiedene Teile des Agenten einklinken,
00:07:22in verschiedene Schritte des agentischen Loops. Während der Agent arbeitet, kann man ihn
00:07:30auf vielfältige Weise anpassen und erweitern. Man könnte zum Beispiel MCP-Support hinzufügen, wenn man wollte.
00:07:36Ich habe selbst ein paar Extensions eingerichtet. Zum Beispiel habe ich über eine Extension einen Planungsmodus hinzugefügt.
00:07:41Das ist möglich. Standardmäßig ist kein Planungsmodus eingebaut, aber Pi ist so erweiterbar,
00:07:47dass man einen hinzufügen kann, der den Agenten daran hindert, die Write- oder Edit-Tools zu benutzen.
00:07:53Solange er im Planungsmodus ist, erlaubt diese Extension das Einrichten eines Shortcuts zum Umschalten.
00:08:00Man kann auch das Terminal-UI aktualisieren, um dem Benutzer anzuzeigen, dass der Planungsmodus aktiv ist.
00:08:07Man kann extra Slash-Befehle wie /plan hinzufügen. Das schaltet in den Planungsmodus und gibt diesen
00:08:14Indikator hier aus. Jetzt wären bestimmte Tools blockiert, und ich kann den Modus wieder verlassen.
00:08:20Solche Dinge sind mit Extensions machbar. Es gibt außerdem
00:08:24eine Art offiziellen Extension-Marktplatz, denn dieser Pi-Agent ermöglicht es auch,
00:08:31eigene Extensions oder Skills zu bündeln und mit anderen zu teilen. Leute wie du und ich
00:08:36können diese Pakete dann installieren, um Erweiterungen von anderen zu nutzen.
00:08:40Es gibt Dinge wie Sub-Agenten, die man über ein Paket hinzufügen kann, oder das Web-Access-Paket.
00:08:47Letzteres ist großartig, da es dem Agenten Werkzeuge für Web-Recherche und effizientes Abrufen von Website-Inhalten gibt.
00:08:54Ihr versteht das Prinzip: Es ist extrem erweiterbar. Man bekommt einen minimalen Kern,
00:09:00den man beliebig ausbauen kann, mit beliebigen Skills und Extensions. Das allein ist schon
00:09:06wirklich interessant. Denn bei Claude Code, Codex und all diesen anderen Tools bekommt man
00:09:12vorgefertigte Werkzeuge, die out-of-the-box mächtiger, aber eben auch weniger erweiterbar sind.
00:09:20Bei Pi ist es genau umgekehrt: Ein minimaler Kern, den man in alles Mögliche verwandeln kann.
00:09:28Und das geht global, aber auch pro Projekt, da all diese Skills und Extensions
00:09:33entweder global oder projektspezifisch installiert werden können. Das macht ihn so vielseitig,
00:09:39und deshalb ist er einen Blick wert. Ich habe ihn in den letzten Wochen viel genutzt.
00:09:46Zusätzlich zu Claude Code und Codex wechsle ich ständig hin und her, auch weil sich diese Tools so schnell
00:09:51entwickeln. Pi gefällt mir wirklich gut. Und hier ist das Interessante:
00:09:59Man ist nicht darauf beschränkt, Pi nur fürs Programmieren zu nutzen. Er wird zwar Coding-Agent genannt,
00:10:08und das ist primär der Einsatzzweck, für den man ihn – und für den auch ich ihn – meistens verwendet.
00:10:15Aber man ist nicht darauf festgelegt. Ich habe zum Beispiel das Web-Access-Paket installiert
00:10:21und es mit meinem Gemini-API-Key verknüpft, um diesem Pi-Agenten vollen Zugriff auf
00:10:30Web-Recherche über die Gemini-API zu geben. Daher könnte ich diesen Agenten außerhalb jedes
00:10:35Coding-Projekts starten und ihm eine Aufgabe wie diese geben: Recherchiere die letzten sieben Tage
00:10:41der Apple- und Nvidia-Aktien, rufe die Kurse ab und analysiere ihre Performance über diesen Zeitraum.
00:10:46Wenn ich das mache, legt er los. Er wird einen Weg finden,
00:10:55die Kursdaten dieser Aktien abzurufen. Er macht eine Websuche, besucht vielleicht die
00:11:04Investor-Relations-Seiten – mal sehen. Er wird dann natürlich auch die Berechnungen anstellen,
00:11:12ein temporäres Skript erstellen oder Ähnliches. Schauen wir mal. Hier hat er zum Beispiel einen
00:11:18Web-Research-Skill aktiviert, den ich hinzugefügt habe, um ihm mehr Details zur Vorgehensweise zu geben.
00:11:23Er versucht es dann. Hier gab es ein Problem, weil ich Python bzw. das executable nicht so installiert habe,
00:11:29wie er dachte. Es hätte “python3” sein müssen – das hat er selbst herausgefunden. Er schrieb dann
00:11:34ein Skript, mit dem er mithilfe von Python Daten von einer Website abgerufen hat. Dieses temporäre Skript
00:11:40hat er ausgeführt und anscheinend einige Aktienkurse erhalten. Danach wird er sehr wahrscheinlich
00:11:47ein weiteres kleines Skript schreiben, um die Berechnungen durchzuführen und
00:11:55die Kursveränderungen zu ermitteln. Nach einer Weile Arbeit und viel Recherche zu allen möglichen
00:12:01Dingen, inklusive News-Recherche, ist er fertig. Er liefert mir die letzten sieben Tage für Apple
00:12:08und Nvidia und zeigt, wie sich die Aktien entwickelt haben. Er gibt mir Performance-Zusammenfassungen
00:12:14und eine verbale Analyse aus, die die Ergebnisse wie in einem Management-Bericht zusammenfasst.
00:12:23All das wurde von diesem Pi Coding-Agenten erledigt, nur mit den Extensions und Skills, die ich ihm gab.
00:12:29Kein Code von meiner Seite, keine speziellen Anweisungen, welche Seiten er besuchen soll. Er tat das alles allein.
00:12:36Man könnte das absolut auch mit Claude Code oder Codex machen, denn letztlich sind das alles
00:12:43KI-Agenten mit Werkzeugen, um Aufgaben zu erledigen. Und obwohl sie primär fürs Coding gedacht sind,
00:12:50kann man sie natürlich für alles Mögliche “missbrauchen”. Denn am Ende umfasste diese Aufgabe
00:12:56auch das Abrufen von Websites und Schreiben von Skripten, was Coding-Projekten sehr ähnlich ist,
00:13:01bei denen man Dokumentationen abruft und Code schreibt, oder? Er kann also noch viel mehr.
00:13:06Der Grund, warum Pi meiner Meinung nach für solche Aufgaben etwas besser ist als Codex oder Claude,
00:13:11ist dieser minimale Kern, der exakt auf das gewünschte Tool zugeschnitten werden kann,
00:13:17sogar auf Projektbasis. Man könnte ein Projekt auf dem System haben, das ein Recherche-Experte ist,
00:13:24ein anderes Projekt mit einem Aktien-Experten und ein drittes Projekt
00:13:29mit einem völlig anderen Experten – zum Beispiel für die Analyse des Systems oder der Festplattenbelegung.
00:13:37Das ist wahrscheinlich auch der Grund, warum OpenClaw intern Pi nutzt.
00:13:42Hier bin ich auf Deep Wiki für das OpenClaw-Repository. Falls ihr es nicht kennt: Es ist eine tolle Website,
00:13:50um mehr über GitHub-Repositories zu erfahren. Sie analysiert sie und erstellt on-the-fly eine Dokumentation
00:13:55basierend auf dem Code. Man kann auch mit dem Repository chatten. Hier könnte ich fragen:
00:14:00Nutzt OpenClaw intern den Pi Coding-Agenten? Falls ja, wie? Das System analysiert den Code,
00:14:05den es bereits geladen hat. Es sagt mir: Ja, OpenClaw nutzt Pi, und erklärt dann,
00:14:12wie genau das implementiert ist. Das ist also der Pi Coding-Agent. Ich wollte ihn einfach mal vorstellen.
00:14:18Nicht, weil ich etwas daran verdiene – ich habe keinen Kurs, gar nichts. Aber es ist ein tolles Tool,
00:14:24besonders wenn man mit Agenten für Aufgaben abseits des Programmierens experimentieren möchte.
00:14:31Aber um ganz klar zu sein: Er ist natürlich auch für Coding-Aufgaben gedacht. Er kann beides.
00:14:38Es ist ein sehr vielseitiger KI-Agent. Man kann sogar eigene Tools darauf aufbauen, wie man bei OpenClaw sieht.
00:14:44Das geht auch mit Codex, aber der minimale Kern hier ist wirklich fantastisch.
00:14:50Zusätzlich zu Codex oder Claude Code – oder statt ihnen – ist Pi einen Blick wert.
00:14:56Ich hatte in den letzten Wochen viel Spaß damit und bin gespannt,
00:15:02wohin die Reise mit diesen Agenten geht und was wir in einem Jahr damit machen können. Es ist
00:15:09ein bisschen beängstigend, muss ich sagen, aber auch extrem interessant. Eine seltsame Mischung.
00:15:14wohin die ganze Reise mit den Agenten geht und was wir in einem Jahr damit machen können. Es ist
00:15:18alles ein bisschen beängstigend, muss ich sagen, aber auch sehr, sehr interessant. Eine eigenartige Mischung.