Der "PI"-Codierungs-Agent ist so viel mehr als nur ein weiterer fantastischer KI-Entwickler!

MMaximilian Schwarzmüller
Computing/SoftwareSmall Business/StartupsStocksInternet Technology

Transcript

00:00:00Ich muss über noch einen weiteren Coding-Agenten sprechen. Und ich weiß, ich weiß, ich habe bereits Videos
00:00:07und Kurse zu Claude Code und Codex erstellt, weil beide fantastisch sind. Und dann gibt es natürlich noch
00:00:15Cursor und GitHub Copilot – dazu habe ich auch einen Kurs, Links findet ihr unten. Aber heute
00:00:21möchte ich über den Pi Coding-Agenten sprechen, auch weil er so viel mehr als nur ein Coding-Agent ist.
00:00:31Nochmals: All diese Tools führen ans Ziel. Es gibt keine falsche oder richtige Wahl. Und ich verstehe total,
00:00:38dass sich das alles wieder wie die Framework-Kriege anfühlt, die JavaScript-Framework-Kriege von 2019,
00:00:46als jede Woche ein neues, glänzendes Tool herauskam. Und ja, bis zu einem gewissen Grad ist es wohl so.
00:00:53Aber andererseits, genau wie damals: Wenn wir ehrlich sind, spielt es keine so große Rolle,
00:01:00welches man wählt. Dies ist auch kein gesponsertes Video und ich habe keinen Kurs dazu.
00:01:06Ich denke einfach aufrichtig, dass dieser Pi Coding-Agent ein Tool ist, das ihr euch mal ansehen solltet.
00:01:13Im Gegensatz zu Codex und Claude Code oder Open Code gibt es hier zum Beispiel kein festes Abo,
00:01:20das man abschließen muss. Open Code kann man natürlich auch ohne Abo nutzen, indem man ein anderes
00:01:27Abonnement wie das von Codex verwendet oder pro Nutzung zahlt. Beim Pi Coding-Agenten
00:01:32hat man nur die Wahl zwischen Pay-per-Use oder der Nutzung eines anderen Abos. Zum Beispiel
00:01:39habe ich es hier auf meinem System installiert und nutze es mit meinem Codex-Abo, das ich
00:01:45sonst mit der Codex-App oder dem CLI nutze, aber eben auch hier verwenden kann. Ich glaube, man kann es auch
00:01:50mit dem Anthropic- bzw. Claude-Code-Abo nutzen, aber ihr habt vielleicht gehört, dass die
00:01:55das nicht mögen und das Konto gesperrt werden könnte, soweit ich weiß. Nun, was ist so besonders
00:02:00an diesem Pi-Ding? Warum sollte man es anstelle des regulären Codex-CLI verwenden? Es gibt ein paar Gründe.
00:02:08Zum einen ist Pi – dieser Agent – auf eine positive Art super schlank und einfach gehalten. Er hat einen sehr minimalen System-Prompt
00:02:20und kommt nur mit wenigen Werkzeugen aus. Im Wesentlichen sind das, soweit ich weiß – falls sich das nicht geändert hat –
00:02:28nur Read, Write, Edit und ein Bash-Tool. Und das Bash-Tool ist natürlich das mächtigste,
00:02:36denn wenn man ein Bash-Tool hat, hat man im Grunde Zugriff auf alles. Man kann nämlich
00:02:44das gesamte System, die gesamte Maschine nur über die Bash, also die Kommandozeile, steuern,
00:02:50da man von dort aus eine Vielzahl anderer Tools aufrufen kann. Und wie sich herausstellt –
00:02:55was ich auch in einem anderen Video behandelt habe –, scheinen CLIs derzeit das Wichtigste zu sein,
00:03:03das man seinen Coding-Agenten zur Verfügung stellen sollte. Sie sind wirklich gut darin, CLIs zu bedienen,
00:03:10selbst solche, die sie noch nie zuvor gesehen haben. Und natürlich können Agenten über CLIs –
00:03:15Kommandozeilenschnittstellen oder Tools von Drittanbietern – eine Menge auf dem Computer erledigen. Sie können
00:03:21HTTP-Anfragen senden, Skripte erstellen und ausführen, JSON-Daten parsen und vieles mehr.
00:03:29Das ist die Philosophie hinter diesem Pi-Agenten: Sehr minimal, aber mit Zugriff auf das mächtigste Tool,
00:03:35die Bash, damit er im Grunde alles tun kann. Kombiniert mit einem sehr minimalen, integrierten System-Prompt,
00:03:41erhält man einen Agenten mit einem Kontextfenster, das nicht überladen und extrem flexibel ist,
00:03:50um genau das zu tun, was man von ihm verlangt. Und
00:03:57ihre ganze Philosophie ist wirklich: Statt alles vollzustopfen, bekommt man einen Agenten,
00:04:04der extrem erweiterbar ist. Man kann sogenannte Extensions installieren – darauf kommen wir noch zurück.
00:04:10Man kann Agent Skills nutzen. Ich beziehe mich hier auf diesen offiziellen Standard – was irgendwie ein Standard ist,
00:04:17schätze ich, auch wenn Tools ihn unterschiedlich implementieren. Aber die Kernidee hinter Agent Skills ist,
00:04:24dass man Skill-Verzeichnisse und Skill-MD-Dateien hat, die Prompts oder extra Kontext enthalten.
00:04:31Diese werden bei Bedarf geladen – nicht sofort alle, sondern erst dann, wenn sie für die Aufgabe benötigt werden.
00:04:39Zum Beispiel habe ich hier in dieser laufenden Pi-Session eine Reihe von Skills geladen.
00:04:46Einige globale Skills, mit denen ich experimentiert habe, und einige, die wirklich praktisch sind,
00:04:53wie zum Beispiel ein Code-Research-Skill. Wenn ich mir den mal ansehe,
00:04:59sieht man, dass das nur eine Markdown-Datei mit einem Namen und einer Beschreibung ist. Die Beschreibung ist
00:05:03bei diesen Skills natürlich super wichtig, denn sie bringt den Agenten letztlich dazu,
00:05:08einen Skill tatsächlich zu aktivieren und zu nutzen. Er lädt den Rest der Datei erst dann,
00:05:16wenn er anhand von Name und Beschreibung entscheidet, dass der Skill für die Aufgabe relevant ist. Und das ist dann
00:05:21wiederum nur etwas zusätzlicher Kontext oder ein Prompt. In diesem Fall sage ich jedem interessierten Agenten
00:05:26wie Pi oder auch Codex, falls er diesen Skill lädt, wie Code-Recherche durchgeführt werden soll.
00:05:32Dass das MC-Porter-Tool von Peter Steinberger genutzt werden soll, um auf andere MCP-Server zuzugreifen,
00:05:38wie den Deep Wiki MCP-Server. Das ist ein Server, mit dem man GitHub-Repositories erkunden und mehr
00:05:46über sie erfahren kann, sowie einige andere Tools für die Recherche. Und das ist ein weiterer wichtiger Punkt:
00:05:51Thema MCP. Der Pi-Agent hat keine direkte Unterstützung für MCP. Der Grund dafür ist,
00:05:58dass MCPs dazu neigen, das Kontextfenster extrem zu füllen. Es gibt sehr viele Informationen über
00:06:05verfügbare MCP-Tools und Ressourcen, die in das Kontextfenster geladen werden müssen,
00:06:10damit die KI sie kennt. Das Team bzw. die Person hinter Pi möchte das nicht.
00:06:18Das ist die Überlegung dahinter. Diese Meinung teilen viele andere Leute, ich eingeschlossen.
00:06:23Ich weiß, es gibt Lösungen wie die MCP-Suche dafür, aber dennoch: kein nativer MCP-Support hier.
00:06:28Man braucht ihn auch nicht, wenn man so etwas wie das MC-Porter-Tool verwendet. Und
00:06:35wenn ich “verwende” sage, meine ich, dass ich der KI sage, wie sie dieses Tool bei Bedarf aufrufen soll,
00:06:43wenn sie tatsächlich mit MCP arbeiten möchte. So muss nichts vorinstalliert oder permanent
00:06:49im Kontextfenster präsent sein. Ihr versteht das Prinzip: Es ist wirklich minimal und schlank.
00:06:54Das ist die Kernstory des Pi Coding-Agenten. Ich erwähnte es bereits:
00:07:01Ein weiterer großer Pluspunkt ist seine Erweiterbarkeit. Und das betrifft nicht nur Skills,
00:07:08sondern in erster Linie die Extensions. Die Idee dahinter ist, dass dieser Pi Coding-Agent
00:07:16First-Party-Support für Erweiterungen bietet. Man kann sich in verschiedene Teile des Agenten einklinken,
00:07:22in verschiedene Schritte des agentischen Loops. Während der Agent arbeitet, kann man ihn
00:07:30auf vielfältige Weise anpassen und erweitern. Man könnte zum Beispiel MCP-Support hinzufügen, wenn man wollte.
00:07:36Ich habe selbst ein paar Extensions eingerichtet. Zum Beispiel habe ich über eine Extension einen Planungsmodus hinzugefügt.
00:07:41Das ist möglich. Standardmäßig ist kein Planungsmodus eingebaut, aber Pi ist so erweiterbar,
00:07:47dass man einen hinzufügen kann, der den Agenten daran hindert, die Write- oder Edit-Tools zu benutzen.
00:07:53Solange er im Planungsmodus ist, erlaubt diese Extension das Einrichten eines Shortcuts zum Umschalten.
00:08:00Man kann auch das Terminal-UI aktualisieren, um dem Benutzer anzuzeigen, dass der Planungsmodus aktiv ist.
00:08:07Man kann extra Slash-Befehle wie /plan hinzufügen. Das schaltet in den Planungsmodus und gibt diesen
00:08:14Indikator hier aus. Jetzt wären bestimmte Tools blockiert, und ich kann den Modus wieder verlassen.
00:08:20Solche Dinge sind mit Extensions machbar. Es gibt außerdem
00:08:24eine Art offiziellen Extension-Marktplatz, denn dieser Pi-Agent ermöglicht es auch,
00:08:31eigene Extensions oder Skills zu bündeln und mit anderen zu teilen. Leute wie du und ich
00:08:36können diese Pakete dann installieren, um Erweiterungen von anderen zu nutzen.
00:08:40Es gibt Dinge wie Sub-Agenten, die man über ein Paket hinzufügen kann, oder das Web-Access-Paket.
00:08:47Letzteres ist großartig, da es dem Agenten Werkzeuge für Web-Recherche und effizientes Abrufen von Website-Inhalten gibt.
00:08:54Ihr versteht das Prinzip: Es ist extrem erweiterbar. Man bekommt einen minimalen Kern,
00:09:00den man beliebig ausbauen kann, mit beliebigen Skills und Extensions. Das allein ist schon
00:09:06wirklich interessant. Denn bei Claude Code, Codex und all diesen anderen Tools bekommt man
00:09:12vorgefertigte Werkzeuge, die out-of-the-box mächtiger, aber eben auch weniger erweiterbar sind.
00:09:20Bei Pi ist es genau umgekehrt: Ein minimaler Kern, den man in alles Mögliche verwandeln kann.
00:09:28Und das geht global, aber auch pro Projekt, da all diese Skills und Extensions
00:09:33entweder global oder projektspezifisch installiert werden können. Das macht ihn so vielseitig,
00:09:39und deshalb ist er einen Blick wert. Ich habe ihn in den letzten Wochen viel genutzt.
00:09:46Zusätzlich zu Claude Code und Codex wechsle ich ständig hin und her, auch weil sich diese Tools so schnell
00:09:51entwickeln. Pi gefällt mir wirklich gut. Und hier ist das Interessante:
00:09:59Man ist nicht darauf beschränkt, Pi nur fürs Programmieren zu nutzen. Er wird zwar Coding-Agent genannt,
00:10:08und das ist primär der Einsatzzweck, für den man ihn – und für den auch ich ihn – meistens verwendet.
00:10:15Aber man ist nicht darauf festgelegt. Ich habe zum Beispiel das Web-Access-Paket installiert
00:10:21und es mit meinem Gemini-API-Key verknüpft, um diesem Pi-Agenten vollen Zugriff auf
00:10:30Web-Recherche über die Gemini-API zu geben. Daher könnte ich diesen Agenten außerhalb jedes
00:10:35Coding-Projekts starten und ihm eine Aufgabe wie diese geben: Recherchiere die letzten sieben Tage
00:10:41der Apple- und Nvidia-Aktien, rufe die Kurse ab und analysiere ihre Performance über diesen Zeitraum.
00:10:46Wenn ich das mache, legt er los. Er wird einen Weg finden,
00:10:55die Kursdaten dieser Aktien abzurufen. Er macht eine Websuche, besucht vielleicht die
00:11:04Investor-Relations-Seiten – mal sehen. Er wird dann natürlich auch die Berechnungen anstellen,
00:11:12ein temporäres Skript erstellen oder Ähnliches. Schauen wir mal. Hier hat er zum Beispiel einen
00:11:18Web-Research-Skill aktiviert, den ich hinzugefügt habe, um ihm mehr Details zur Vorgehensweise zu geben.
00:11:23Er versucht es dann. Hier gab es ein Problem, weil ich Python bzw. das executable nicht so installiert habe,
00:11:29wie er dachte. Es hätte “python3” sein müssen – das hat er selbst herausgefunden. Er schrieb dann
00:11:34ein Skript, mit dem er mithilfe von Python Daten von einer Website abgerufen hat. Dieses temporäre Skript
00:11:40hat er ausgeführt und anscheinend einige Aktienkurse erhalten. Danach wird er sehr wahrscheinlich
00:11:47ein weiteres kleines Skript schreiben, um die Berechnungen durchzuführen und
00:11:55die Kursveränderungen zu ermitteln. Nach einer Weile Arbeit und viel Recherche zu allen möglichen
00:12:01Dingen, inklusive News-Recherche, ist er fertig. Er liefert mir die letzten sieben Tage für Apple
00:12:08und Nvidia und zeigt, wie sich die Aktien entwickelt haben. Er gibt mir Performance-Zusammenfassungen
00:12:14und eine verbale Analyse aus, die die Ergebnisse wie in einem Management-Bericht zusammenfasst.
00:12:23All das wurde von diesem Pi Coding-Agenten erledigt, nur mit den Extensions und Skills, die ich ihm gab.
00:12:29Kein Code von meiner Seite, keine speziellen Anweisungen, welche Seiten er besuchen soll. Er tat das alles allein.
00:12:36Man könnte das absolut auch mit Claude Code oder Codex machen, denn letztlich sind das alles
00:12:43KI-Agenten mit Werkzeugen, um Aufgaben zu erledigen. Und obwohl sie primär fürs Coding gedacht sind,
00:12:50kann man sie natürlich für alles Mögliche “missbrauchen”. Denn am Ende umfasste diese Aufgabe
00:12:56auch das Abrufen von Websites und Schreiben von Skripten, was Coding-Projekten sehr ähnlich ist,
00:13:01bei denen man Dokumentationen abruft und Code schreibt, oder? Er kann also noch viel mehr.
00:13:06Der Grund, warum Pi meiner Meinung nach für solche Aufgaben etwas besser ist als Codex oder Claude,
00:13:11ist dieser minimale Kern, der exakt auf das gewünschte Tool zugeschnitten werden kann,
00:13:17sogar auf Projektbasis. Man könnte ein Projekt auf dem System haben, das ein Recherche-Experte ist,
00:13:24ein anderes Projekt mit einem Aktien-Experten und ein drittes Projekt
00:13:29mit einem völlig anderen Experten – zum Beispiel für die Analyse des Systems oder der Festplattenbelegung.
00:13:37Das ist wahrscheinlich auch der Grund, warum OpenClaw intern Pi nutzt.
00:13:42Hier bin ich auf Deep Wiki für das OpenClaw-Repository. Falls ihr es nicht kennt: Es ist eine tolle Website,
00:13:50um mehr über GitHub-Repositories zu erfahren. Sie analysiert sie und erstellt on-the-fly eine Dokumentation
00:13:55basierend auf dem Code. Man kann auch mit dem Repository chatten. Hier könnte ich fragen:
00:14:00Nutzt OpenClaw intern den Pi Coding-Agenten? Falls ja, wie? Das System analysiert den Code,
00:14:05den es bereits geladen hat. Es sagt mir: Ja, OpenClaw nutzt Pi, und erklärt dann,
00:14:12wie genau das implementiert ist. Das ist also der Pi Coding-Agent. Ich wollte ihn einfach mal vorstellen.
00:14:18Nicht, weil ich etwas daran verdiene – ich habe keinen Kurs, gar nichts. Aber es ist ein tolles Tool,
00:14:24besonders wenn man mit Agenten für Aufgaben abseits des Programmierens experimentieren möchte.
00:14:31Aber um ganz klar zu sein: Er ist natürlich auch für Coding-Aufgaben gedacht. Er kann beides.
00:14:38Es ist ein sehr vielseitiger KI-Agent. Man kann sogar eigene Tools darauf aufbauen, wie man bei OpenClaw sieht.
00:14:44Das geht auch mit Codex, aber der minimale Kern hier ist wirklich fantastisch.
00:14:50Zusätzlich zu Codex oder Claude Code – oder statt ihnen – ist Pi einen Blick wert.
00:14:56Ich hatte in den letzten Wochen viel Spaß damit und bin gespannt,
00:15:02wohin die Reise mit diesen Agenten geht und was wir in einem Jahr damit machen können. Es ist
00:15:09ein bisschen beängstigend, muss ich sagen, aber auch extrem interessant. Eine seltsame Mischung.
00:15:14wohin die ganze Reise mit den Agenten geht und was wir in einem Jahr damit machen können. Es ist
00:15:18alles ein bisschen beängstigend, muss ich sagen, aber auch sehr, sehr interessant. Eine eigenartige Mischung.

Key Takeaway

Der Pi-Codierungs-Agent ist ein hochgradig flexibler, minimaler KI-Assistent, der durch seine modulare Erweiterbarkeit weit über die reine Programmierung hinaus für komplexe Automatisierungsaufgaben eingesetzt werden kann.

Highlights

Der Pi-Codierungs-Agent zeichnet sich durch einen extrem minimalen System-Prompt und Kern aus.

Im Gegensatz zu anderen Tools bietet Pi volle Flexibilität bei der Wahl des Abonnements (Pay-per-Use oder Integration bestehender Abos).

Die Erweiterbarkeit durch Skills und Extensions ermöglicht maßgeschneiderte Workflows für Projekte.

Pi verzichtet auf nativen MCP-Support, um das Kontextfenster nicht unnötig mit Tool-Metadaten zu überladen.

Obwohl als Coding-Agent konzipiert, eignet sich das Tool hervorragend für allgemeine Recherche- und Analyseaufgaben.

Die Architektur erlaubt es, Pi als Kern für eigene Anwendungen zu nutzen, wie das Beispiel OpenClaw zeigt.

Timeline

Einführung in die Welt der Coding-Agenten

Der Sprecher führt den Pi-Codierungs-Agenten als eine spannende Alternative zu etablierten Tools wie Claude Code, Codex oder Cursor ein. Er vergleicht die aktuelle Dynamik bei KI-Tools mit den "JavaScript-Framework-Kriegen" von 2019, in denen ständig neue Optionen erschienen. Es wird betont, dass es keine falsche Wahl gibt, da viele dieser Werkzeuge ans Ziel führen. Besonders hervorgehoben wird, dass dieses Video nicht gesponsert ist und der Sprecher eine ehrliche Empfehlung ausspricht. Der Fokus liegt darauf, warum Pi trotz der Konkurrenz eine Daseinsberechtigung hat.

Preisgestaltung und Philosophie der Schlankheit

Ein entscheidender Vorteil von Pi ist das flexible Preismodell, das ohne festes Abonnement auskommt und stattdessen auf Pay-per-Use setzt. Der Agent ist technisch sehr schlank gehalten und nutzt nur grundlegende Werkzeuge wie Read, Write, Edit und insbesondere die Bash. Über die Bash erhält der Agent Zugriff auf das gesamte System, was ihn trotz des minimalen Kerns extrem mächtig macht. Diese Philosophie sorgt für ein effizientes Kontextfenster, das nicht durch unnötige Vorab-Anweisungen überladen wird. Der Sprecher erklärt, dass die Fähigkeit, CLIs zu bedienen, derzeit das wichtigste Merkmal für KI-Agenten ist.

Erweiterbarkeit durch Skills und MCP-Ansatz

Pi setzt konsequent auf Erweiterbarkeit durch sogenannte Agent Skills, die in Form von Markdown-Dateien bei Bedarf geladen werden. Diese Skills enthalten spezifische Prompts oder Kontext, der erst dann aktiviert wird, wenn die Aufgabe es erfordert. Ein interessantes Detail ist der bewusste Verzicht auf nativen MCP-Support, um das Kontextfenster vor massiven Metadaten zu schützen. Stattdessen können Tools wie MC-Porter genutzt werden, um MCP-Server nur bei tatsächlichem Bedarf anzusprechen. Dies unterstreicht den Fokus auf Schnelligkeit und Präzision durch Minimierung des Kontext-Rauschens.

Anpassung durch Extensions und Marktplatz

Neben den Skills bietet Pi tiefgreifende Anpassungsmöglichkeiten durch Extensions, die sich direkt in den agentischen Loop einklinken können. Der Sprecher demonstriert dies anhand eines selbst erstellten Planungsmodus, der bestimmte Schreib-Tools blockiert und das UI farblich anpasst. Es existiert eine Art Marktplatz für Erweiterungen, über den Nutzer Pakete für Web-Recherche oder Sub-Agenten teilen und installieren können. Diese Modularität erlaubt es, Pi entweder global oder spezifisch für einzelne Projekte zu konfigurieren. Im Vergleich zu Claude Code bietet Pi somit weniger Out-of-the-Box-Funktionen, aber eine deutlich höhere Flexibilität für Power-User.

Praxisbeispiel: Web-Recherche und Datenanalyse

In einer Live-Demo zeigt der Sprecher, dass Pi weit mehr als nur Code schreiben kann, indem er eine Aktienanalyse für Apple und Nvidia anfordert. Ausgestattet mit einem Web-Access-Paket und einem Gemini-API-Key führt der Agent eigenständig Recherchen durch und korrigiert dabei sogar Installationsfehler bei Python-Skripten. Er erstellt temporäre Skripte zur Datenverarbeitung und generiert am Ende einen professionellen Management-Bericht inklusive Performance-Zusammenfassung. Dieser Prozess verdeutlicht, dass die Grenzen zwischen Coding und allgemeiner Assistenz verschwimmen, sobald ein Agent Zugriff auf Tools hat. Der Sprecher betont, dass Pi durch seine Projektbasiertheit ideal für spezialisierte Experten-Rollen auf dem System ist.

Fazit und Ausblick auf die Agenten-Zukunft

Zum Abschluss wird erwähnt, dass sogar Projekte wie OpenClaw intern auf Pi setzen, was die Robustheit des Tools für Entwickler unterstreicht. Der Sprecher resümiert, dass Pi aufgrund seines minimalen Kerns und der vielseitigen Einsatzmöglichkeiten ein unverzichtbares Werkzeug in seinem Workflow geworden ist. Er äußert eine Mischung aus Faszination und leichtem Unbehagen über die rasante Entwicklung dieser KI-Agenten innerhalb kurzer Zeit. Den Zuschauern wird geraten, Pi als Ergänzung zu anderen Tools zu betrachten und damit zu experimentieren. Die Reise der KI-Agenten stehe erst am Anfang und verspreche eine spannende, wenn auch ungewisse Zukunft.

Community Posts

View all posts