L'agent de codage « PI » est bien plus qu'un simple outil de programmation incroyable !

MMaximilian Schwarzmüller
Computing/SoftwareSmall Business/StartupsStocksInternet Technology

Transcript

00:00:00Je dois vous parler d'un nouvel agent de codage. Je sais, je sais, j'ai déjà fait des vidéos
00:00:07et des cours sur Claude Code et Codex car ils sont tous les deux incroyables. Il y a aussi
00:00:15Cursor et GitHub Copilot, sur lesquels j'ai aussi un cours, vous trouverez les liens ci-dessous. Mais aujourd'hui,
00:00:21je veux parler de l'agent de codage Pi, car c'est bien plus qu'un simple agent de codage.
00:00:31Encore une fois, tous ces outils sont efficaces. Il n'y a pas de bon ou de mauvais choix. Je comprends tout à fait
00:00:38que cela puisse ressembler à la guerre des frameworks JavaScript de 2019, où
00:00:46chaque semaine sortait un nouvel outil rutilant. Et oui, dans une certaine mesure, c'est un peu ça,
00:00:53je suppose. Mais d'un autre côté, comme à l'époque, si on est honnête, peu importe
00:01:00celui que vous choisissez. Cette vidéo n'est pas sponsorisée et je n'ai pas de cours sur cet outil.
00:01:06Je pense sincèrement que l'agent de codage Pi mérite que vous y jetiez un coup d'œil.
00:01:13Contrairement à Codex, Claude Code ou Open Code par exemple, il n'y a pas de système
00:01:20d'abonnement direct. Avec Open Code, on peut l'utiliser sans abonnement via un autre
00:01:27abonnement comme Codex, ou en payant à l'usage. Avec l'agent Pi,
00:01:32vous n'avez que le paiement à l'usage ou l'utilisation d'un autre abonnement. Par exemple,
00:01:39ici, je l'ai installé sur mon système et je l'utilise avec mon abonnement Codex, que je
00:01:45pourrais utiliser avec l'app ou la CLI Codex, mais que je peux aussi utiliser ici. On peut aussi
00:01:50l'utiliser avec Anthropic, l'abonnement Claude Code, mais vous avez peut-être entendu
00:01:55qu'ils n'apprécient pas ça et que votre compte pourrait être banni, d'après ce que je sais.
00:02:00Qu'est-ce qui rend ce Pi si spécial ? Pourquoi l'utiliser à la place de la CLI Codex classique ? Plusieurs raisons.
00:02:08D'abord, Pi est un agent extrêmement léger et simple, dans le bon sens du terme. Son prompt système
00:02:20est minimal et il ne possède que quelques outils. Essentiellement, pour autant que je sache,
00:02:28il ne dispose que des fonctions lire, écrire, éditer et d'un outil bash. Et l'outil bash
00:02:36est le plus puissant car si vous avez accès au bash, vous avez accès à tout, puisque vous pouvez
00:02:44contrôler l'intégralité de votre système et de votre machine via la ligne de commande,
00:02:50car on peut invoquer de nombreux autres outils depuis celle-ci. Et il s'avère,
00:02:55comme je l'ai mentionné dans une autre vidéo, que les CLI sont actuellement ce qu'il y a de mieux
00:03:03à exposer aux agents de codage. Ils sont très doués pour les utiliser, même
00:03:10celles qu'ils ne connaissent pas. Évidemment, à travers les CLI, les interfaces de ligne de commande
00:03:15ou les outils tiers, vos agents peuvent faire énormément de choses sur votre ordinateur.
00:03:21Envoyer des requêtes HTTP, lancer et exécuter des scripts, parser du JSON, etc.
00:03:29C'est la philosophie de cet agent Pi. Très minimaliste, mais avec accès à l'outil
00:03:35le plus puissant, le bash, pour pouvoir tout faire. Et combiné avec
00:03:41un prompt système très léger et intégré, on obtient un agent dont la fenêtre de contexte
00:03:50n'est pas encombrée et qui est assez flexible pour faire tout ce qu'on lui demande.
00:03:57Toute leur philosophie repose sur le fait qu'au lieu de tout inclure d'office,
00:04:04on a un agent hyper extensible. On peut installer ce qu'on appelle des extensions. On y reviendra.
00:04:10On peut utiliser des “skills” (compétences). Je parle ici de ce standard officiel, qui est une sorte de norme,
00:04:17certains outils l'implémentant différemment. Mais l'idée centrale derrière les compétences
00:04:24est d'avoir des répertoires et des fichiers Markdown contenant des prompts ou du contexte supplémentaire.
00:04:31Ceux-ci sont chargés à la demande, non pas systématiquement, mais “paresseusement” selon les besoins,
00:04:39en fonction de la tâche sur laquelle travaille l'agent. Par exemple, dans cette session Pi en cours,
00:04:46j'ai plusieurs compétences chargées : des globales avec lesquelles j'ai fait des tests,
00:04:53et d'autres très pratiques comme une compétence de recherche de code. Si nous
00:04:59y jetons un œil, on voit que c'est juste un fichier Markdown avec un nom et une description. La description
00:05:03est cruciale pour ces compétences car c'est elle qui permet à l'agent de savoir s'il doit
00:05:08activer et utiliser cette compétence. Il ne charge le reste du fichier que s'il décide que la
00:05:16compétence est pertinente pour la tâche donnée, d'après son nom et sa description. Et ensuite,
00:05:21c'est encore du contexte supplémentaire, un prompt qui, pour ma compétence de recherche,
00:05:26indique à l'agent (comme Pi ou Codex s'il charge cette compétence)
00:05:32comment effectuer cette recherche de code. Je lui dis d'utiliser l'outil MC Porter
00:05:38de Peter Steinberger pour accéder à d'autres serveurs MCP, comme le serveur deep wiki MCP,
00:05:46qui permet d'explorer des dépôts GitHub et d'en apprendre plus sur eux, ainsi que d'autres outils
00:05:51pour faire ses recherches. C'est un point important concernant les MCP : l'agent Pi
00:05:58ne supporte pas nativement le protocole MCP. La raison est que les MCP ont tendance à remplir
00:06:05votre fenêtre de contexte car il y a énormément d'informations sur les outils et ressources
00:06:10MCP disponibles à inclure pour que l'IA en soit consciente. Et l'équipe, ou la personne
00:06:18derrière Pi, ne veut pas de ça. C'est leur raisonnement. C'est un avis partagé par beaucoup,
00:06:23moi y compris. Même s'il existe des solutions comme MCP search, il n'y a toujours
00:06:28pas de support MCP ici. Mais on n'en a pas besoin si on utilise cet outil MC Porter.
00:06:35Quand je dis “utiliser”, je veux dire que j'explique à l'IA comment invoquer MC Porter à la volée lorsqu'elle
00:06:43veut travailler avec MCP, pour éviter que cela soit installé ou exposé en permanence
00:06:49dans la fenêtre de contexte. Vous voyez l'idée : c'est minimaliste et léger. C'est ça l'essentiel
00:06:54de cet agent de codage Pi. Mais comme je l'ai mentionné,
00:07:01l'autre grand point fort de cet agent, c'est son extensibilité. Et ça ne s'arrête pas aux compétences.
00:07:08C'est avant tout une question d'extensions. Le concept est que l'agent Pi possède un support natif
00:07:16pour être étendu, permettant de se brancher sur différentes parties de l'agent,
00:07:22sur différentes étapes de la boucle agentique. Ainsi, quand l'agent travaille, vous pouvez
00:07:30le personnaliser de mille façons. Vous pourriez même ajouter le support MCP si vous vouliez.
00:07:36J'ai moi-même configuré plusieurs extensions. Par exemple, j'ai ajouté un mode “plan” via
00:07:41une extension. Ce n'est pas intégré par défaut, mais c'est tellement extensible
00:07:47qu'on peut en ajouter une qui empêche l'agent d'utiliser les outils d'écriture ou d'édition.
00:07:53Tant qu'on est en mode plan, cette extension permet de définir un raccourci clavier pour basculer
00:08:00vers ce mode. Elle permet aussi de mettre à jour l'interface du terminal pour indiquer à l'utilisateur
00:08:07qu'on est en mode plan. On peut aussi ajouter des commandes slash comme /plan, ce qui active le mode,
00:08:14affiche cet indicateur, bloque certains outils, puis je peux en sortir à tout moment.
00:08:20Voilà le genre de choses possibles avec les extensions. Il existe aussi
00:08:24une sorte de place de marché officielle des extensions car Pi permet de
00:08:31packager ses extensions ou compétences pour les partager. D'autres personnes,
00:08:36comme vous et moi, peuvent installer ces paquets pour utiliser les extensions créées par la communauté.
00:08:40On y trouve des choses comme des sous-agents, qu'on ajoute via un paquet incluant une extension,
00:08:47ou le paquet d'accès au web, qui est génial car il donne à l'agent des outils supplémentaires
00:08:54pour effectuer des recherches en ligne et récupérer du contenu efficacement. Vous voyez le topo : c'est très
00:09:00extensible. Vous avez un noyau minimaliste et vous pouvez l'étendre selon vos envies,
00:09:06ajouter n'importe quelle compétence ou extension. C'est déjà très intéressant en soi car,
00:09:12évidemment, avec Claude Code, Codex et les autres, vous avez des outils pré-intégrés
00:09:20bien plus puissants dès le départ, mais moins extensibles. Avec Pi, c'est l'approche inverse.
00:09:28On part d'un cœur minimal qu'on transforme en ce qu'on veut. Et on peut le faire
00:09:33globalement, mais aussi par projet, car toutes ces compétences et extensions peuvent
00:09:39être installées de manière globale ou locale au projet. C'est ce qui le rend si polyvalent.
00:09:46C'est pour ça qu'il mérite qu'on s'y attarde. Je l'utilise depuis quelques semaines, en plus de
00:09:51Claude Code et Codex. Je passe de l'un à l'autre car ces outils évoluent très vite, et j'aime beaucoup Pi.
00:09:59Mais voici le plus intéressant : vous n'êtes pas limité à l'utiliser uniquement pour coder.
00:10:08Il s'appelle “agent de codage” et c'est sa fonction première, c'est comme ça que je l'utilise
00:10:15la plupart du temps. Mais ce n'est pas une limite. Par exemple, j'ai installé le paquet
00:10:21d'accès au web et je l'ai connecté à ma clé API Gemini pour donner à cet agent Pi
00:10:30un accès complet à la recherche web via l'API Gemini. Je peux donc lancer cet agent
00:10:35en dehors de tout projet de code et lui donner une tâche comme celle-ci :
00:10:41“Fais des recherches sur les actions Apple et Nvidia des sept derniers jours, récupère leurs prix
00:10:46et analyse leurs performances sur cette période.” Et si je lance ça, il va s'exécuter.
00:10:55Il va trouver un moyen de récupérer les données boursières. Il fera une recherche web,
00:11:04visitera peut-être les pages de relations investisseurs, et il fera ensuite les calculs réels,
00:11:12en lançant un script temporaire ou autre. Voyons ce qu'il fait. Ici, il a activé une
00:11:18compétence de recherche web que j'ai ajoutée, où je lui explique comment mener ses recherches. Il essaie
00:11:23de le faire. Il a rencontré un petit problème car Python n'était pas directement accessible via son
00:11:29exécutable standard, il a compris qu'il fallait utiliser “python3”. Il a ensuite
00:11:34écrit un script pour extraire les données d'un site grâce à Python, un script temporaire
00:11:40qu'il a exécuté ici, et il semble avoir obtenu les cours de bourse. Ensuite, il va probablement
00:11:47écrire un petit script pour effectuer les calculs à partir de ces données et analyser
00:11:55les variations de prix. Après avoir travaillé un moment sur diverses recherches, y compris
00:12:01des recherches d'actualités, il a terminé. Il me donne les sept derniers jours pour Apple
00:12:08et Nvidia, en montrant l'évolution des actions. Il me fournit des résumés de performance
00:12:14et une analyse textuelle qui synthétise les résultats pour que je puisse
00:12:23les lire comme un rapport de direction. Tout cela a été fait par cet agent de codage Pi
00:12:29grâce aux extensions et compétences fournies, rien d'autre. Pas de code de ma part, pas d'instructions
00:12:36précises sur les sites à visiter. Il a tout fait seul. On pourrait tout à fait faire ça avec Claude Code
00:12:43ou Codex, car au fond, ce sont tous des agents IA avec des outils pour accomplir des tâches.
00:12:50Même s'ils sont conçus pour le code, on peut les détourner pour faire
00:12:56toutes sortes de choses. Car au final, cette tâche consistait à consulter
00:13:01des sites et écrire des scripts, ce qui est très proche d'un projet de code où on demande
00:13:06de lire de la doc et d'écrire du code, n'est-ce pas ? Il peut donc faire bien d'autres choses.
00:13:11La raison pour laquelle Pi est, selon moi, un peu meilleur pour ce genre de tâches que Codex ou
00:13:17Claude, c'est ce cœur minimaliste qui peut être configuré exactement comme on le souhaite,
00:13:24même par projet. On peut avoir un projet sur son système qui est un expert en recherche,
00:13:29un autre expert en bourse, et un troisième projet avec un profil totalement différent,
00:13:37un expert pour analyser votre système et l'utilisation de votre disque dur,
00:13:42ou n'importe quoi d'autre. C'est probablement aussi la raison pour laquelle OpenClaw
00:13:50utilise Pi en interne. Ici, je suis sur deep wiki pour le dépôt OpenClaw. Si vous ne
00:13:55connaissez pas, c'est un excellent site pour explorer des dépôts GitHub. Il les analyse et
00:14:00génère une documentation à la volée basée sur le code détecté. On peut aussi
00:14:05discuter avec le dépôt. Je pourrais demander : “OpenClaw utilise-t-il l'agent Pi
00:14:12en interne ? Si oui, comment ?”. Il va analyser le code qu'il a déjà chargé et me répondre.
00:14:18Oui, OpenClaw utilise bien l'agent de codage Pi, et il m'explique précisément comment c'est implémenté.
00:14:24Voilà donc l'agent de codage Pi. Je voulais simplement partager ça avec vous. Encore une fois, je ne
00:14:31gagne rien à le faire, je n'ai pas de cours ni rien. Mais c'est un outil formidable, surtout
00:14:38si vous envisagez d'utiliser des agents pour des tâches autres que le codage. Mais bien sûr,
00:14:44pour être très clair, il est aussi excellent pour le code, il fait les deux. C'est un agent
00:14:50IA très polyvalent. On peut même construire ses propres outils par-dessus, comme avec OpenClaw.
00:14:56On peut aussi faire tout ça avec Codex, mais ce noyau minimaliste est vraiment un plus ici.
00:15:02Donc, en complément de Codex ou Claude Code, ou à leur place, cet outil vaut le détour.
00:15:09C'est quelque chose avec lequel je me suis beaucoup amusé ces dernières semaines.
00:15:14J'ai hâte de voir où tout cela nous mènera dans un an. C'est
00:15:18un peu effrayant, je l'admets, mais aussi passionnant. Un mélange étrange.

Key Takeaway

L'agent de codage Pi redéfinit l'assistance IA par un noyau minimaliste et une extensibilité totale, permettant de transformer un simple outil de programmation en un agent polyvalent capable de gérer n'est-ce pas n'importe quelle tâche système ou recherche complexe.

Highlights

L'agent Pi se distingue par son architecture minimaliste et ultra-légère par rapport à Claude Code ou Codex.

L'accès complet à l'outil Bash permet à l'agent de contrôler l'intégralité du système et d'exécuter n'importe quelle commande.

L'utilisation de "skills" (compétences) basées sur des fichiers Markdown permet un chargement paresseux du contexte pour préserver la fenêtre de mémoire.

Une extensibilité exceptionnelle qui permet d'ajouter des modes personnalisés comme le mode "plan" ou des commandes slash.

La polyvalence de l'outil lui permet d'effectuer des tâches non liées au code, telles que l'analyse boursière ou la recherche web.

L'agent Pi fonctionne sur un modèle de paiement à l'usage ou via des abonnements tiers comme Codex, évitant un abonnement direct supplémentaire.

Timeline

Introduction et comparaison avec les outils existants

L'auteur introduit l'agent de codage Pi en le plaçant dans le contexte actuel des outils d'IA comme Claude Code, Codex, Cursor et GitHub Copilot. Il compare la prolifération de ces nouveaux outils à la guerre des frameworks JavaScript de 2019, soulignant qu'il n'y a pas de mauvais choix définitif. Cette présentation initiale précise que la vidéo n'est pas sponsorisée et que l'intérêt pour Pi repose sur ses mérites techniques propres. Le narrateur insiste sur le fait que malgré la saturation du marché, cet agent mérite une attention particulière pour son approche unique. Cette section pose les bases d'une analyse comparative entre les agents lourds et les solutions plus agiles.

Modèle économique et philosophie du minimalisme

Cette partie explore la structure de coût et la philosophie de conception de l'agent Pi, qui ne nécessite pas d'abonnement direct mais fonctionne par paiement à l'usage. L'outil se distingue par un prompt système minimal et un ensemble de fonctions restreint : lire, écrire, éditer et surtout l'outil Bash. L'auteur explique que l'accès au Bash est le levier le plus puissant, car il permet d'invoquer n'importe quelle interface de ligne de commande (CLI) tierce. Cette approche permet de garder une fenêtre de contexte propre tout en offrant une puissance d'action totale sur la machine. Le minimalisme est ici présenté non pas comme une limitation, mais comme une stratégie pour accroître l'efficacité et la flexibilité de l'IA.

Gestion des compétences (Skills) et protocole MCP

Le concept de "skills" est détaillé comme une méthode permettant d'étendre les capacités de l'agent via des répertoires de fichiers Markdown. Ces fichiers contiennent des descriptions que l'IA consulte pour décider de charger ou non du contexte supplémentaire de manière "paresseuse". L'auteur aborde également la question délicate du protocole MCP (Model Context Protocol), que Pi ne supporte pas nativement pour éviter d'encombrer la mémoire. Il démontre comment contourner cela en utilisant l'outil MC Porter pour invoquer des serveurs MCP uniquement lorsque cela est nécessaire. Cette gestion intelligente de l'information assure que l'agent reste rapide et pertinent sans être submergé par des données inutiles.

Extensibilité avancée et personnalisation

L'auteur approfondit l'extensibilité de Pi en expliquant comment les extensions peuvent intervenir à chaque étape de la boucle agentique. Il donne l'exemple concret d'un mode "plan" qu'il a lui-même configuré pour empêcher l'agent d'éditer du code avant d'avoir validé une stratégie. Cette personnalisation inclut des modifications de l'interface du terminal et l'ajout de commandes spécifiques comme /plan. Il mentionne l'existence d'une place de marché pour partager des paquets, incluant des outils de recherche web ou des sous-agents spécialisés. Cette section souligne que l'utilisateur peut transformer le noyau minimal de Pi en un outil parfaitement adapté à ses besoins spécifiques, qu'ils soient globaux ou locaux à un projet.

Démonstration pratique : Analyse boursière et recherche web

Pour prouver que Pi dépasse le cadre du codage, l'auteur effectue une démonstration d'analyse financière sur les actions Apple et Nvidia. En utilisant une extension de recherche web et l'API Gemini, l'agent parvient à naviguer sur internet, extraire des données et écrire des scripts Python temporaires pour effectuer des calculs. L'IA gère d'elle-même les erreurs, comme la correction de la commande d'exécution Python, pour produire un rapport de direction synthétique. Cette capacité à détourner un agent de codage pour des tâches de recherche et d'analyse de données montre la puissance de son architecture flexible. L'expérience utilisateur est ici celle d'un assistant autonome capable de résoudre des problèmes complexes sans instructions étape par étape.

Conclusion et intégration dans l'écosystème

En conclusion, l'auteur explique pourquoi l'architecture de Pi est parfois préférable à celle de Codex ou Claude, notamment pour sa capacité à créer des profils d'experts par projet. Il mentionne OpenClaw comme un exemple concret d'outil utilisant l'agent Pi en interne pour analyser des dépôts GitHub. L'analyse se termine sur une note de réflexion concernant l'évolution rapide de ces technologies, qualifiée à la fois d'effrayante et de passionnante. L'outil est recommandé comme un complément ou une alternative sérieuse pour ceux qui souhaitent expérimenter avec des agents IA hautement configurables. Le message final invite les utilisateurs à explorer le potentiel de l'outil au-delà de sa fonction primaire de programmation.

Community Posts

View all posts