L'agent de codage « PI » est bien plus qu'un simple outil de programmation incroyable !

Françaisالعربية Deutsch English Español हिन्दी Bahasa Indonesia 日本語 한국어 Português Русский 中文

MMaximilian Schwarzmüller

Computing/SoftwareSmall Business/StartupsStocksInternet Technology

Transcript

00:00:00Je dois vous parler d'un nouvel agent de codage. Je sais, je sais, j'ai déjà fait des vidéos

00:00:07et des cours sur Claude Code et Codex car ils sont tous les deux incroyables. Il y a aussi

00:00:15Cursor et GitHub Copilot, sur lesquels j'ai aussi un cours, vous trouverez les liens ci-dessous. Mais aujourd'hui,

00:00:21je veux parler de l'agent de codage Pi, car c'est bien plus qu'un simple agent de codage.

00:00:31Encore une fois, tous ces outils sont efficaces. Il n'y a pas de bon ou de mauvais choix. Je comprends tout à fait

00:00:38que cela puisse ressembler à la guerre des frameworks JavaScript de 2019, où

00:00:46chaque semaine sortait un nouvel outil rutilant. Et oui, dans une certaine mesure, c'est un peu ça,

00:00:53je suppose. Mais d'un autre côté, comme à l'époque, si on est honnête, peu importe

00:01:00celui que vous choisissez. Cette vidéo n'est pas sponsorisée et je n'ai pas de cours sur cet outil.

00:01:06Je pense sincèrement que l'agent de codage Pi mérite que vous y jetiez un coup d'œil.

00:01:13Contrairement à Codex, Claude Code ou Open Code par exemple, il n'y a pas de système

00:01:20d'abonnement direct. Avec Open Code, on peut l'utiliser sans abonnement via un autre

00:01:27abonnement comme Codex, ou en payant à l'usage. Avec l'agent Pi,

00:01:32vous n'avez que le paiement à l'usage ou l'utilisation d'un autre abonnement. Par exemple,

00:01:39ici, je l'ai installé sur mon système et je l'utilise avec mon abonnement Codex, que je

00:01:45pourrais utiliser avec l'app ou la CLI Codex, mais que je peux aussi utiliser ici. On peut aussi

00:01:50l'utiliser avec Anthropic, l'abonnement Claude Code, mais vous avez peut-être entendu

00:01:55qu'ils n'apprécient pas ça et que votre compte pourrait être banni, d'après ce que je sais.

00:02:00Qu'est-ce qui rend ce Pi si spécial ? Pourquoi l'utiliser à la place de la CLI Codex classique ? Plusieurs raisons.

00:02:08D'abord, Pi est un agent extrêmement léger et simple, dans le bon sens du terme. Son prompt système

00:02:20est minimal et il ne possède que quelques outils. Essentiellement, pour autant que je sache,

00:02:28il ne dispose que des fonctions lire, écrire, éditer et d'un outil bash. Et l'outil bash

00:02:36est le plus puissant car si vous avez accès au bash, vous avez accès à tout, puisque vous pouvez

00:02:44contrôler l'intégralité de votre système et de votre machine via la ligne de commande,

00:02:50car on peut invoquer de nombreux autres outils depuis celle-ci. Et il s'avère,

00:02:55comme je l'ai mentionné dans une autre vidéo, que les CLI sont actuellement ce qu'il y a de mieux

00:03:03à exposer aux agents de codage. Ils sont très doués pour les utiliser, même

00:03:10celles qu'ils ne connaissent pas. Évidemment, à travers les CLI, les interfaces de ligne de commande

00:03:15ou les outils tiers, vos agents peuvent faire énormément de choses sur votre ordinateur.

00:03:21Envoyer des requêtes HTTP, lancer et exécuter des scripts, parser du JSON, etc.

00:03:29C'est la philosophie de cet agent Pi. Très minimaliste, mais avec accès à l'outil

00:03:35le plus puissant, le bash, pour pouvoir tout faire. Et combiné avec

00:03:41un prompt système très léger et intégré, on obtient un agent dont la fenêtre de contexte

00:03:50n'est pas encombrée et qui est assez flexible pour faire tout ce qu'on lui demande.

00:03:57Toute leur philosophie repose sur le fait qu'au lieu de tout inclure d'office,

00:04:04on a un agent hyper extensible. On peut installer ce qu'on appelle des extensions. On y reviendra.

00:04:10On peut utiliser des “skills” (compétences). Je parle ici de ce standard officiel, qui est une sorte de norme,

00:04:17certains outils l'implémentant différemment. Mais l'idée centrale derrière les compétences

00:04:24est d'avoir des répertoires et des fichiers Markdown contenant des prompts ou du contexte supplémentaire.

00:04:31Ceux-ci sont chargés à la demande, non pas systématiquement, mais “paresseusement” selon les besoins,

00:04:39en fonction de la tâche sur laquelle travaille l'agent. Par exemple, dans cette session Pi en cours,

00:04:46j'ai plusieurs compétences chargées : des globales avec lesquelles j'ai fait des tests,

00:04:53et d'autres très pratiques comme une compétence de recherche de code. Si nous

00:04:59y jetons un œil, on voit que c'est juste un fichier Markdown avec un nom et une description. La description

00:05:03est cruciale pour ces compétences car c'est elle qui permet à l'agent de savoir s'il doit

00:05:08activer et utiliser cette compétence. Il ne charge le reste du fichier que s'il décide que la

00:05:16compétence est pertinente pour la tâche donnée, d'après son nom et sa description. Et ensuite,

00:05:21c'est encore du contexte supplémentaire, un prompt qui, pour ma compétence de recherche,

00:05:26indique à l'agent (comme Pi ou Codex s'il charge cette compétence)

00:05:32comment effectuer cette recherche de code. Je lui dis d'utiliser l'outil MC Porter

00:05:38de Peter Steinberger pour accéder à d'autres serveurs MCP, comme le serveur deep wiki MCP,

00:05:46qui permet d'explorer des dépôts GitHub et d'en apprendre plus sur eux, ainsi que d'autres outils

00:05:51pour faire ses recherches. C'est un point important concernant les MCP : l'agent Pi

00:05:58ne supporte pas nativement le protocole MCP. La raison est que les MCP ont tendance à remplir

00:06:05votre fenêtre de contexte car il y a énormément d'informations sur les outils et ressources

00:06:10MCP disponibles à inclure pour que l'IA en soit consciente. Et l'équipe, ou la personne

00:06:18derrière Pi, ne veut pas de ça. C'est leur raisonnement. C'est un avis partagé par beaucoup,

00:06:23moi y compris. Même s'il existe des solutions comme MCP search, il n'y a toujours

00:06:28pas de support MCP ici. Mais on n'en a pas besoin si on utilise cet outil MC Porter.

00:06:35Quand je dis “utiliser”, je veux dire que j'explique à l'IA comment invoquer MC Porter à la volée lorsqu'elle

00:06:43veut travailler avec MCP, pour éviter que cela soit installé ou exposé en permanence

00:06:49dans la fenêtre de contexte. Vous voyez l'idée : c'est minimaliste et léger. C'est ça l'essentiel

00:06:54de cet agent de codage Pi. Mais comme je l'ai mentionné,

00:07:01l'autre grand point fort de cet agent, c'est son extensibilité. Et ça ne s'arrête pas aux compétences.

00:07:08C'est avant tout une question d'extensions. Le concept est que l'agent Pi possède un support natif

00:07:16pour être étendu, permettant de se brancher sur différentes parties de l'agent,

00:07:22sur différentes étapes de la boucle agentique. Ainsi, quand l'agent travaille, vous pouvez

00:07:30le personnaliser de mille façons. Vous pourriez même ajouter le support MCP si vous vouliez.

00:07:36J'ai moi-même configuré plusieurs extensions. Par exemple, j'ai ajouté un mode “plan” via

00:07:41une extension. Ce n'est pas intégré par défaut, mais c'est tellement extensible

00:07:47qu'on peut en ajouter une qui empêche l'agent d'utiliser les outils d'écriture ou d'édition.

00:07:53Tant qu'on est en mode plan, cette extension permet de définir un raccourci clavier pour basculer

00:08:00vers ce mode. Elle permet aussi de mettre à jour l'interface du terminal pour indiquer à l'utilisateur

00:08:07qu'on est en mode plan. On peut aussi ajouter des commandes slash comme /plan, ce qui active le mode,

00:08:14affiche cet indicateur, bloque certains outils, puis je peux en sortir à tout moment.

00:08:20Voilà le genre de choses possibles avec les extensions. Il existe aussi

00:08:24une sorte de place de marché officielle des extensions car Pi permet de

00:08:31packager ses extensions ou compétences pour les partager. D'autres personnes,

00:08:36comme vous et moi, peuvent installer ces paquets pour utiliser les extensions créées par la communauté.

00:08:40On y trouve des choses comme des sous-agents, qu'on ajoute via un paquet incluant une extension,

00:08:47ou le paquet d'accès au web, qui est génial car il donne à l'agent des outils supplémentaires

00:08:54pour effectuer des recherches en ligne et récupérer du contenu efficacement. Vous voyez le topo : c'est très

00:09:00extensible. Vous avez un noyau minimaliste et vous pouvez l'étendre selon vos envies,

00:09:06ajouter n'importe quelle compétence ou extension. C'est déjà très intéressant en soi car,

00:09:12évidemment, avec Claude Code, Codex et les autres, vous avez des outils pré-intégrés

00:09:20bien plus puissants dès le départ, mais moins extensibles. Avec Pi, c'est l'approche inverse.

00:09:28On part d'un cœur minimal qu'on transforme en ce qu'on veut. Et on peut le faire

00:09:33globalement, mais aussi par projet, car toutes ces compétences et extensions peuvent

00:09:39être installées de manière globale ou locale au projet. C'est ce qui le rend si polyvalent.

00:09:46C'est pour ça qu'il mérite qu'on s'y attarde. Je l'utilise depuis quelques semaines, en plus de

00:09:51Claude Code et Codex. Je passe de l'un à l'autre car ces outils évoluent très vite, et j'aime beaucoup Pi.

00:09:59Mais voici le plus intéressant : vous n'êtes pas limité à l'utiliser uniquement pour coder.

00:10:08Il s'appelle “agent de codage” et c'est sa fonction première, c'est comme ça que je l'utilise

00:10:15la plupart du temps. Mais ce n'est pas une limite. Par exemple, j'ai installé le paquet

00:10:21d'accès au web et je l'ai connecté à ma clé API Gemini pour donner à cet agent Pi

00:10:30un accès complet à la recherche web via l'API Gemini. Je peux donc lancer cet agent

00:10:35en dehors de tout projet de code et lui donner une tâche comme celle-ci :

00:10:41“Fais des recherches sur les actions Apple et Nvidia des sept derniers jours, récupère leurs prix

00:10:46et analyse leurs performances sur cette période.” Et si je lance ça, il va s'exécuter.

00:10:55Il va trouver un moyen de récupérer les données boursières. Il fera une recherche web,

00:11:04visitera peut-être les pages de relations investisseurs, et il fera ensuite les calculs réels,

00:11:12en lançant un script temporaire ou autre. Voyons ce qu'il fait. Ici, il a activé une

00:11:18compétence de recherche web que j'ai ajoutée, où je lui explique comment mener ses recherches. Il essaie

00:11:23de le faire. Il a rencontré un petit problème car Python n'était pas directement accessible via son

00:11:29exécutable standard, il a compris qu'il fallait utiliser “python3”. Il a ensuite

00:11:34écrit un script pour extraire les données d'un site grâce à Python, un script temporaire

00:11:40qu'il a exécuté ici, et il semble avoir obtenu les cours de bourse. Ensuite, il va probablement

00:11:47écrire un petit script pour effectuer les calculs à partir de ces données et analyser

00:11:55les variations de prix. Après avoir travaillé un moment sur diverses recherches, y compris

00:12:01des recherches d'actualités, il a terminé. Il me donne les sept derniers jours pour Apple

00:12:08et Nvidia, en montrant l'évolution des actions. Il me fournit des résumés de performance

00:12:14et une analyse textuelle qui synthétise les résultats pour que je puisse

00:12:23les lire comme un rapport de direction. Tout cela a été fait par cet agent de codage Pi

00:12:29grâce aux extensions et compétences fournies, rien d'autre. Pas de code de ma part, pas d'instructions

00:12:36précises sur les sites à visiter. Il a tout fait seul. On pourrait tout à fait faire ça avec Claude Code

00:12:43ou Codex, car au fond, ce sont tous des agents IA avec des outils pour accomplir des tâches.

00:12:50Même s'ils sont conçus pour le code, on peut les détourner pour faire

00:12:56toutes sortes de choses. Car au final, cette tâche consistait à consulter

00:13:01des sites et écrire des scripts, ce qui est très proche d'un projet de code où on demande

00:13:06de lire de la doc et d'écrire du code, n'est-ce pas ? Il peut donc faire bien d'autres choses.

00:13:11La raison pour laquelle Pi est, selon moi, un peu meilleur pour ce genre de tâches que Codex ou

00:13:17Claude, c'est ce cœur minimaliste qui peut être configuré exactement comme on le souhaite,

00:13:24même par projet. On peut avoir un projet sur son système qui est un expert en recherche,

00:13:29un autre expert en bourse, et un troisième projet avec un profil totalement différent,

00:13:37un expert pour analyser votre système et l'utilisation de votre disque dur,

00:13:42ou n'importe quoi d'autre. C'est probablement aussi la raison pour laquelle OpenClaw

00:13:50utilise Pi en interne. Ici, je suis sur deep wiki pour le dépôt OpenClaw. Si vous ne

00:13:55connaissez pas, c'est un excellent site pour explorer des dépôts GitHub. Il les analyse et

00:14:00génère une documentation à la volée basée sur le code détecté. On peut aussi

00:14:05discuter avec le dépôt. Je pourrais demander : “OpenClaw utilise-t-il l'agent Pi

00:14:12en interne ? Si oui, comment ?”. Il va analyser le code qu'il a déjà chargé et me répondre.

00:14:18Oui, OpenClaw utilise bien l'agent de codage Pi, et il m'explique précisément comment c'est implémenté.

00:14:24Voilà donc l'agent de codage Pi. Je voulais simplement partager ça avec vous. Encore une fois, je ne

00:14:31gagne rien à le faire, je n'ai pas de cours ni rien. Mais c'est un outil formidable, surtout

00:14:38si vous envisagez d'utiliser des agents pour des tâches autres que le codage. Mais bien sûr,

00:14:44pour être très clair, il est aussi excellent pour le code, il fait les deux. C'est un agent

00:14:50IA très polyvalent. On peut même construire ses propres outils par-dessus, comme avec OpenClaw.

00:14:56On peut aussi faire tout ça avec Codex, mais ce noyau minimaliste est vraiment un plus ici.

00:15:02Donc, en complément de Codex ou Claude Code, ou à leur place, cet outil vaut le détour.

00:15:09C'est quelque chose avec lequel je me suis beaucoup amusé ces dernières semaines.

00:15:14J'ai hâte de voir où tout cela nous mènera dans un an. C'est

00:15:18un peu effrayant, je l'admets, mais aussi passionnant. Un mélange étrange.

Key Takeaway

L'agent de codage Pi redéfinit l'assistance IA par un noyau minimaliste et une extensibilité totale, permettant de transformer un simple outil de programmation en un agent polyvalent capable de gérer n'est-ce pas n'importe quelle tâche système ou recherche complexe.

Highlights

L'agent Pi se distingue par son architecture minimaliste et ultra-légère par rapport à Claude Code ou Codex.

L'accès complet à l'outil Bash permet à l'agent de contrôler l'intégralité du système et d'exécuter n'importe quelle commande.

L'utilisation de "skills" (compétences) basées sur des fichiers Markdown permet un chargement paresseux du contexte pour préserver la fenêtre de mémoire.

Une extensibilité exceptionnelle qui permet d'ajouter des modes personnalisés comme le mode "plan" ou des commandes slash.

La polyvalence de l'outil lui permet d'effectuer des tâches non liées au code, telles que l'analyse boursière ou la recherche web.

L'agent Pi fonctionne sur un modèle de paiement à l'usage ou via des abonnements tiers comme Codex, évitant un abonnement direct supplémentaire.

Timeline

Introduction et comparaison avec les outils existants

L'auteur introduit l'agent de codage Pi en le plaçant dans le contexte actuel des outils d'IA comme Claude Code, Codex, Cursor et GitHub Copilot. Il compare la prolifération de ces nouveaux outils à la guerre des frameworks JavaScript de 2019, soulignant qu'il n'y a pas de mauvais choix définitif. Cette présentation initiale précise que la vidéo n'est pas sponsorisée et que l'intérêt pour Pi repose sur ses mérites techniques propres. Le narrateur insiste sur le fait que malgré la saturation du marché, cet agent mérite une attention particulière pour son approche unique. Cette section pose les bases d'une analyse comparative entre les agents lourds et les solutions plus agiles.

Modèle économique et philosophie du minimalisme

Cette partie explore la structure de coût et la philosophie de conception de l'agent Pi, qui ne nécessite pas d'abonnement direct mais fonctionne par paiement à l'usage. L'outil se distingue par un prompt système minimal et un ensemble de fonctions restreint : lire, écrire, éditer et surtout l'outil Bash. L'auteur explique que l'accès au Bash est le levier le plus puissant, car il permet d'invoquer n'importe quelle interface de ligne de commande (CLI) tierce. Cette approche permet de garder une fenêtre de contexte propre tout en offrant une puissance d'action totale sur la machine. Le minimalisme est ici présenté non pas comme une limitation, mais comme une stratégie pour accroître l'efficacité et la flexibilité de l'IA.

Gestion des compétences (Skills) et protocole MCP

Le concept de "skills" est détaillé comme une méthode permettant d'étendre les capacités de l'agent via des répertoires de fichiers Markdown. Ces fichiers contiennent des descriptions que l'IA consulte pour décider de charger ou non du contexte supplémentaire de manière "paresseuse". L'auteur aborde également la question délicate du protocole MCP (Model Context Protocol), que Pi ne supporte pas nativement pour éviter d'encombrer la mémoire. Il démontre comment contourner cela en utilisant l'outil MC Porter pour invoquer des serveurs MCP uniquement lorsque cela est nécessaire. Cette gestion intelligente de l'information assure que l'agent reste rapide et pertinent sans être submergé par des données inutiles.

Extensibilité avancée et personnalisation

L'auteur approfondit l'extensibilité de Pi en expliquant comment les extensions peuvent intervenir à chaque étape de la boucle agentique. Il donne l'exemple concret d'un mode "plan" qu'il a lui-même configuré pour empêcher l'agent d'éditer du code avant d'avoir validé une stratégie. Cette personnalisation inclut des modifications de l'interface du terminal et l'ajout de commandes spécifiques comme /plan. Il mentionne l'existence d'une place de marché pour partager des paquets, incluant des outils de recherche web ou des sous-agents spécialisés. Cette section souligne que l'utilisateur peut transformer le noyau minimal de Pi en un outil parfaitement adapté à ses besoins spécifiques, qu'ils soient globaux ou locaux à un projet.

Démonstration pratique : Analyse boursière et recherche web

Pour prouver que Pi dépasse le cadre du codage, l'auteur effectue une démonstration d'analyse financière sur les actions Apple et Nvidia. En utilisant une extension de recherche web et l'API Gemini, l'agent parvient à naviguer sur internet, extraire des données et écrire des scripts Python temporaires pour effectuer des calculs. L'IA gère d'elle-même les erreurs, comme la correction de la commande d'exécution Python, pour produire un rapport de direction synthétique. Cette capacité à détourner un agent de codage pour des tâches de recherche et d'analyse de données montre la puissance de son architecture flexible. L'expérience utilisateur est ici celle d'un assistant autonome capable de résoudre des problèmes complexes sans instructions étape par étape.

Conclusion et intégration dans l'écosystème

En conclusion, l'auteur explique pourquoi l'architecture de Pi est parfois préférable à celle de Codex ou Claude, notamment pour sa capacité à créer des profils d'experts par projet. Il mentionne OpenClaw comme un exemple concret d'outil utilisant l'agent Pi en interne pour analyser des dépôts GitHub. L'analyse se termine sur une note de réflexion concernant l'évolution rapide de ces technologies, qualifiée à la fois d'effrayante et de passionnante. L'outil est recommandé comme un complément ou une alternative sérieuse pour ceux qui souhaitent expérimenter avec des agents IA hautement configurables. Le message final invite les utilisateurs à explorer le potentiel de l'outil au-delà de sa fonction primaire de programmation.

Community Posts

Agent de Codage PI : La réalité des flux de travail d'entreprise et d'une réduction de coûts de 80 %

makedream12 mars 20265740

Write about this video