Les agents IA ADORENT les CLI

MMaximilian Schwarzmüller
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00Maintenant que les agents IA deviennent de plus en plus utiles et de plus en plus courants, du moins
00:00:05pour certaines tâches, je trouve ça vraiment intéressant de voir comment on boucle la boucle.
00:00:11Et voici ce que je veux dire. Si l'on regarde l'histoire de l'informatique et d'Internet
00:00:16dans son ensemble, on pourrait peut-être dessiner une courbe de facilité d'utilisation comme celle-ci.
00:00:23Bien sûr, c'est totalement inventé, mais vous voyez l'idée. Nous avons commencé dans les années 70,
00:00:30ou par là — ne me tenez pas rigueur de l'année précise — mais au tout début,
00:00:36à l'époque où vous et moi — enfin, je n'étais même pas né — mais quand les foyers
00:00:41n'avaient pas d'ordinateur, l'interaction se faisait principalement par texte via des interfaces
00:00:47en ligne de commande, essentiellement. Et les interfaces graphiques riches, les sites web
00:00:54élaborés et tout ça — des systèmes d'exploitation conçus pour l'utilisateur lambda — cela n'est
00:01:01devenu courant que vers les années 90-2000 et a bien sûr continué d'évoluer jusqu'à aujourd'hui.
00:01:09Et cela évolue encore, ne vous méprenez pas, je ne dis pas que tout cela va disparaître,
00:01:14mais une chose est clairement visible : avec les agents IA, nous assistons
00:01:22à un retour marqué vers le texte seul, les interfaces en ligne de commande, le Markdown,
00:01:31le JSON, tout ce qu'il y a de plus basique. Et par là, je ne veux pas seulement dire
00:01:37qu'on a des outils comme Claude Code qui n'ont pas vraiment d'interface graphique — bien qu'il
00:01:43existe une application de bureau, il est surtout utilisé en ligne de commande — ce n'est pas tout.
00:01:48Je veux dire que tous ces agents IA, ces outils agentiques — peu importe comment vous les
00:01:54appelez — excellent vraiment dans l'interaction avec d'autres outils en ligne de commande,
00:02:02qu'ils peuvent invoquer eux-mêmes ; ils veulent du texte simple, bien formaté comme le Markdown,
00:02:09c'est là qu'ils brillent vraiment. Et c'est pourquoi de plus en plus d'entreprises — comme
00:02:15Google, il y a quelques heures à peine au moment où j'enregistre, sortent de nouveaux
00:02:21outils en ligne de commande. Google vient de lancer un CLI pour Google Workspace.
00:02:27Aussi incroyable que cela paraisse, ça n'existait pas, et c'est un outil pour interagir avec Gmail,
00:02:35Google Drive, via un CLI officiel. Il existait déjà d'autres solutions, comme
00:02:41GOG CLI par Peter Steinberger, le créateur d'OpenClaw ; il l'avait conçu parce qu'il
00:02:48voulait interagir par script avec les services Google et que ça n'existait pas
00:02:54jusqu'à il y a quelques heures. Mais maintenant, c'est là. Ce n'est pas une vidéo sponsorisée
00:02:59par Google, c'est juste intéressant de voir que de plus en plus de fournisseurs
00:03:04de services sortent ce genre d'outils. Les serveurs MCP seraient un peu la même chose,
00:03:11bien qu'à mon avis, ils présentent plusieurs inconvénients. Je suis convaincu que les CLI
00:03:18et les API — car au fond, un CLI n'est qu'une surcouche d'API — seront le moyen
00:03:27principal de consommer des services via les agents. Voici un exemple concret.
00:03:32Ces derniers jours, j'ai beaucoup utilisé l'agent PyCoding.
00:03:37Le PyCoding agent est, si l'on veut, une alternative à Claude Code. Il est plus simple,
00:03:46plus limité en fonctionnalités mais très puissant, et on peut l'utiliser avec son propre abonnement.
00:03:51Le sujet n'est pas cet agent en particulier, et peu importe
00:03:57que vous utilisiez celui-ci, Claude, Cursor ou autre, ils font tous le travail.
00:04:01Mais j'aime beaucoup cet outil et surtout, tout comme Claude Code,
00:04:07on peut l'utiliser pour des tâches autres que le code. Par exemple, c'est cet agent Py
00:04:13qui est utilisé en interne par OpenClaw. C'est son cœur logique, en quelque sorte.
00:04:19Ensuite, OpenClaw y a ajouté beaucoup d'autres choses comme la mémoire,
00:04:24des canaux comme Telegram ou WhatsApp et tout le reste. Mais voilà
00:04:30un outil agentique que vous pourriez faire tourner sur votre système pour accomplir des tâches.
00:04:35Vous pourriez aussi créer votre propre agent. J'ai d'ailleurs un cours là-dessus
00:04:40où j'explique comment ils fonctionnent et la différence avec les workflows, car souvent,
00:04:44un workflow suffit. J'ai des cours sur ce sujet si vous voulez approfondir.
00:04:49J'en ai aussi sur Claude Code et d'autres outils similaires pour en apprendre davantage.
00:04:54Mais quel que soit l'outil, ce qui est fascinant, c'est la facilité
00:04:58avec laquelle ils interagissent avec les outils CLI. C'est logique,
00:05:03car ils ont été entraînés sur énormément de travaux en ligne de commande utilisant des outils
00:05:10comme curl, ou des commandes Linux basiques comme cd ou ls.
00:05:16Ils connaissent ces commandes par cœur, mais surtout,
00:05:21ils ont appris comment utiliser ces outils. Comment les enchaîner les uns aux autres,
00:05:28comment envoyer le résultat de l'un vers l'autre. Ils excellent dans ce domaine.
00:05:35Ils savent aussi utiliser l'option --help pour apprendre à se servir d'un nouvel outil.
00:05:41Cela leur permet d'utiliser des outils qu'ils n'ont même pas vus
00:05:47pendant leur entraînement, comme ce nouveau CLI Google Workspace.
00:05:52Bien sûr, si vous l'utilisez via un agent, celui-ci ne le connaît pas encore.
00:05:57Il ne sait pas comment s'en servir. Mais si vous le dirigez vers lui, ou si vous lui donnez
00:06:01le lien de la doc, il sera capable de comprendre comment l'utiliser
00:06:05simplement avec la commande --help. Parce que c'est juste un outil CLI de plus.
00:06:11Et les modèles de langage excellent finalement à comprendre,
00:06:17décrire et manipuler ces outils en ligne de commande.
00:06:20Par exemple, hier, j'ai eu un petit souci. Je devais télécharger
00:06:26un document PDF sur un site. Vous savez, ces sites qui vous demandent de regrouper
00:06:32tous vos documents en un seul fichier qui ne doit pas dépasser 5 Mo ?
00:06:38C'était exactement mon cas. Je devais donc compresser ce PDF.
00:06:43J'aurais pu chercher un site web pour le faire. Mais je n'aime pas trop
00:06:49envoyer mes documents personnels sur n'importe quel site inconnu.
00:06:55J'aurais pu regarder si j'avais un outil sur mon système, mais comme je n'ai plus
00:07:01d'abonnement Adobe, cela m'aurait demandé des recherches. Et j'aurais peut-être fini
00:07:07par utiliser un site louche. Eh bien, pas avec l'IA. J'aurais pu coder
00:07:13rapidement un petit script de compression avec Claude ou Cursor.
00:07:19Ça aurait fonctionné. Mais à la place, j'ai lancé l'agent Py
00:07:26que j'utilise avec mon abonnement. Et je lui ai juste demandé d'examiner
00:07:33ce PDF et de le compresser en gardant la meilleure qualité possible.
00:07:36C'était ma seule instruction. L'agent s'est mis au travail, a exécuté
00:07:41une série de commandes, lancé quelques scripts. Au passage, comme ça tourne
00:07:46sur ma machine, j'ai installé une extension de sécurité. Cet agent Py
00:07:53permet d'installer des extensions. J'en ai donc une qui l'empêche
00:07:59d'effacer mon disque dur, du moins directement. Et je le surveillais
00:08:06de près pendant qu'il décrivait ses actions. Je l'ai laissé faire,
00:08:11il a lancé plusieurs processus. Et au final, c'était bon.
00:08:18Il a réussi à compresser le document et à réduire sa taille de façon significative.
00:08:25C'est un exemple simple, certes. Et il y avait d'autres solutions.
00:08:29Mais mon point est qu'il a tout fait en ligne de commande, dans le terminal,
00:08:36en utilisant nos programmes habituels. Et c'est tout à fait logique
00:08:41quand on parle de programmes utilisant un ordinateur. Les interfaces graphiques
00:08:46et les sites web riches ont été conçus pour les humains. Ça ne va pas disparaître.
00:08:53Mais si nous voulons des petits utilitaires, des agents IA sur nos machines qui font
00:08:59une partie de notre travail, nous devons leur donner un moyen plus efficace d'utiliser
00:09:03l'ordinateur. Une interface graphique ou un site conçu pour un humain
00:09:09n'est pas l'idéal pour un programme. Il devrait faire une capture d'écran,
00:09:13trouver les boutons, déplacer la souris, cliquer, puis recommencer pour voir
00:09:18la nouvelle page. C'est inefficace, ça consomme trop de jetons et c'est lent.
00:09:24C'est d'ailleurs pour ça que le concept d'API existait bien avant les agents IA
00:09:31et les grands modèles de langage. Quand on écrit un programme,
00:09:37que ce soit un site ou une application, et qu'on veut interagir avec un autre service,
00:09:43on utilisait déjà une API. On n'essayait pas d'écrire un script qui manipule
00:09:49un site web fait pour les humains. C'est la raison d'être des API. Et les CLI,
00:09:56au final, ne sont souvent que des interfaces simplifiées pour ces API, comme pour
00:10:03celui de Google Workspace. C'est exactement le genre de programme
00:10:10qu'un agent doit consommer, car il n'a que faire de l'esthétique des boutons.
00:10:15Il veut juste un moyen simple d'invoquer des commandes pour accomplir ses tâches.
00:10:22Voilà pourquoi c'est logique. C'est aussi pourquoi le Markdown devient crucial,
00:10:28et pourquoi la plupart des documentations proposent un bouton de copie,
00:10:32permettant de récupérer le contenu au format Markdown pour le coller
00:10:38dans son outil de chat ou de code préféré. Certains sites permettent même d'ajouter
00:10:46.md à la fin de l'URL pour obtenir l'article en Markdown, car nous allons vers un futur
00:10:52où certains services et contenus seront d'abord destinés à être consommés par des agents.
00:10:58Prenez la documentation d'une bibliothèque comme TanStack Start. Si vous
00:11:03développez un site avec, et peu importe la technologie utilisée,
00:11:09vous le ferez probablement avec l'aide d'un agent comme Cursor. Et si vous
00:11:15voulez lui expliquer comment utiliser la bibliothèque via un article spécifique,
00:11:20vous ne voulez pas qu'il analyse une page web complexe. Vous ne voulez pas
00:11:25qu'il télécharge tout le code HTML, ce qui gaspillerait des jetons inutilement.
00:11:32C'est pour cette même raison que les outils CLI reprennent de l'importance,
00:11:38parce que de plus en plus de tâches seront effectuées avec l'aide d'agents IA,
00:11:42voire exclusivement par eux. Ce qui signifie que si vous construisez
00:11:49un service qui n'est pas uniquement destiné aux humains, vous devriez
00:11:54sérieusement envisager de créer un CLI en plus d'une API,
00:12:02afin que demain, on puisse consommer votre service via des agents.
00:12:09Bien sûr, on n'en est qu'au tout début. La plupart des gens ne se soucient pas
00:12:14encore des agents. Il est trop tôt pour savoir jusqu'où ils iront et quelles
00:12:20tâches ils pourront accomplir. Peut-être resteront-ils au niveau actuel
00:12:26où ils font certaines choses mais nécessitent toujours une supervision humaine.
00:12:31Mais même là, il y a des tâches qu'ils peuvent faire, et vous pouvez les rendre
00:12:37bien plus utiles en leur donnant les bons outils pour interagir facilement
00:12:42avec nos services et nos sites. C'est pour ça qu'on boucle la boucle.
00:12:49Évidemment, ça ne veut pas dire que les interfaces graphiques et les sites web
00:12:55vont disparaître. Il y aura toujours des applications faites pour les humains
00:13:01qui n'ont aucun sens pour un agent. Prenez Netflix, par exemple.
00:13:07Je ne vois pas l'intérêt qu'un agent me résume un film ;
00:13:13ce que je veux, c'est le regarder. Mais pour beaucoup de services, surtout en SaaS
00:13:21ou dans le domaine professionnel, c'est clairement la voie à suivre.
00:13:28On n'en est qu'aux prémices, mais l'évolution est là, selon moi.
00:13:34Mais comme toujours, votre avis m'intéresse. Alors partagez-le.
00:13:39Dites-moi ce que vous en pensez, si j'ai oublié quelque chose. Et on verra
00:13:44à quoi ressemblera le monde des outils CLI dans un an ou deux.

Key Takeaway

L'essor des agents IA marque un retour aux interfaces en ligne de commande (CLI), car elles offrent une méthode d'interaction plus rapide, moins coûteuse et plus naturelle pour les programmes que les interfaces graphiques traditionnelles.

Highlights

L'informatique boucle la boucle en revenant aux interfaces textuelles (CLI) pour optimiser l'usage des agents IA.

Les interfaces graphiques (GUI) sont conçues pour l'œil humain, tandis que les agents IA préfèrent le texte brut, le Markdown et le JSON.

Google vient de lancer un outil CLI pour Google Workspace, signalant une tendance majeure chez les géants de la tech.

Les agents IA excellent à utiliser les commandes système comme curl ou ls, et peuvent apprendre de nouveaux outils via l'option --help.

L'utilisation de CLI par les agents réduit la consommation de jetons (tokens) et augmente l'efficacité par rapport à la navigation visuelle.

Le format Markdown devient le standard de communication privilégié entre les services web et les modèles de langage.

Les créateurs de services SaaS devraient envisager de développer des CLI et des API pour rester compatibles avec le futur agentique.

Timeline

Le cycle de l'évolution informatique : du texte au texte

L'intervenant explique comment l'informatique semble boucler la boucle de son évolution historique. Il rappelle que dans les années 70, l'interaction se faisait exclusivement par texte et par lignes de commande avant l'arrivée des interfaces graphiques dans les années 90. Aujourd'hui, avec l'avènement des agents IA, nous observons un retour marqué vers le minimalisme textuel. Cette transition n'annule pas les progrès visuels, mais redéfinit la manière dont les outils interagissent. L'idée centrale est que l'IA redonne une seconde jeunesse à des méthodes que l'on pensait dépassées pour le grand public.

Pourquoi les agents IA préfèrent le CLI et le Markdown

Cette section détaille la préférence technique des agents pour les formats comme le Markdown et le JSON par rapport aux interfaces complexes. L'auteur cite l'exemple récent de Google qui a lancé un CLI pour Google Workspace, permettant d'interagir avec Gmail ou Drive par script. Il mentionne également des outils tiers comme GOG CLI qui existaient déjà pour pallier ce manque. Selon lui, les interfaces de programmation (API) et les CLI deviendront le moyen principal de consommer des services via des agents. Cette tendance est soutenue par la capacité des modèles de langage à traiter le texte bien formaté avec une précision chirurgicale.

Étude de cas : L'agent PyCoding et l'efficacité des scripts

L'intervenant présente l'agent PyCoding, une alternative plus simple mais puissante à Claude Code, pour illustrer son propos. Il explique que ces outils n'ont pas besoin d'interfaces graphiques car ils connaissent par cœur les commandes Linux de base comme cd ou ls. Une caractéristique fascinante est leur capacité à lire la documentation via la commande --help pour maîtriser de nouveaux outils inconnus. Cela permet aux agents de manipuler des systèmes complexes sans intervention humaine constante. Cette autonomie repose sur une formation massive sur des dépôts de code et des environnements de terminal. Enfin, il souligne que ces modèles excellent dans l'enchaînement de commandes pour résoudre des problèmes techniques.

Exemple pratique : Compression de PDF sans site tiers

L'auteur partage une anecdote personnelle sur le besoin de compresser un document PDF de plus de 5 Mo pour un site administratif. Au lieu d'utiliser un site web potentiellement dangereux pour sa vie privée, il a simplement demandé à son agent IA local d'effectuer la tâche. L'agent a exécuté des scripts de compression directement sur sa machine, tout en étant surveillé par une extension de sécurité. Cette méthode démontre que pour des utilitaires simples, l'IA est plus efficace qu'une recherche manuelle de logiciel. L'intervenant insiste sur le fait que manipuler une interface graphique via des captures d'écran est trop lent et coûteux pour un agent. Le terminal reste donc l'environnement de travail le plus logique pour ces programmes.

L'avenir du SaaS et la documentation pour agents

Le concept d'API prend ici tout son sens comme interface de communication entre machines, bien avant l'arrivée des LLM. L'auteur explique que les CLI sont des surcouches simplifiées de ces API, idéales pour être consommées par des agents qui se moquent de l'esthétique des boutons. Le format Markdown devient crucial, à tel point que de nombreux sites de documentation permettent désormais d'ajouter une extension .md à l'URL. Cela évite au modèle de langage de télécharger du code HTML inutile, économisant ainsi de nombreux jetons. Il donne l'exemple de bibliothèques comme TanStack Start dont la documentation doit être facilement lisible par des outils comme Cursor. L'objectif est de rendre le contenu "digestible" pour les machines autant que pour les humains.

Conclusion : Vers un écosystème hybride

Pour conclure, l'intervenant encourage les développeurs à créer des CLI en plus de leurs interfaces classiques pour préparer l'avenir agentique. Bien que nous n'en soyons qu'aux prémices, la direction semble claire pour le secteur professionnel et le logiciel en tant que service (SaaS). Il nuance toutefois en précisant que les interfaces graphiques resteront indispensables pour la consommation de médias, comme sur Netflix, où l'expérience humaine prime. L'évolution vers les agents ne signifie pas la mort du visuel, mais l'ajout d'une couche d'automatisation plus profonde. Il termine en invitant sa communauté à débattre de cette vision du futur de l'informatique. La boucle est ainsi bouclée : l'innovation la plus pointue redonne vie aux outils les plus anciens.

Community Posts

View all posts