Votre OS Agentique Claude Code est nul

CChase AI
컴퓨터/소프트웨어마케팅/광고창업/스타트업AI/미래기술

Transcript

00:00:00Votre OS agentique Cloud Code est nul, et c'est parce que vous vous concentrez
00:00:05sur les mauvaises choses.
00:00:05Vous passez tout votre temps sur des tableaux de bord et des centres de commande
00:00:09complexes comme celui-ci au lieu de vous concentrer sur ce qui apporte de la valeur
00:00:14à un OS agentique Cloud Code.
00:00:15Et c'est ceci : une structure de compétences et d'automatisation qui pilote tout.
00:00:20Le problème, c'est que créer quelque chose comme ça à haut niveau prend du temps,
00:00:25n'est pas tape-à-l'œil et peut être un peu ennuyeux,
00:00:28surtout comparé à ces centres de commande spectaculaires qui génèrent des vues.
00:00:33Mais la vérité est que pour tirer profit d'un OS agentique Cloud Code,
00:00:37notamment en ce qui concerne la partie observabilité,
00:00:40le tableau de bord ou le centre de commande...
00:00:42cela n'arrivera que si cette base est fixée, car un bon OS agentique
00:00:48comporte trois parties. La première est celle que vous voyez ici.
00:00:52C'est le socle de compétences et d'automatisation.
00:00:54C'est l'idée de transformer Cloud Code en un système capable de
00:00:58fournir des résultats fiables.
00:00:59Nous allons prendre vos flux de travail et tâches quotidiens, ou ceux de votre équipe,
00:01:05les transformer en compétences, puis en automatisations quand c'est pertinent.
00:01:09Et ce faisant, bâtir un système cohérent comme celui que vous voyez là.
00:01:14Ainsi, nous pouvons répéter les mêmes actions à haut niveau avec
00:01:19des résultats constants. La deuxième partie est la couche de mémoire.
00:01:23Comment gérer l'ingénierie de contexte ? Eh bien,
00:01:27il y a plusieurs façons de faire.
00:01:28On peut faire quelque chose de complexe avec des graphes de connaissances
00:01:32via LightRAG, ou rester simple en utilisant Obsidian,
00:01:36qui est une solution à 80 % suffisante pour la grande majorité des gens.
00:01:40Et c'est seulement une fois tout cela fixé qu'un tableau de bord ou un centre
00:01:45de commande d'OS prend tout son sens, car sa valeur réside dans deux aspects.
00:01:51Le premier est le côté observabilité.
00:01:53C'est l'idée de compenser certaines faiblesses du terminal.
00:01:57Comme voir mes métriques de réseaux sociaux,
00:02:00analyser rapidement les données d'audience,
00:02:03ou regrouper toutes mes recherches sur un seul onglet.
00:02:06La seconde moitié de cette valeur vient d'ici, de tous ces boutons.
00:02:10C'est l'idée que si je veux offrir la puissance de Cloud Code à un membre
00:02:14de mon équipe ou à un client qui n'ira jamais dans le terminal,
00:02:17je peux construire cette architecture de compétences, l'assigner à des boutons,
00:02:22et ils peuvent les exécuter à la demande d'un simple clic.
00:02:26Aujourd'hui, je vais vous montrer comment bien configurer ce socle de compétences.
00:02:30Ensuite, nous parlerons du tableau de bord car les possibilités
00:02:35sont nombreuses. Il y a deux chemins possibles.
00:02:37Je vous ai montré deux versions. Il y a celle-ci,
00:02:40qui fait littéralement partie d'Obsidian lui-même,
00:02:44ce qui est cool car on a aussi un terminal intégré, et il y a cette
00:02:47version application web, conçue pour la distribution.
00:02:50Si vous voulez intégrer d'autres membres ou des packages pour des clients.
00:02:53Mais avant d'entrer dans les détails techniques,
00:02:56un mot de notre sponsor du jour : moi-même. Comme vous le savez,
00:03:01sur Chase AI Plus, je viens de sortir la Masterclass Claude Code,
00:03:03le meilleur moyen de passer de zéro à développeur IA.
00:03:06Mais j'y ai aussi ajouté une Masterclass sur l'OS Agentique.
00:03:11Tout ce que vous voyez aujourd'hui, les prompts, les tableaux de bord,
00:03:15est approfondi dans Chase AI Plus via le lien en commentaire épinglé.
00:03:19De plus, au moment où cette vidéo sortira,
00:03:23j'animerai un webinaire gratuit
00:03:24sur la mise en place d'un OS agentique
00:03:28en passant par les trois couches. Pour participer,
00:03:32consultez aussi le commentaire épinglé pour les liens.
00:03:35Puisque la valeur est là, comment mettre cela en place ?
00:03:38Et pourquoi cette structure en organigramme ? Eh bien,
00:03:42cet organigramme avec des sections séparées,
00:03:46comme la productivité, la recherche et le contenu,
00:03:49sert à visualiser quelque chose d'invisible.
00:03:53C'est pour votre modèle mental.
00:03:54C'est l'idée que vous effectuez diverses tâches
00:03:58dans différents domaines au quotidien, que ce soit professionnel
00:04:01ou personnel. Pour moi,
00:04:04c'est divisé entre la productivité (Google), la recherche,
00:04:09le contenu, ma communauté, mon agence, les ventes, etc.
00:04:13Ce qu'il faut faire, c'est prendre cet amas informe
00:04:18de choses que vous faites chaque jour,
00:04:21toutes ces tâches diverses, et les transformer en compétences.
00:04:26Pourquoi en faire des compétences ? Eh bien,
00:04:30actuellement avec Cloud Code,
00:04:32quand vous avez besoin de quelque chose,
00:04:34vous le lancez dans le terminal et vous lui dites quoi faire.
00:04:37Vous l'utilisez comme un ChatGPT légèrement amélioré.
00:04:41Si vous faites cela tout le temps,
00:04:44pourquoi ne pas codifier cela en une compétence ?
00:04:47La codifier apporte plusieurs avantages. D'abord,
00:04:51le côté pratique. Je prends toute la tâche,
00:04:54et au lieu de l'expliquer en un paragraphe,
00:04:56je tape juste un mot pour appeler la compétence et c'est fait.
00:05:00Deuxièmement, comme c'est codifié, on peut la tester
00:05:05avec un outil comme le “Skill Creator skill”.
00:05:09Nous pouvons réellement évaluer les compétences que nous créons.
00:05:14On peut voir si...
00:05:16si la compétence est pertinente via des tests A/B
00:05:20avec ou sans elle. À terme, si elle est bonne,
00:05:25on obtiendra des résultats plus déterministes d'un système qui,
00:05:30par nature, ne l'est pas. Les LLM ont une part
00:05:33d'aléatoire inhérente à leur fonctionnement.
00:05:38Tout ce qui peut réduire cet aléatoire est bon à prendre.
00:05:42Codifier vos tâches quotidiennes en compétences
00:05:45est un grand pas en ce sens.
00:05:47Si cela paraît logique à beaucoup, demandez-leur
00:05:50s'ils se sont déjà posés devant leur terminal,
00:05:54ont allumé le micro et dit : “Claude, voici mon planning, ce que je fais.”
00:05:59“Peux-tu en extraire des compétences et les créer via
00:06:04le Skill Creator ?”
00:06:05Le pourcentage de gens qui le font est infime,
00:06:09ce qui est fou car c'est l'une des améliorations les plus simples
00:06:14et puissantes pour Cloud Code.
00:06:15La visualisation aide à y réfléchir car nous agissons
00:06:19dans des domaines très variés.
00:06:22On peut souvent combiner plusieurs tâches en
00:06:28compétences de workflow ou de haut niveau qui font tout d'un coup.
00:06:32Par exemple,
00:06:33j'ai une compétence appelée “Content Cascade”.
00:06:37Elle sert à réutiliser du contenu. Quand je crée une vidéo YouTube
00:06:42et que je l'appelle, elle effectue plusieurs actions.
00:06:46Elle télécharge la transcription, crée un article de blog,
00:06:50un post LinkedIn, un post Twitter, lance Playwright,
00:06:54puis publie tout cela pour moi.
00:06:57C'est un ensemble de tâches individuelles,
00:07:00mais au lieu de neuf compétences distinctes,
00:07:03ce n'en est plus qu'une.
00:07:04C'est un gain de productivité énorme.
00:07:09L'avez-vous fait pour tout ce que vous faites au quotidien ?
00:07:12Probablement pas.
00:07:13Ce processus d'analyse pas à pas et de codification,
00:07:18c'est ça, la puissance d'un OS agentique.
00:07:21Le reste, la mémoire, le tableau de bord,
00:07:24ce n'est que l'emballage.
00:07:27Si vous ne travaillez pas en équipe
00:07:30et ne comptez pas vendre ces solutions,
00:07:32vous pourriez vous arrêter là et vous seriez
00:07:35déjà bien plus avancé que les autres.
00:07:38Exécuter ce processus est fondamentalement simple.
00:07:43Ouvrez le terminal, lancez une session,
00:07:47parlez, et à la fin demandez : “Peux-tu transformer
00:07:51ceci en compétences ?”
00:07:54J'ai un prompt détaillé pour ce tri des compétences,
00:07:58mais le principe est là.
00:08:01“Voici ce que je fais, transforme-le, testons-le.”
00:08:06Passez ensuite au domaine suivant. Le tout
00:08:10sera extrêmement personnalisé pour vous.
00:08:15On se perd parfois dans la multitude de compétences
00:08:19disponibles sur de gros répertoires
00:08:21comme “Awesome Claude Skills”, en pensant que
00:08:25ça va tout changer à votre quotidien
00:08:27avec Cloud Code.
00:08:31C'est chercher une aiguille dans une botte de foin alors que
00:08:34la force de Cloud Code est sa facilité de personnalisation.
00:08:38Pourquoi ne pas en profiter
00:08:39de manière systématique ?
00:08:43Au-delà du sur-mesure,
00:08:44certaines choses sont utiles à presque tout le monde.
00:08:48Côté productivité, si vous êtes dans l'écosystème Google,
00:08:53utiliser le CLI GWS permet d'interagir
00:08:58avec tout (emails, Drive, calendrier)
00:09:01en créant des compétences de tri ou d'organisation.
00:09:05Mais vous pouvez aussi utiliser
00:09:06les connecteurs MCP standards de Cloud Code.
00:09:11Je parle des basiques pour Gmail,
00:09:15Google Calendar et Drive.
00:09:17La seule limite est l'impossibilité d'envoyer des mails,
00:09:20mais on peut créer des brouillons, ce qui suffit à beaucoup
00:09:24pour garder le contrôle final.
00:09:27Et ça prend 30 secondes à faire. C'est un tel gain de productivité que,
00:09:30Une fois les compétences créées,
00:09:33vient l'arbre de décision.
00:09:36L'automatisation doit-elle être à la demande ou routinière
00:09:39dans Cloud Code ? Les routines et automatisations
00:09:43se divisent en deux catégories :
00:09:47locales ou dans le cloud.
00:09:49Si vous hésitez, choisissez le local.
00:09:55Cela tourne quand votre ordinateur est allumé.
00:09:59Dans le cloud, cela s'exécute
00:10:02sur les serveurs d'Anthropic.
00:10:04Vous serez limité en nombre car c'est eux qui paient.
00:10:07Et sur le cloud, le système
00:10:10Et si vous êtes sur le cloud,
00:10:11il n'a pas accès à votre ordinateur. Il ne tourne pas dessus.
00:10:15Il n'a ni vos CLI, ni vos compétences, ni vos fichiers.
00:10:17Donc, la plupart du temps, optez pour une automatisation locale en cas de doute.
00:10:22C'est ainsi que vous créez l'ossature d'un OS agentique Claude Code.
00:10:26Je dis souvent Claude Code, mais en réalité, ce n'est que le moteur.
00:10:30Nous en reparlerons un peu plus tard.
00:10:32Vous pourriez le remplacer par Codex, ou par n'importe quoi d'autre.
00:10:36Voyez-vous, nous construisons ici le châssis.
00:10:39On peut changer le moteur à tout moment.
00:10:42Tout ce que je dis s'applique donc aussi à quelque chose comme Codex.
00:10:44Parlons vite d'Obsidian et de la mémoire avant de passer
00:10:48au tableau de bord d'observabilité du centre de commande,
00:10:50car beaucoup de gens confondent ce qu'Obsidian apporte réellement
00:10:54et le but de tout cela.
00:10:55Rappelez-vous qu'Obsidian n'est qu'une couche d'organisation.
00:10:59Obsidian ne fait rien de spécial à tous ces fichiers Markdown.
00:11:04Il nous donne simplement, à nous humains, un moyen de comprendre
00:11:09ce qui se passe dans nos fichiers et de les relier facilement.
00:11:13Il ne modifie pas la mémoire en soi. Ce n'est pas du RAG.
00:11:17Il n'y a pas d'intégration ni de base de données vectorielle,
00:11:21malgré ces graphismes sympas.
00:11:24Ce n'est pas un vrai graphe de connaissances en ce sens. Cela dit,
00:11:28être organisé,
00:11:29surtout à l'échelle de milliers de documents, est crucial.
00:11:32Et ce n'est pas seulement important pour vous,
00:11:36pour savoir où se trouvent les choses.
00:11:37Ça finit par devenir important pour Claude Code à une certaine échelle en termes
00:11:40d'efficacité de jetons, pour affiner les choses. C'est pour ça que tout le monde en parle, n'est-ce pas ?
00:11:45Le nom “Karpathy RAG”, passons-le en revue très rapidement.
00:11:47C'est juste l'idée que nous avons un coffre,
00:11:49là où réside Obsidian, et une série de sous-dossiers. Karpathy dit : “Hé,
00:11:53on a 'raw' pour les données non structurées. On a 'wikis', qui transforment
00:11:58ces données non structurées en rapports ou en articles.”
00:12:02Et puis on a 'outputs' pour les livrables. Donc, hé,
00:12:05j'ai fait des recherches sur les agents IA, qui sont allées dans 'raw'.
00:12:09Ces recherches sont devenues un article dans mon wiki sur les agents IA.
00:12:13Hé, j'en ai fait une présentation. C'est un peu ça l'idée.
00:12:16La vérité, c'est que vous n'êtes pas obligé de faire ça du tout.
00:12:19Tout ce que vous avez à faire, c'est trouver quelque chose qui a du sens pour vous.
00:12:24Et ça doit être créé pour que vous et Claude Code puissiez naviguer
00:12:29dans le système de dossiers. S'il y avait cent mille fichiers,
00:12:33une base comme celle-ci est un bon début, surtout parce qu'il existe
00:12:37des fichiers d'index maîtres et des fichiers d'index un peu partout.
00:12:40Ces fichiers d'index sont présents à chaque niveau d'Obsidian.
00:12:45Et rappelez-vous, Obsidian n'est qu'un dossier.
00:12:47On parle donc de chaque sous-dossier dans lequel on descend.
00:12:49Il y a un dossier qui agit comme une table des matières.
00:12:52Donc si je suis dans le coffre et que je clique sur le dossier wiki,
00:12:57à l'intérieur se trouve une table des matières appelée fichier d'index, qui me dit :
00:13:02“Ici, nous avons des wikis sur les agents, les systèmes RAG et la création de contenu.”
00:13:06Cool. Je sais où aller. Je vais dans le dossier des agents IA. Qu'est-ce qu'il y a là-dedans ?
00:13:11Il y a un autre index. Une autre table des matières disant : “Hé,
00:13:16dans le dossier des agents IA,
00:13:18nous avons ce document et ce document”. C'est la chose principale que je retiendrais
00:13:23de Karpathy : l'idée des index et des indices, et le fait qu'à chaque niveau
00:13:27où je descends dans Obsidian et ma structure de fichiers,
00:13:30il y a un document maître qui m'oriente dans la bonne direction.
00:13:33Si vous n'avez pas ça au début,
00:13:34bonne chance pour vous y retrouver avec 5 000 documents. Pour moi,
00:13:38dans mon cas, j'ai plusieurs dossiers. J'ai archive, content, notes,
00:13:42dashboard, inbox, ops, project systems, wiki. C'est logique pour moi.
00:13:47J'ai un index. Je comprends ce qui se passe.
00:13:49Vous devez tout personnaliser pour que cela ait du sens pour vous.
00:13:53Et en parlant de personnalisation, passons maintenant à la partie tableau de bord.
00:13:57Ces centres de commande pour ces systèmes d'exploitation agentiques.
00:14:01Nous avons déjà un peu parlé de la valeur ajoutée ici, n'est-ce pas ?
00:14:03C'est l'idée qu'il y a de la visibilité et que je peux voir des choses
00:14:07que je ne pouvais pas voir dans le terminal.
00:14:08Et nous avons ces panneaux de compétences que n'importe qui peut utiliser.
00:14:11La question suivante est : pourquoi diable y en a-t-il deux ?
00:14:14Pourquoi avez-vous celui-ci à l'intérieur d'Obsidian même ?
00:14:17Parce que je suis dans Obsidian ici.
00:14:19Et pourquoi avez-vous celui-là comme application Streamlit en local ?
00:14:22C'est essentiellement une application web. Quelle est la différence entre les deux,
00:14:25lequel est logique pour quoi ? Eh bien, je pense que l'intérêt de Streamlit,
00:14:28ou de n'importe quelle application web,
00:14:31c'est que c'est votre couche de tableau de bord pour la distribution.
00:14:35Si je veux présenter ça à une équipe ou même le packager
00:14:38pour des clients, l'avoir configuré ainsi est super facile.
00:14:41Je peux avoir le modèle dans un GitHub et je peux très
00:14:46rapidement le distribuer à n'importe qui, n'importe où.
00:14:48La mise en place prend littéralement quelques secondes.
00:14:50Et si c'est destiné à un membre d'équipe non technique ou à un client,
00:14:54en restant aussi simple que possible avec des boutons clairs
00:14:57mappés sur des compétences pour les exécuter, c'est génial. C'est tout ce qu'ils veulent.
00:15:01Le tableau de bord dans Obsidian est un peu différent.
00:15:04Vous échangez la distribution contre l'ergonomie à ce stade.
00:15:08Et je dirais même un peu plus de puissance, car c'est super facile,
00:15:11comme vous pouvez le voir ici, d'avoir aussi un terminal intégré
00:15:16à votre centre de commande Obsidian,
00:15:19ce qui signifie que j'ai maintenant le meilleur des deux mondes,
00:15:22sans compter que tout mon contenu est là, prêt à être utilisé.
00:15:26Et Obsidian est infiniment personnalisable comme ici, n'est-ce pas ?
00:15:30Vous savez, j'ai mon calendrier complet, mais ce n'est pas un plugin de calendrier.
00:15:34C'est littéralement la page web de mon Google Calendar
00:15:38que j'ai ouverte ici sur la droite pour avoir une idée très précise
00:15:43de ce qui se passe dans la journée, de mes tâches,
00:15:45du flux d'activité et de ma position dans les différentes communautés.
00:15:48Si je veux approfondir les données sur l'audience,
00:15:51j'ai un onglet pour ça. Si je veux pousser la recherche,
00:15:54j'ai un onglet qui montre les tendances GitHub,
00:15:58Hacker News, ainsi que mes notes liées aux compétences,
00:16:02les gros titres sur X et YouTube, et les opportunités de contenu.
00:16:06Encore une fois, avoir tout ceci
00:16:08dans une configuration purement terminal est un peu lourd.
00:16:12C'est un peu plus difficile. Cependant, le problème
00:16:14avec la configuration Obsidian, c'est l'idée de distribution.
00:16:18Comment distribuer cela à une équipe ou à un client ?
00:16:23C'est possible car ce tableau de bord n'est au fond
00:16:28qu'un plugin personnalisé créé par Claude Code, mais c'est,
00:16:32encore une fois, un peu maladroit à installer pour quelqu'un d'autre.
00:16:37Ce n'est pas juste : « Clonez-le et c'est bon ». C'est plutôt :
00:16:41« Clonez-le. Allez dans Obsidian. Activez ces plugins.
00:16:44Déplacez ceci ici et cela là-bas ». C'est assez laborieux.
00:16:48Donc, si vous travaillez seul et que vous vous dites :
00:16:52« Je veux un OS agentique avec Claude Code.
00:16:54Je veux tous ces boutons personnalisables »,
00:16:58avec le terminal disponible sur le même volet,
00:17:02la voie Obsidian est parfaite. Par contre, si vous voulez
00:17:07vendre cela à des équipes ou clients comme un produit,
00:17:10l'application web est préférable.
00:17:12Mais comprenez que ces systèmes ne valent que par
00:17:16l'architecture de compétences sur laquelle ils reposent.
00:17:19Ce n'est qu'une couche par-dessus Claude Code,
00:17:21car sans cela, ce ne sont que des fioritures inutiles.
00:17:26Il faut du concret. N'oubliez pas ce qui génère de la valeur.
00:17:30Je vais m'arrêter là.
00:17:31J'espère avoir clarifié où se trouve la valeur
00:17:36dans ces systèmes d'OS agentique.
00:17:37Je vois des gens s'acharner dessus en disant
00:17:41qu'ils ne valent rien. Ce n'est pas une critique juste.
00:17:45Généralement, ils visent uniquement le tableau de bord,
00:17:48ce qui se tient si on l'analyse de manière isolée,
00:17:52mais ce n'est pas la réalité. La vraie puissance est là.
00:17:56Le tableau de bord n'est qu'une façade,
00:17:59l'essentiel se passe derrière. C'est là que l'attention
00:18:02doit se porter. Et si l'on se concentre sur les compétences,
00:18:06alors
00:18:07peut-on vraiment nier l'utilité de compétences codifiées
00:18:11basées sur votre travail quotidien ?
00:18:13C'est difficile à contester. Ah, une dernière chose,
00:18:17le sujet des coûts, qui est primordial,
00:18:20surtout avec les actualités récentes.
00:18:22L'utilisation de la commande « dash P » pour faire tourner
00:18:26Claude Code en mode headless semble déplaire à Anthropic.
00:18:31Et par là, je veux dire
00:18:31qu'ils offrent 200 $ à utiliser exclusivement sur les coûts API.
00:18:35Est-ce un problème pour cette configuration ? Car forcément,
00:18:40tout cela fait tourner Claude Code en arrière-plan. Oui et non.
00:18:45Pour atteindre 200 $ par mois, il faudrait vraiment bombarder.
00:18:49En réalité,
00:18:55ça n'en sera probablement pas un. Si jamais c'était le cas
00:18:59ou si vos clients atteignaient les limites d'usage,
00:19:01la solution est simple : passez sur
00:19:04Cody CLI, car ils sont excellents et n'ont pas ces problèmes.
00:19:09Et vous en aurez plus pour votre argent.
00:19:12Changer le moteur interne pour Cody est très simple.
00:19:16On pourrait utiliser Claude Code pour le faire.
00:19:18Il suffirait de lui montrer le code et de dire :
00:19:21« On change tout pour appeler Cody CLI au lieu de Claude ».
00:19:26C'est un refactoring qui prendrait quelques minutes.
00:19:30Je pourrais même ajouter un bouton sur le tableau de bord.
00:19:33« Allez, on passe à la version Cody ».
00:19:35Sachez qu'en réalité, pour 99,99 % des gens,
00:19:40cela n'a aucun impact. Je vous laisse là-dessus.
00:19:43Tout ce que vous avez vu ici,
00:19:45si vous voulez ma configuration exacte pour Obsidian
00:19:50et le reste, c'est disponible dans Chase AI Plus.
00:19:53N'oubliez pas d'aller voir le webinaire qui commence
00:19:57dans environ 20 heures après la sortie de cette vidéo.
00:20:01Sur ce, on se voit bientôt.

Key Takeaway

La valeur réelle d'un OS agentique réside dans la transformation systématique des flux de travail quotidiens en compétences codifiées et testables, reléguant l'interface visuelle au simple rôle d'outil d'observabilité.

Highlights

  • Un système d'exploitation agentique performant repose sur un socle de compétences codifiées plutôt que sur l'esthétique d'un tableau de bord.

  • La méthode Karpathy RAG organise la mémoire dans Obsidian via trois dossiers spécifiques : 'raw' pour les données brutes, 'wikis' pour les rapports structurés et 'outputs' pour les livrables.

  • L'automatisation locale est préférable à l'automatisation cloud car elle conserve l'accès aux fichiers, aux CLI et aux compétences sans restrictions d'usage imposées par les serveurs d'Anthropic.

  • La compétence 'Content Cascade' illustre l'efficacité du système en automatisant simultanément la création d'articles de blog, de posts LinkedIn et Twitter à partir d'une simple transcription YouTube.

  • Le passage de Claude Code à Cody CLI constitue une alternative rapide et peu coûteuse si les limites de crédit API de 200 $ par mois sont atteintes.

Timeline

Les trois piliers d'un OS agentique fonctionnel

  • Le socle de compétences et d'automatisation garantit la répétabilité et la fiabilité des résultats.
  • La couche de mémoire gère l'ingénierie de contexte de manière simple via Obsidian ou complexe avec des graphes de connaissances.
  • Le tableau de bord ne devient utile qu'une fois les fondations techniques établies pour compenser les limites visuelles du terminal.

La plupart des utilisateurs échouent en privilégiant l'apparence des centres de commande au détriment de l'architecture logicielle. L'utilité d'une interface graphique se limite à deux aspects : l'observabilité des métriques et la distribution de commandes simplifiées pour des utilisateurs non techniques via des boutons pré-configurés.

Codification et visualisation des compétences

  • L'organisation des tâches en domaines comme la recherche, la productivité ou le contenu aide à structurer le modèle mental de l'agent.
  • Transformer une demande textuelle longue en un mot-clé de compétence réduit l'aléa inhérent aux modèles de langage (LLM).
  • L'utilisation d'outils comme Skill Creator permet d'effectuer des tests A/B pour valider l'efficacité des nouvelles automatisations.

L'approche systématique consiste à dicter son emploi du temps au terminal pour en extraire des processus automatisables. En regroupant plusieurs actions individuelles, comme le téléchargement d'une transcription et la publication sur plusieurs réseaux sociaux, on obtient un gain de productivité massif. Cette personnalisation sur mesure surpasse les répertoires de compétences génériques.

Intégration de l'écosystème Google et choix d'automatisation

  • L'interaction avec Gmail, Drive et Calendar s'effectue en 30 secondes via le CLI GWS ou les connecteurs MCP standards.
  • L'automatisation locale reste la norme pour maintenir l'accès aux outils système et aux fichiers personnels.
  • Le moteur de l'OS agentique est interchangeable, permettant de basculer de Claude Code vers d'autres solutions comme Codex.

La gestion des courriels se limite à la création de brouillons pour conserver un contrôle humain final avant l'envoi. Le choix entre exécution locale ou cloud dépend des besoins d'accès au système de fichiers. L'architecture globale est conçue comme un châssis indépendant du moteur d'intelligence artificielle utilisé.

Organisation de la mémoire et structure Karpathy RAG

  • Obsidian sert uniquement de couche d'organisation humaine et ne constitue pas une base de données vectorielle native.
  • L'utilisation de fichiers d'index à chaque niveau de dossier permet à l'agent de naviguer efficacement dans des milliers de documents.
  • La structure de dossiers doit rester logique pour l'utilisateur afin de faciliter la maintenance du système.

Bien qu'Obsidian n'implémente pas de RAG complexe par défaut, sa capacité à relier les fichiers Markdown améliore l'efficacité des jetons (tokens) lors des recherches. La méthode Karpathy repose sur une hiérarchie stricte où chaque dossier contient une table des matières guidant l'agent vers les informations pertinentes.

Centres de commande : Obsidian contre applications Web

  • Les applications web basées sur Streamlit facilitent la distribution rapide de solutions aux clients ou aux équipes.
  • L'intégration dans Obsidian privilégie l'ergonomie individuelle grâce à la présence simultanée du terminal et des notes.
  • La personnalisation visuelle permet d'intégrer des flux en temps réel comme GitHub Trends ou Hacker News.

Le choix de l'interface dépend de l'utilisateur final. Une application Streamlit se déploie via GitHub en quelques secondes pour des profils non techniques. À l'inverse, l'environnement Obsidian offre une puissance accrue pour l'usage personnel en regroupant calendrier, suivi d'activité et outils de recherche sur un seul écran, malgré une installation plus complexe pour des tiers.

Gestion des coûts et optimisation des performances

  • Le plafond de 200 $ de crédits API imposé par Anthropic n'impacte pas 99,99 % des utilisateurs standards.
  • Le passage à Cody CLI représente une alternative viable pour réduire les coûts sans modifier la structure des compétences.
  • Le remplacement du moteur d'exécution est un processus de refactoring rapide réalisable par l'IA elle-même.

Les inquiétudes concernant les coûts de fonctionnement en mode 'headless' sont minimisées par la possibilité de changer de fournisseur d'API. Le système est conçu pour être résilient : il suffit de soumettre le code à l'agent pour qu'il redirige les appels vers un autre CLI en quelques minutes.

Community Posts

View all posts