ARRÊTEZ d'utiliser Claude Code sans cet OS agentique Fable 5

Françaisالعربية Deutsch English Español हिन्दी Bahasa Indonesia 日本語 한국어 Português Русский 中文

Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00Hé Jarvis, donne-moi le topo pour aujourd'hui.

00:00:03Bonjour.

00:00:04Tu es à environ 466 000 abonnés sur toutes les plateformes, en hausse de 3 000 cette semaine.

00:00:12Tes dernières vidéos atteignent environ 4 000 vues par jour, 17 000 jusqu'ici.

00:00:18Grosse info IA aujourd'hui, une directive du gouvernement américain a forcé Anthropic à suspendre l'accès public à son modèle de classe mythos.

00:00:27La chose la plus importante au programme aujourd'hui, couper et publier la vidéo de présentation du HUD de Jarvis.

00:00:33Tu veux que je fasse l'audit quotidien de la boîte de réception ou tu as autre chose en tête ?

00:00:37Alors, qu'est-ce qu'on regarde exactement ici ?

00:00:39Eh bien, c'est Jarvis, notre OS Claude Fable 5.

00:00:43Quand je dis Fable 5, je veux dire que ça a été construit avec Fable 5, mais ça ne nécessite pas Fable 5 pour fonctionner.

00:00:51En fait, une grande partie de ce que vous voyez ici est complètement locale et peut tourner sur n'importe quel modèle de votre choix.

00:00:58Si vous avez vu mes précédentes vidéos sur l'OS Agentique, alors vous connaissez le principe.

00:01:01Nous avons pris Claude Code et nous y avons ajouté une couche supplémentaire, ce qui nous apporte des fonctionnalités impossibles à obtenir dans le terminal.

00:01:08Des indicateurs visuels, des compétences transformées en boutons, et ce n'est pas du théâtre de productivité.

00:01:15C'est quelque chose qui nous donne un vrai coup de boost si on opère dans plusieurs domaines, et qu'on peut facilement packager pour des clients ou des membres d'équipe non techniques.

00:01:26Et Jarvis est juste l'évolution suivante de ce modèle d'OS Agentique.

00:01:30Sa colonne vertébrale reste cette architecture de compétences Claude Code robuste et personnalisable, qui transforme tout votre quotidien, vos flux manuels, vos tâches, en compétences et automatisations.

00:01:43Et c'est sur cette base qu'on construit tout ça.

00:01:46Dans la vidéo d'aujourd'hui, je vais vous montrer comment ça marche, où se trouve la vraie valeur et comment vous pouvez créer quelque chose comme ça pour vous-même.

00:01:53Je pense qu'il y a beaucoup de choses à tirer de ce projet, surtout la dynamique du modèle vocal local.

00:01:58Avant de plonger là-dedans, un mot de notre sponsor aujourd'hui : moi.

00:02:02Dans Chase AI+, vous avez accès à ma configuration exacte de cette vidéo, ainsi qu'à la masterclass Claude Code, le meilleur moyen de passer de zéro à développeur IA, surtout sans bagage technique.

00:02:14Je mets ça à jour chaque semaine, et ça inclut aussi une masterclass Codex.

00:02:18Donc, si vous essayez de rester à la pointe de l'IA, c'est l'endroit pour vous.

00:02:23On fait des promos sur l'abonnement en ce moment, si vous voulez y jeter un œil, consultez le commentaire épinglé.

00:02:28Commençons par un tour d'horizon rapide de Jarvis pour que vous compreniez ce que vous regardez.

00:02:34Ensuite, on regardera sous le capot, comment ça fonctionne vraiment, pour que vous sachiez comment le personnaliser et le construire vous-même.

00:02:41Au centre, on a tout l'aspect vocal, encore une fois, entièrement local, ce qui le rend rapide et réactif par rapport à un routage via 11Labs, par exemple.

00:02:53Au début de la vidéo, vous avez entendu Jarvis me faire le topo sur mes dernières vidéos, mes abonnés, les news IA, etc.

00:03:01Ce n'est pas un script pré-enregistré.

00:03:03Ce qui se passe, c'est que quand je demande à Jarvis de me donner le topo ou les actus, il examine les différents rapports générés automatiquement dans mon coffre Obsidian et détermine ce qui est important.

00:03:18Pendant qu'il faisait ça, vous vous souvenez, il y avait des pop-ups. Ce sont des rapports ou des liens pertinents basés sur ce dont il parle.

00:03:29Il disait par exemple que ma dernière vidéo cartonne, donc il affiche le pop-up de déploiement qui m'emmène à ladite vidéo.

00:03:37Il mentionne des trucs sur Anthropic, genre Fable 5 annulé par le gouvernement.

00:03:42Que fait-il ?

00:03:43Il affiche l'article source.

00:03:44Il a aussi parlé d'autres news IA, et tout ça vient du rapport du matin.

00:03:49Si je clique ici, vous voyez ce compte-rendu complet.

00:03:52Ce rapport vit dans Obsidian.

00:03:54Tout le système est lié à Obsidian.

00:03:56Je peux le lire ici, mais aussi cliquer sur “Ouvrir dans Obsidian” pour voir le rapport original.

00:04:04Je peux cliquer sur les liens, il y a toute une connexion.

00:04:07Vous vous souvenez aussi qu'à la fin, il demandait s'il devait faire le tri de la boîte de réception ?

00:04:12S'il devait vérifier Gmail pour voir ce qui est important ?

00:04:15C'est une compétence, et ces compétences et automatisations sont représentées sur la droite.

00:04:21Cela me permet de lancer instantanément n'importe quelle compétence ou automatisation Cloud Code en un clic.

00:04:26Et encore une fois, si vous vous souvenez de ce que nous avons fait avec notre Cloud OS créé dans Obsidian l'autre semaine, c'est exactement la même idée.

00:04:33La valeur ajoutée ici est surtout destinée à une utilisation avec une équipe ou un client non technique,

00:04:39qui souhaite pouvoir exécuter des compétences et des automatisations avec Cloud Code sans jamais avoir à ouvrir le terminal.

00:04:44Ça leur donne toute cette puissance en un clic, et c'est entièrement personnalisable.

00:04:49Disons que je veux un résumé complet de la boîte de réception.

00:04:52Si je clique sur le bouton en haut à droite, vous voyez que c'est mis en file d'attente.

00:05:00On le voit ici, et on a un nouveau pop-up qui s'affiche, avec une barre de progression montrant que ça travaille sur l'automation.

00:05:09Une fois fini, ça génère non seulement un rapport écrit, mais ça peut aussi me donner un topo oral de ce qui se passe.

00:05:16Il m'a fait le topo rapide, et je peux voir le rapport complet, qui est toujours lié dans Obsidian.

00:05:34Ces pop-ups sont utiles, pertinents, et me renvoient à ce qui compte. Je peux tout effacer à tout moment.

00:05:39Regardons encore un peu sur la droite.

00:05:41On en a déjà parlé.

00:05:43On a différentes compétences interchangeables.

00:05:45Un clic et ça s'exécute.

00:05:47Juste en dessous, on a le planning.

00:05:50C'est mon emploi du temps quotidien lié à Google Calendar.

00:05:53Si je clique, ça ouvre mon calendrier.

00:05:56On a une section audio.

00:05:58Si vous avez fait attention quand il parlait, on voyait ça bouger, ça permet de savoir si ça fonctionne.

00:06:05En dessous, un résumé des news IA.

00:06:10Tout ce que vous voyez ici, et tout ce dont on a parlé, est entièrement personnalisable.

00:06:15Peut-être que vous vous fichez d'avoir votre planning Google Calendar ici.

00:06:18Peut-être que vous ne voulez pas voir l'audio ou les news IA.

00:06:21C'est très bien.

00:06:22La beauté de ces systèmes, c'est que ce n'est pas du “taille unique”.

00:06:29C'est juste un ensemble d'outils que je vous montre, vous en faites ce que vous voulez.

00:06:34Vos indicateurs seront différents des miens.

00:06:36Les choses à avoir en un clic seront très différentes des miennes.

00:06:40Ça dépend de vos workflows quotidiens et de ce que vous ou votre entreprise faites.

00:06:44Mais l'avantage, quand on parle de créer ça pour des clients ou des membres d'équipe, c'est que vous pouvez le modeler pour eux.

00:06:51À gauche, c'est pareil.

00:06:53Pour mes indicateurs, je montre mes abonnés, ce qui se passe avec ma dernière vidéo.

00:06:58J'ai un suivi de mes jetons Claude sur les cinq dernières heures.

00:07:01Et des directives.

00:07:03Les directives, c'est juste : “Voici les trois choses prioritaires pour aujourd'hui”.

00:07:06Encore une fois, dynamique, Claude Code le calcule en fonction de mon emploi du temps.

00:07:10Et j'ai une piste de documents.

00:07:13Tout ce qui est créé ou référencé par Jarvis n'apparaît pas juste en pop-up.

00:07:18C'est ici.

00:07:18Si je veux cliquer dessus, comme le rapport du matin, c'est là.

00:07:22Voilà pour l'interface utilisateur.

00:07:23C'est le côté visuel de Jarvis.

00:07:25Parlons maintenant des coulisses.

00:07:28Qu'est-ce qui se passe sous le capot ?

00:07:29Parce que c'est ça qui compte vraiment, soyons honnêtes.

00:07:32Si on s'arrête là, avec une belle interface, on fait juste du théâtre de productivité.

00:07:37Si ça doit vraiment faire bouger les choses, au lieu de rester tout le temps dans le terminal, il faut une base solide.

00:07:43Et c'est ce qu'on regarde ici.

00:07:45Parcourons ce qui se passe quand on parle à Jarvis et qu'on lui demande de faire quelque chose, car il peut emprunter plusieurs chemins.

00:07:53Vous lui dites : “Donne-moi une mise à jour sur le briefing du matin”.

00:08:00Vous avez une automation que vous lancez tous les matins.

00:08:03Elle récupère les infos pertinentes, et vous voulez que Jarvis vous en parle.

00:08:07Vous ne voulez pas lire.

00:08:07Vous voulez qu'il le lance, ou s'il a déjà été lancé, qu'il vous en parle.

00:08:12Vous dites vocalement à Jarvis : “Qu'est-ce qui se passe dans le rapport du matin ?”

00:08:18Cette voix, parce que vous avez utilisé votre micro, va vers Faster Whisper.

00:08:25Faster Whisper est un programme local gratuit qui transcrit ce que vous avez dit.

00:08:34Il existe mille et un transcripteurs audio locaux.

00:08:39Vous pouvez le remplacer par ce que vous voulez.

00:08:40C'est juste celui que j'ai choisi, ça marche très bien.

00:08:42Il a donc pris votre voix et l'a transformée en transcription.

00:08:46Que fait-on avec ça ?

00:08:47On a parlé de Fable 5, etc.

00:08:50Chaque transcription doit-elle alors être envoyée à Cloud Code pour qu'on exécute Fable 5 et qu'il l'analyse ?

00:08:55Non, bien sûr que non.

00:08:56Ce système est construit avec Fable 5, mais la plupart des choses qui tournent sont Opus ou Sonnet.

00:09:02Ou vous pourriez utiliser un modèle local pour beaucoup de choses car Jarvis n'a pas besoin de Fable 5.

00:09:08Vous pouvez lui dire d'utiliser Fable et ça marche très bien.

00:09:11Vous n'êtes pas en train de créer des projets avec ça.

00:09:13C'est plus dans le domaine de l'assistant personnel ou pour une équipe non technique.

00:09:17Qui veut faire des choses similaires tout le temps avec une interface simple.

00:09:22C'est ça, la vue d'ensemble.

00:09:24Donc on a pris ce que vous avez dit, transformé en transcription.

00:09:26Maintenant, quoi en faire ?

00:09:28On a trois options.

00:09:30La première question est : peut-on router cette transcription ou question via des expressions régulières (regex) ?

00:09:39Ce script, cette pièce de code déterministe, sans IA, va regarder la transcription.

00:09:45Est-ce qu'elle correspond à des phases pré-codées spécifiques qui doivent déclencher une action ?

00:09:52Qu'est-ce qu'on veut dire par là ?

00:09:55Dans l'intro, qu'est-ce que j'ai dit ?

00:09:56J'ai dit le topo pour aujourd'hui, non ?

00:09:58J'ai utilisé le terme “topo”.

00:10:00Topo est un mot déclencheur.

00:10:03Le regex capte ce terme et route automatiquement l'action à effectuer.

00:10:11Cette action, c'est ce que vous avez entendu au début.

00:10:14Regarder les rapports, me dire ce qui se passe, donner le topo pour la journée, n'est-ce pas ?

00:10:19Un résumé basique, il capte le mot-clé et fait l'action précise.

00:10:24On aime ça car c'est du code, ça ne coûte rien, aucune IA, et c'est très, très rapide.

00:10:32Dans un monde parfait, on ferait tout comme ça, pour des réponses ultra rapides.

00:10:36Mais la plupart du temps, ce qu'on demande à l'IA est un peu flou, non ?

00:10:43Ça demande un peu d'intelligence pour décider du routage.

00:10:47C'est là que l'option deux arrive : Haiku.

00:10:51Pourquoi utiliser Haiku ?

00:10:52Pourquoi le modèle Anthropic le plus “bête” ?

00:10:54Parce que c'est pas cher et rapide.

00:10:57On fait simplement du routage.

00:11:01Je ne fais rien d'autre que du regex si je peux router directement.

00:11:06On cherche juste à savoir où doit aller la requête et qui doit l'exécuter.

00:11:11Haiku est très bon pour ça.

00:11:13La plupart des choses demandées à Jarvis ne sont pas trop compliquées.

00:11:18Il faut juste comprendre le chemin à suivre, et Haiku le fait.

00:11:22On parle de fractions de centime par requête.

00:11:26Troisième option, incluse dans mon système, selon vos envies, c'est d'utiliser un modèle complètement local.

00:11:34Pas besoin d'Haiku.

00:11:35Vous pouvez utiliser un modèle sur votre PC local, ce qui renforce le côté local de tout le système, pour faire la même chose.

00:11:42Il regarde la transcription pour décider du routage.

00:11:45On fait juste du routage.

00:11:46En résumé : vous parlez, c'est transcrit, puis on utilise regex, Haiku ou un modèle local pour décider de la suite.

00:11:54Prenons du recul : on a envoyé la requête à Jarvis.

00:11:59Dis-moi ce qui se passe dans le rapport du matin.

00:12:01Haiku va se dire : “Ok, regardons Obsidian”.

00:12:06Est-ce que ça existe déjà ?

00:12:08Si le rapport est déjà sur le disque, on peut très rapidement le lire et y répondre.

00:12:16S'il n'est pas dans Obsidian, que faire ?

00:12:19Il va demander à Claude Code de créer le rapport du matin.

00:12:24Haiku route, mais ne l'exécute pas.

00:12:28On veut un modèle plus puissant.

00:12:30Par défaut, ce sera Opus, mais vous pouvez choisir Sonnet.

00:12:34Et si vous êtes fou, vous pourriez choisir Fable 5 quand il reviendra.

00:12:38S'il n'a pas encore été créé, que fait-on ?

00:12:42On a une version headless de Claude Code.

00:12:44C'est comme ouvrir Claude Code, mais invisible.

00:12:47Et il utilise “-p”.

00:12:49Notez qu'utiliser Claude Code headless avec “-p” ne puise pas dans votre abonnement.

00:12:57D'accord ?

00:12:57Ça puise dans les 200 $ de crédits API offerts chaque mois.

00:13:02Est-ce un problème ?

00:13:04À grande échelle ?

00:13:05Oui.

00:13:06C'est pourquoi vous voulez utiliser Sonnet pour beaucoup de ces choses.

00:13:10Est-ce vraiment un problème ?

00:13:13Je dirais que non.

00:13:15À quoi sert Jarvis ?

00:13:17D'assistant personnel, de gestionnaire de tâches.

00:13:21On ne construit pas Facebook avec Jarvis.

00:13:24Si c'était le cas, vous seriez dans le terminal.

00:13:27C'est pour les assistants personnels et les membres d'équipe non techniques.

00:13:31À une certaine complexité, ce ne serait pas l'outil.

00:13:33Ce n'est pas le bon outil pour ça.

00:13:35Cela dit, est-il probable de dépenser 200 $ de crédits si vous utilisez Sonnet ?

00:13:44Je dirais non.

00:13:46Ce n'est pas un gros problème, mais c'est à considérer.

00:13:48Et encore une fois, si c'est un problème pour vous, n'utilisez tout simplement pas Cloud Code pour ça.

00:13:52Ça s'appelle le Fable 5 OS, mais soyons honnêtes.

00:13:55Vous pourriez le remplacer par Codex.

00:13:56Vous pourriez remplacer tout ça par des modèles locaux.

00:13:59Vous savez, ce n'est pas obligé d'être Cloud Code.

00:14:02L'infrastructure est personnalisable et peut être remplacée par ce que vous voulez.

00:14:07Mais pour en revenir à notre exemple, nous voulions le rapport du matin.

00:14:10Comme il n'était pas dans Obsidian, il va maintenant lancer une version headless de Cloud Code pour créer le rapport pour nous.

00:14:16Ce rapport est ensuite envoyé sur Obsidian, il lit le rapport, puis génère une réponse avec ce résumé.

00:14:25Ce résumé est envoyé à Kokoro.

00:14:29Kokoro est un autre modèle local open source qui va prendre la transcription du résumé créée par Cloud Code pour la transformer en mots, pour la transformer en voix.

00:14:39Voyez ça comme un mini 11Labs sur votre ordinateur.

00:14:43Puis Kokoro dit : “Hé, dans le rapport du matin d'aujourd'hui, blablabla”, et cela vous est transmis.

00:14:49La voix que vous avez entendue aujourd'hui avec Jarvis provient de Kokoro.

00:14:53Elle peut être remplacée par n'importe quelle voix de votre choix.

00:14:55Donc, encore une fois, local et personnalisable.

00:14:56Mais c'est ainsi que tout cela fonctionne : vous demandez à Jarvis de faire quelque chose, et voilà le chemin qu'il parcourt.

00:15:04Alors, pour résumer encore une fois, car je suis sûr que beaucoup d'entre vous sont très confus, que se passe-t-il ?

00:15:10Vous demandez à Jarvis de faire quelque chose.

00:15:13Cette demande doit être transformée en transcription.

00:15:16Faster Whisper fait cela gratuitement.

00:15:18Une fois la transcription obtenue, nous devons déterminer comment l'acheminer.

00:15:22Nous utilisons soit des expressions régulières, un modèle Haiku bon marché, ou un modèle local.

00:15:28À partir de là, nous devons généralement savoir si cela existe déjà dans Obsidian, ou si nous devons faire appel à Cloud Code pour générer ce rapport, cette requête pour nous.

00:15:38Une fois qu'il a généré ce dont il a besoin, soit il crée un rapport dans Obsidian, ou peut-être est-ce une page HTML.

00:15:44Quoi qu'il en soit, il fait ce qu'il a à faire, il envoie la réponse à Kokoro, qui la transforme en une voix que nous pouvons entendre, et cela nous revient.

00:15:53Assez simple.

00:15:54Maintenant, pour aller un peu plus loin, tout ce qui se passe réellement sous le capot.

00:15:57Quand nous disons “rapport du matin”, quand nous disons “fais la compétence A, B et C”, de quoi parlons-nous vraiment ?

00:16:01Eh bien, nous parlons de ceci.

00:16:03Nous parlons de l'architecture des compétences qui est vraiment l'épine dorsale de tout.

00:16:08Car qu'est-ce qu'un rapport du matin ?

00:16:09Eh bien, cela peut signifier n'importe quoi.

00:16:10Ce que c'est, c'est une compétence faite d'autres compétences miniatures qui me donnent un grand rapport disant : “va vérifier ces sources pour cette information, va vérifier ces réseaux sociaux pour obtenir cette information”, et ainsi de suite.

00:16:24Mais, comme je n'arrête pas de le répéter, cette architecture de compétences n'est aussi solide que ce que vous en faites.

00:16:30Et comment faisons-nous cela ?

00:16:31Et si vous avez regardé mes autres vidéos, vous connaissez mon discours à ce sujet.

00:16:34Ce que vous devez faire, c'est trouver un moyen de prendre vos flux de travail quotidiens.

00:16:38Quand je dis vos flux de travail quotidiens, qu'est-ce que je veux dire ?

00:16:40Je veux dire, que faites-vous au jour le jour dans votre vie personnelle ou votre entreprise ?

00:16:43Comme, quelles sont ces tâches courantes qui sont répétées encore, encore et encore ?

00:16:47Avez-vous, en tant que personne qui sait probablement utiliser Cloud Code, vraiment pris le temps de vous asseoir avec Cloud Code et de dire : “Hé, voici ce que je fais chaque jour”.

00:16:55Pouvons-nous décomposer tout cela en tâches individuelles ?

00:16:58Et ensuite pouvons-nous transformer ces tâches en compétences ?

00:17:01Et si cela a du sens, transformer ces compétences en automatisations.

00:17:04C'est comme ça qu'on construit une architecture de compétences comme celle-ci.

00:17:06Et c'est là que réside toute la puissance de la chose.

00:17:08Par exemple, et ce que vous voyez ici, c'est une grande partie de ce que je fais dans mes différentes compétences, quelque chose comme la recherche de contenu.

00:17:14Encore une fois, la plupart d'entre vous ne créent pas de contenu, donc ce sera quelque chose de complètement différent.

00:17:17Mais le point reste valable.

00:17:19Alors, que fais-je pour la recherche ?

00:17:20Eh bien, évidemment, j'ai besoin de jeter un coup d'œil à des choses comme YouTube.

00:17:24Et donc, j'ai transformé la recherche d'informations sur YouTube en quelque chose que j'appelle ma compétence “Pipeline YT”, où elle examine les vidéos YouTube, les envoie à Notebook LM, et me donne des résumés.

00:17:35J'ai besoin de pouvoir faire des recherches approfondies sur certains sujets qui vont au-delà de YouTube, qui examinent d'autres choses, que ce soit Twitter, Internet en général, etc.

00:17:43Eh bien, j'ai transformé cela en une compétence de recherche approfondie entièrement personnalisée.

00:17:47J'ai tout un système GraphRag avec LightRag, qui contient beaucoup d'informations sur ce que j'ai fait par le passé.

00:17:52Alors, qu'est-ce que j'ai fait ?

00:17:53J'ai transformé tout ce système de requêtes en une compétence.

00:17:56Et encore, encore, encore et encore.

00:17:58J'ai ensuite répété cela dans tous les différents domaines de ma vie personnelle et professionnelle, que ce soit le contenu, ma communauté, mon agence, les ventes, etc., etc., etc.

00:18:07Et concrètement, comment vous feriez cela, c'est littéralement en ouvrant Cloud Code et en lui donnant un flux de conscience disant : “voici ce que je fais chaque jour”.

00:18:15Et ensuite vous diriez : “Hé, pouvons-nous transformer cela en compétences ?”

00:18:17Et dans Chase Heia Plus et via le lien ci-dessous, j'ai un script complet que vous pouvez brancher sur Cloud Code, et il vous guidera à travers cela si vous en avez besoin.

00:18:25Et pour en quelque sorte lier tout cela, quand nous parlons de ces compétences, si vous dites ensuite à Jarvis : “Hé, fais la compétence X, Y et Z”, et que cela passe par le processus de transcription et l'acheminement, la partie où nous lançons Cloud Code en mode “headless”...

00:18:42Si ce qu'il fait est juste une compétence simple, vous savez que vous obtiendrez un résultat qui est A, correct, et B, cohérent, parce que vous avez déjà cartographié le processus.

00:18:53Il ne reste rien au hasard.

00:18:55Et chaque fois que nous sommes capables de créer des systèmes d'IA qui sont plus déterministes par nature, c'est mieux.

00:19:02Nous sommes moins soumis aux problèmes de l'IA en général, comme : “Eh bien, peut-être qu'il fera ce que je veux, peut-être pas

00:19:08Lorsque nous créons des compétences, nous avons codifié certaines choses.

00:19:11Et donc vous prenez tout cela ensemble, et vous avez Jarvis, et vous pouvez voir sous le capot, c'est bien plus qu'une simple interface élégante avec quelques mesures qui sont juste agréables à avoir.

00:19:22Il se passe beaucoup de choses en dessous.

00:19:23Et encore une fois, la vraie puissance de quelque chose comme ça, parce que c'est une application web, c'est le fait que nous pouvons l'emballer et le partager avec des membres de l'équipe et des clients.

00:19:30Ils ont juste à vous dire, si vous êtes celui qui le crée pour eux, ce qu'ils veulent du côté de la personnalisation.

00:19:36Et la vraie, vraie puissance est toute l'architecture des compétences, et le fait que vous allez en quelque sorte les guider à travers la codification de différentes tâches.

00:19:46Parce qu'alors ils peuvent s'asseoir ici, ou n'importe qui pourrait s'asseoir dans ce fauteuil où je suis, et obtenir 80, 90 % de la puissance de Claude Code de la manière dont je l'utilise tous les jours, qui sont ces différentes compétences et automatisations.

00:19:56C'est littéralement à portée de clic pour eux.

00:19:58C'est ce que vous leur donnez vraiment.

00:20:00Et ensuite, s'ils veulent autre chose, vous savez, nous avons toute la partie vocale.

00:20:03Mais ceci, au final, est une couche fantaisiste au-dessus de tout cela.

00:20:07Donc c'est tout le système en un mot.

00:20:09Je l'aime vraiment, principalement à cause de sa personnalisation et du fait que nous pouvons ajouter beaucoup de choses locales.

00:20:14Donc vous pouvez devenir assez créatif avec ce qu'il est capable de faire et ce à quoi il est capable de se connecter.

00:20:18Encore une fois, rien ne vous empêche d'intégrer plus de sources extérieures dans quelque chose comme ça, comme le transformer en agent Slack ou ce genre de chose.

00:20:26C'est là que je vais vous laisser avec ça, les gars.

00:20:30Si vous voulez, encore une fois, ma configuration exacte dans Chase AM+, il y a un lien vers cela dans le commentaire épinglé.

00:20:36Mais sinon, faites-moi savoir ce que vous en avez pensé, et je vous verrai plus tard.

Key Takeaway

L'OS agentique Jarvis transforme des flux de travail complexes en compétences automatisées et accessibles en un clic, en combinant des outils locaux comme Faster Whisper, Obsidian et Claude Code pour supprimer la dépendance au terminal.

Highlights

Jarvis utilise une architecture agentique locale construite avec Fable 5, Claude Code et Obsidian pour automatiser les flux de travail sans passer par le terminal.
La transcription vocale locale s'effectue via Faster Whisper, tandis que la synthèse vocale est assurée par le modèle open source Kokoro.
Le routage des requêtes s'opère soit via des expressions régulières pour une exécution instantanée, soit via le modèle Claude Haiku pour une gestion économique.
L'interface web permet aux utilisateurs non techniques d'exécuter des automatisations complexes en un seul clic via une architecture de compétences personnalisables.
L'exécution en mode 'headless' de Claude Code utilise les 200 $ de crédits API mensuels offerts, réduisant ainsi les coûts opérationnels directs.

Timeline

Architecture et interface de Jarvis

L'interface Jarvis centralise les indicateurs, le planning Google Calendar et des boutons d'automatisation.
Le système s'appuie sur Obsidian pour stocker et lier les rapports générés automatiquement.
La valeur ajoutée réside dans la capacité à packager des automatisations pour des utilisateurs non techniques.

Jarvis agit comme une couche d'abstraction au-dessus de Claude Code, offrant une interface visuelle avec des indicateurs en temps réel et des compétences actionnables. L'intégration profonde avec Obsidian permet une gestion centralisée des données, facilitant l'accès aux rapports et liens sources par simple clic. Cette approche cible particulièrement les équipes ou clients souhaitant exploiter la puissance de l'IA sans interagir avec une ligne de commande.

Fonctionnement technique sous le capot

La transcription locale est traitée par Faster Whisper, suivie d'un routage via regex, Haiku ou un modèle local.
Le système choisit le modèle le plus adapté (Opus, Sonnet ou Fable 5) pour l'exécution des tâches.
Kokoro assure la conversion text-to-speech locale pour rendre les réponses audibles.

Le pipeline commence par la transcription vocale via Faster Whisper. La décision de routage privilégie les expressions régulières pour la rapidité et le coût nul, utilisant Haiku uniquement lorsque l'intention est floue. Une fois la requête routée, une instance headless de Claude Code génère les résultats, qui sont ensuite synthétisés vocalement par Kokoro, offrant une solution réactive et entièrement personnalisable.

Codification et architecture des compétences

La puissance de Jarvis repose sur la décomposition des flux quotidiens en compétences modulaires.
La création de compétences déterministes réduit les incertitudes liées aux réponses aléatoires des modèles d'IA.
Le système est entièrement modulaire, permettant le remplacement des outils par des alternatives locales ou spécialisées.

L'architecture des compétences consiste à transformer des tâches répétitives en processus codifiés. En mappant précisément les flux de travail, chaque action devient prévisible et cohérente, limitant les risques d'erreurs d'IA. Cette structure permet à tout utilisateur de bénéficier d'une exécution fiable tout en conservant la flexibilité d'intégrer de nouvelles sources ou de remplacer les briques technologiques selon les besoins spécifiques.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video