J'ai tenté de diriger une entreprise composée d'agents IA

BBetter Stack
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00J'ai donné le même repo à trois agents d'IA, et ensemble, ils ont formé une entreprise. L'un a tenté de créer la
00:00:06fonctionnalité, un autre a réécrit l'architecture, et le dernier a ouvert et géré tous les tickets. Sans
00:00:12structure, toute configuration multi-agents tourne lentement à la confusion et fait exploser la facture.
00:00:17Voici Paperclip, qui essaie de corriger cela. Une commande vous offre un plan de contrôle local pour
00:00:22agents d'IA avec organigrammes, tickets, budgets, journaux d'audit et même des signaux de vie.
00:00:27Il vient de dépasser les 64 000 étoiles sur GitHub.
00:00:30Créons notre propre entreprise avec quelques agents d'IA en quelques minutes.
00:00:33Le problème avec les agents, c'est qu'un agent seul, c'est sympa. On lui donne une tâche, il écrit du
00:00:44code. Super. Puis on ajoute un deuxième agent, voire un troisième. Et ce qui arrive,
00:00:51c'est que soudain, cela devient du travail de gestion. Qui est responsable de la tâche ? C'est la question. Qui
00:00:57garde l'objectif en tête, et qui arrête l'agent quand il commence à faire n'importe quoi ?
00:01:03C'est le problème que Paperclip tente de résoudre. Les agents bruts travaillant seuls ne sont pas géniaux. Utiles,
00:01:08mais difficiles à coordonner. Paperclip en fait une équipe, ou dans ce cas précis, une
00:01:13entreprise. Nous définissons un objectif. Nous créons un organigramme. Il peut y avoir un CEO, un CTO,
00:01:20deux ingénieurs et un agent de recherche. Ensuite, Paperclip coordonne le travail via des tickets, des signaux de vie,
00:01:27vos budgets, approbations et traçabilité. On voit la tâche, qui l'a assignée, combien a été réellement
00:01:33dépensé pour cette tâche, et si elle est toujours liée à l'objectif final. Une orchestration moins basée sur le feeling ?
00:01:39Voyons cela en direct. Si vous aimez les outils de codage pour accélérer votre flux de travail, n'oubliez pas de
00:01:43vous abonner. Nous publions des vidéos tout le temps. Très bien, regardez ça. Dans un terminal propre,
00:01:49je vais simplement lancer NPX Paperclip AI onboard. Cela lance la configuration locale. Quelques instants
00:01:56plus tard, Paperclip tourne avec le tableau de bord. J'ai des services locaux, Postgres est inclus,
00:02:03ainsi que l'authentification. Voici toute l'interface utilisateur où je peux créer une nouvelle entreprise. Je vais
00:02:09créer une nouvelle entreprise et l'appeler “dev tools company”, ou peu importe votre projet. Pour ceci,
00:02:14je vais définir cet objectif. Le but est simple : construire et lancer un MVP de raccourcisseur d'URL cette
00:02:20semaine. Maintenant, je peux ajouter un agent CTO. Puis deux ingénieurs via des adaptateurs. L'un de ces agents
00:02:28ingénieurs possède le backend. L'autre possède le frontend et la couverture de tests. Maintenant, avant de cliquer
00:02:34sur démarrer, je vais fixer le budget. C'est ce qui compte vraiment, car le but est de ne pas laisser
00:02:39les agents vider mon API jusqu'à l'explosion de la facture. Non, le but est l'autonomie contrôlée. Je dois aussi
00:02:46définir le chemin vers mon répertoire de travail où le code sera généré. Je le règle ici.
00:02:50Maintenant, je peux activer les signaux de vie et démarrer. Regardons le tableau. Les agents se réveillent
00:02:57au signal. Le CTO décompose l'objectif en tickets. Nos ingénieurs ici commencent à prendre le travail.
00:03:05On peut voir la délégation, les tickets, l'historique, les changements de statut, le compteur de budget, tout cela
00:03:10lié ensemble. Et déjà, la première tâche d'implémentation avance vers un commit de code.
00:03:15Cela a pris pas mal de temps pour s'exécuter, mais j'imagine qu'avoir tous ces agents ensemble,
00:03:19ça a du sens, mais ce n'est pas encore le plus rapide, surtout si on essaie de passer à
00:03:24plus grande échelle. Il ne s'agit plus d'un seul agent dans une boîte de chat. C'est désormais une petite entreprise
00:03:30qui tourne grâce à ces agents, CEO, CTO et ingénieurs. C'est là que les gens se
00:03:37trompent. À première vue, Paperclip ressemble à un autre framework d'agents, un autre Crew AI, un autre
00:03:43Auto-gen ou un flux de type Langraph. Ce n'est pas vraiment le sujet. Ces outils sont parfaits
00:03:49pour un workflow, non ? Par exemple : un chercheur, puis un planificateur, un rédacteur, puis un réviseur. Bien sûr,
00:03:55c'est utile. C'est pour cela qu'on les utilise. Mais Paperclip vise le niveau supérieur. Il ne s'agit plus
00:04:01seulement des travailleurs. C'est l'entreprise qui entoure ces travailleurs dans cet organigramme
00:04:07pour vraiment aider au développement. Voyez-le comme ceci :
00:04:13Un agent seul n'est qu'un employé. Un workflow est votre liste de tâches. Paperclip est le manager,
00:04:20l'organigramme, le tableau de tickets, le système de budget, le journal d'audit. Paperclip est le manager.
00:04:25Alors les questions que vous vous posez déjà : un agent peut-il écrire du code ? On sait
00:04:30déjà que oui. C'est le but de tout ça. Il le génère en ce moment. Les questions difficiles sont :
00:04:36Peut-il travailler sur la bonne tâche ? Peut-il s'arrêter quand il le faut ? Peut-il passer le relais clairement ?
00:04:43Puis-je inspecter ce qui se passe ici ? La réponse courte à tout cela est : oui, il le peut.
00:04:49Paperclip vous donne l'état, les signaux de vie, le budget, la hiérarchie, les logs. Il offre même des
00:04:55modèles portables et un tableau de bord qui ressemble plus à Jira ou Linear pour agents qu'à une fenêtre de chat.
00:05:02On arrête de prompter un agent pour diriger cette mini-organisation. Beaucoup d'entre nous jonglent
00:05:07sûrement entre terminaux et configurations. Un terminal pour Claude Code, un onglet pour Cursor, un agent pour
00:05:13la recherche, un script pour les issues GitHub, non ? On saute entre toutes ces fenêtres,
00:05:18mais Paperclip donne à tout cela un modèle opérationnel partagé. Maintenant, le modèle mental
00:05:24de tout cela change pour nous. Au lieu de dire : “Hé, s'il te plaît, crée cette fonctionnalité”, ce qu'on
00:05:30dit réellement ressemble plutôt à : “L'objectif de cette entreprise est de livrer ce
00:05:35produit. Voici les règles de l'entreprise. Voici l'organigramme et voici le budget.”
00:05:41“Voici ce qui nécessite une approbation. Maintenant, lance-toi.” Pour être honnête, la structure est agréable,
00:05:46non ? Tickets, historique, délégation, tout ça. Le travail multi-agents est plus facile à comprendre
00:05:52avec ça. Au lieu de dire que l'agent a fait quelque chose, bravo. On voit qui a assigné
00:05:58ce travail, pourquoi il existe et où il s'insère dans notre code. Pouvoir fixer des budgets est aussi énorme.
00:06:05Beaucoup d'outils d'agents traitent les coûts après coup. Paperclip intègre le coût
00:06:12dans toute la boucle de contrôle. On fixe le budget avant l'exécution. C'est auto-hébergé et open
00:06:17source. Encore une victoire majeure. On peut le lancer localement, l'inspecter, le modifier et le connecter
00:06:22aux agents déjà utilisés. Mais en même temps, cette même structure
00:06:27qui rend Paperclip puissant peut aussi être très agaçante. Si vos règles sont mauvaises, les agents créent
00:06:32des tickets absurdes. Je voulais un simple raccourcisseur d'URL, mais mon agent CTO a peut-être lancé
00:06:39cet autre plan dont je ne voulais même pas. Donc non merci. La consommation de tokens est aussi réelle,
00:06:45non ? C'est pourquoi nous avons des budgets, mais cela ne corrige pas les prompts médiocres ou les règles
00:06:52vagues. Et si vos fichiers skills.md sont nuls, votre entreprise se comporte comme une startup confuse.
00:06:59Donc, c'est le skills.md qui doit être solide, d'accord ? Et enfin, honnêtement,
00:07:03pour un simple script, c'est totalement excessif. Je voulais juste tester ça. Je n'en avais pas
00:07:08besoin pour ce projet, mais si vous voulez juste qu'un agent résume un fichier ou corrige un bug,
00:07:13vous n'avez pas besoin de ça. C'est pour construire bien plus, en faisant travailler plusieurs agents
00:07:18ensemble. Ça vaut le coup, mais ce n'est pas pour tout. Si vous aimez ces outils et
00:07:23conseils de code, abonnez-vous. On se voit dans une autre vidéo.

Key Takeaway

Paperclip transforme les agents d'IA individuels en une entreprise structurée en utilisant des organigrammes et des budgets pré définis pour éviter la confusion opérationnelle et le gaspillage de ressources API.

Highlights

  • Paperclip offre un plan de contrôle local pour orchestrer des agents d'IA avec des organigrammes, des budgets et des journaux d'audit.

  • Le projet a dépassé les 64 000 étoiles sur GitHub, signalant une adoption massive pour la gestion multi-agents.

  • L'outil permet de définir une hiérarchie précise incluant des rôles de CEO, CTO et ingénieurs pour diviser les objectifs complexes.

  • Le système intègre un contrôle budgétaire strict qui bloque l'exécution avant que la consommation de jetons d'API n'explose.

  • La configuration s'effectue localement via la commande npx paperclip-ai onboard et inclut des services comme Postgres.

  • Les agents communiquent et progressent via un système de tickets similaire à Jira ou Linear au lieu d'une simple interface de chat.

  • L'efficacité de l'organisation dépend de la solidité des fichiers skills.md qui définissent les compétences des agents.

Timeline

Limites de la collaboration multi-agents non structurée

  • L'absence de structure dans les systèmes multi-agents mène à une confusion technique et à des coûts financiers incontrôlés.
  • La gestion de plusieurs agents nécessite de définir clairement les responsabilités et les mécanismes d'arrêt des tâches.
  • Paperclip coordonne le travail à travers des tickets et des signaux de vie pour maintenir l'alignement avec l'objectif final.

L'utilisation de trois agents sur un même dépôt sans cadre organisationnel entraîne des conflits, comme la réécriture simultanée de l'architecture et la création de fonctionnalités. Paperclip résout ce problème en remplaçant le sentiment d'orchestration par un plan de contrôle rigoureux. Ce système permet de suivre précisément qui a assigné une tâche et combien d'argent a été dépensé pour sa réalisation.

Configuration technique et lancement d'une entreprise IA

  • La commande npx paperclip-ai onboard initialise un environnement local complet avec base de données Postgres et authentification.
  • La définition d'un objectif clair, comme le lancement d'un raccourcisseur d'URL en une semaine, sert de base à la délégation.
  • Le budget doit être fixé impérativement avant le démarrage pour garantir une autonomie contrôlée des agents.

L'interface utilisateur permet de nommer l'entreprise et de configurer l'organigramme en ajoutant des agents via des adaptateurs. Un agent CTO décompose l'objectif principal en tickets actionnables pour les ingénieurs frontend et backend. Le tableau de bord affiche en temps réel les changements de statut, les commits de code et le compteur de budget lié à chaque action.

Différenciation entre workflow et modèle opérationnel

  • Paperclip se distingue des frameworks comme CrewAI ou Langgraph en se concentrant sur la gestion managériale plutôt que sur le simple flux de travail.
  • L'outil agit comme un manager centralisant le tableau de tickets, le système budgétaire et les journaux d'audit.
  • Le modèle mental passe de la rédaction de prompts individuels à la gestion d'une organisation par des règles et une hiérarchie.

Alors que les outils classiques automatisent une suite de tâches simples comme la recherche et la rédaction, Paperclip gère l'entourage opérationnel des travailleurs. Il répond aux questions critiques sur la capacité de l'agent à s'arrêter ou à passer le relais proprement. L'interface s'éloigne du chat traditionnel pour adopter les codes visuels de logiciels de gestion de projet comme Jira.

Avantages opérationnels et risques de la structure

  • L'intégration du coût dans la boucle de contrôle permet une gestion proactive des dépenses avant l'exécution des tâches.
  • La qualité des résultats dépend directement de la précision des fichiers de compétences skills.md et de la clarté des règles.
  • L'utilisation de Paperclip est superflue pour des tâches simples comme la correction d'un bug unique ou le résumé d'un fichier.

Le passage entre plusieurs outils comme Claude Code ou Cursor crée une fragmentation que Paperclip unifie sous un modèle opérationnel partagé. Cependant, une mauvaise définition des règles peut inciter les agents à générer des tickets inutiles ou hors sujet. L'outil est conçu pour des projets d'envergure nécessitant la collaboration de plusieurs agents, mais s'avère trop complexe pour de petits scripts isolés.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video