CopilotKit : Le problème des chatbots IA dans les applications SaaS

BBetter Stack
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00La plupart des fonctionnalités et applications d'IA ont le même problème : elles sont belles, mais ce ne sont en fait que des boîtes de dialogue
00:00:06collées sur le côté de l'écran. Vous demandez quelque chose, elles vous donnent du Markdown, peut-être un tableau,
00:00:11peut-être même quelques paragraphes expliquant le travail qu'il vous reste à faire. Mais si l'agent ne se contentait pas
00:00:17de parler ? Voici Copilot Kit : il peut rendre de vrais composants, partager l'état en direct avec votre application
00:00:23et s'arrêter pour demander une approbation avant de changer quoi que ce soit. Est-ce que cela peut rendre une fonctionnalité d'IA
00:00:29plus intégrée au produit ? Découvrons-le.
00:00:37Tout d'abord, beaucoup de gens pensent qu'ils ajoutent de l'IA à leur application, mais ce qu'ils ajoutent vraiment, c'est une
00:00:43seconde application dans leur application. Votre produit est d'un côté, l'IA de l'autre, et l'utilisateur doit
00:00:49copier le contexte dans sa tête pour que tout fonctionne. C'est très bien si tout ce dont
00:00:54vous avez besoin est une structure de questions-réponses basique, mais dès que vous voulez que l'agent mette à jour un état,
00:01:00appelle des outils ou travaille avec l'utilisateur dans un flux de travail réel, on commence à se heurter à un mur. Vous construisez alors
00:01:07des flux d'événements, une synchronisation d'état, des flux d'approbation, et tout le monde reconstruit la même chose, juste un peu
00:01:14différemment. Copilot s'attaque à ce problème dès le départ. La question n'est pas : comment créer un autre chatbot ?
00:01:20La meilleure question est : comment rendre les agents natifs au sein même des applications ? Commençons par la démo, puis
00:01:26j'analyserai ce qui est réel, ce qui est utile, et ce qui est un peu excessif. Si vous aimez les outils de codage
00:01:32pour accélérer votre flux de travail, assurez-vous de vous abonner, nous publions des vidéos tout le temps. Très bien, maintenant
00:01:37regardez ça. Je pars d'un terminal propre et nous pouvons simplement exécuter l'installation que j'ai récupérée de Copilot Kit
00:01:42pour échafauder l'application et me donner un point de départ fonctionnel, tout comme n'importe quel autre projet que nous aurions vraiment
00:01:49démarré, pas seulement une bulle de chat vide, mais de vrais morceaux. Les éléments front-end sont déjà connectés
00:01:56suffisamment pour que je puisse commencer à tester l'expérience réelle que nous voulons. Maintenant, je me lance et j'exécute le mode
00:02:02développement, et voici l'application qui tourne localement. Bien sûr, cette partie semble familière, il y a une surface de chat
00:02:09mais ce n'est pas vraiment la partie la plus intéressante ici. La partie vraiment cool, c'est ce qui se passe quand
00:02:13l'agent est connecté à l'interface utilisateur. Je vais poser une question ici, dans l'interface, d'accord, voilà.
00:02:21Et remarquez la chose importante ici : l'agent ne se contente pas de répondre avec un bloc de texte. Il peut diffuser la
00:02:26réponse, il peut appeler des outils et il peut rendre un véritable composant à l'intérieur de l'application. C'est le premier
00:02:32changement vraiment important ici avec Copilot Kit : l'IA ne décrit pas seulement l'interface, elle est maintenant
00:02:38une partie intégrante de tout cela. Maintenant, allons encore plus loin. Je vais lui poser une question de suivi ici
00:02:46d'accord, et voici la partie que beaucoup d'autres agents vont sauter : notre agent fait une pause, il demande une
00:02:52approbation. Et le fait de demander une approbation est la partie qui compte, c'est la partie que j'aime vraiment parce que
00:02:57dans le logiciel réel, le contrôle n'est pas vraiment optionnel. Nos utilisateurs ont toujours besoin du dernier mot sur ce qui
00:03:03se passe. Une démo sympa, non ? Maintenant, la façon facile d'expliquer Copilot Kit, c'est vraiment ceci : Copilot Kit
00:03:09est une pile front-end pour les applications agentiques. Ce n'est pas juste un composant de chat, ce n'est pas juste un habillage autour
00:03:15d'une autre API LLM. Il vous donne les pièces dont nous avons besoin pour des expériences d'IA qui vivent à l'intérieur du produit.
00:03:23Il y a quatre éléments à bien comprendre ici. Le premier est AGUI. AGUI est un protocole ouvert basé sur les événements
00:03:31pour la façon dont les agents parlent aux interfaces front-end. En ce moment, l'outillage des agents a des problèmes de connexion. Vous avez LangGraph,
00:03:37CrewAI, des agents personnalisés et n'importe quel nouveau framework lancé ce matin. Nous essayons de
00:03:43l'intégrer dans notre application, puis vous avez des applications React, des applications mobiles, des tableaux de bord, tout ce qui
00:03:48se passe là-bas. Cela fait beaucoup de choses différentes à jongler. Toutes ces choses sont jonglées sans un protocole
00:03:55partagé. Chaque back-end a besoin de code personnalisé pour chaque front-end. AGUI essaie de devenir le langage
00:04:01partagé entre l'agent et l'interface : messages, mises à jour d'état, appels d'outils, événements d'interface utilisateur, tout circulant
00:04:07via un flux d'événements commun. Ensuite, nous avons l'interface utilisateur générative. Au lieu que le modèle ne renvoie que du texte, l'agent peut
00:04:14déclencher de vrais composants. Ce n'est pas du HTML aléatoire, c'est juste votre interface utilisateur rendue au bon moment. Ensuite, il y a
00:04:22l'état partagé, ou ce que Copilot Kit appelle des co-agents. Le front-end et le back-end de l'agent peuvent partager l'état dans les deux
00:04:29directions. Quand l'utilisateur change quelque chose, l'agent peut réagir ; quand l'agent met à jour quelque chose, l'interface utilisateur peut le
00:04:35refléter. C'est énorme quand nous construisons des outils, des tableaux de bord, tout ce où l'utilisateur et l'agent
00:04:41travaillent sur le même objet. Enfin, il y a tout l'aspect “humain dans la boucle”. C'est l'une des parties les plus
00:04:47importantes. Avec tout cela, beaucoup d'agents, beaucoup de démos d'agents, peuvent donner l'impression que la meilleure expérience
00:04:52est l'autonomie totale, mais en réalité, ce n'est pas toujours le cas. Dans les produits réels, les utilisateurs veulent du pouvoir et
00:04:59du contrôle : confirmer avant d'envoyer, approuver avant de créer, choisir entre des options, tout ce genre de choses. Et Copilot
00:05:05nous donne des outils pour exactement cela. Maintenant, Copilot n'est pas le bon choix pour tout le monde. Si vous le comparez
00:05:10à quelque chose comme le SDK AI de Vercel, Copilot Kit est plus “prêt à l'emploi”. Si vous voulez du chat en streaming,
00:05:17de l'interface utilisateur générative, de l'état partagé et des modèles d'approbation humaine directement intégrés, c'est ce que Copilot Kit
00:05:23apporte, en se rapprochant de la couche produit complète. Le SDK AI de Vercel est plus léger, il vous donne un contrôle de bas niveau plus important,
00:05:31donc si vous voulez maîtriser chaque partie de l'architecture, alors c'est honnêtement un bien meilleur choix. Maintenant, si
00:05:38vous comparez Copilot Kit au fait de tout construire vous-même, c'est là qu'il est assez difficile à battre,
00:05:43car la partie difficile n'est pas de rendre une bulle de chat - c'est désormais la partie facile. La
00:05:49partie difficile est tout ce qui entoure cela. Mais bien sûr, avec tout cela, il y a un compromis : cela peut sembler
00:05:54plus lourd qu'un SDK d'IA minimal, bien sûr, vous adoptez les modèles de Copilot Kit. De plus, c'est gratuit
00:06:02jusqu'à un certain point. Honnêtement, si vous jouez en solo, OK, c'est super cool, mais cela devient ennuyeux quand
00:06:08vous voulez l'utiliser à l'échelle, car alors tout cela n'est plus gratuit. Aussi, si vous connaissez une alternative
00:06:14complètement open source à cela, laissez un commentaire et faites-le moi savoir, car je suis justement à la recherche de cela.
00:06:19Avec Copilot Kit, vous devez comprendre ce qui est open source, vous devez comprendre ce qui nécessite des clés,
00:06:25ce qui est hébergé, ce qui est payant. Ce n'est pas juste pour critiquer Copilot en disant que tout est mauvais, mais vous devez
00:06:32comprendre ce qui est gratuit et ce qui ne l'est pas. Si vous avez seulement besoin d'un chatbot de support basique, Copilot Kit est probablement
00:06:38un overkill, mais si vous voulez quelque chose qui fonctionne vraiment bien pour une expérience utilisateur agentique où les agents travaillent avec
00:06:44votre interface utilisateur et votre état d'application, c'est vraiment cool. Alors, devriez-vous utiliser Copilot Kit ? Eh bien, essayez-le si
00:06:50vous construisez une IA sérieuse dans l'application, surtout si vous êtes sur React ou Next.js et que vous voulez que l'IA
00:06:56donne l'impression de faire partie du produit, pas juste d'être un panneau latéral. C'est vraiment cool, vous pouvez le mettre en place très
00:07:02rapidement, et avec tous les composants que nous avons, il devient très pratique de l'intégrer dans le flux de travail. Si vous
00:07:07avez déjà construit votre propre interface de streaming, d'état et d'appel d'outils, cela ne vaut peut-être pas la peine. Et si votre
00:07:13fonctionnalité consiste littéralement à poser une question et obtenir une réponse, Copilot Kit sera un gros overkill pour
00:07:19cela. Vous n'avez probablement pas besoin d'une pile front-end agentique complète, utilisez simplement quelque chose de plus léger. OK, lancez-vous,
00:07:25avancez, allez-y. Si vous aimez les outils de codage comme celui-ci, assurez-vous de vous abonner à la chaîne Better Stack.
00:07:30On se retrouve dans une autre vidéo.

Key Takeaway

CopilotKit transforme les chatbots SaaS en agents natifs capables de manipuler l'interface utilisateur et les états d'application via le protocole AGUI.

Highlights

  • CopilotKit remplace les chatbots isolés par une pile front-end permettant aux agents IA d'interagir nativement avec les composants de l'interface utilisateur.

  • Le protocole AGUI synchronise les messages, les appels d'outils et les mises à jour d'état entre l'agent et le front-end via un flux d'événements commun.

  • La fonctionnalité d'approbation humaine permet aux utilisateurs de valider ou de refuser les modifications d'état suggérées par l'agent avant leur exécution.

  • Les co-agents partagent l'état entre le front-end et le back-end, permettant à l'interface de refléter les actions de l'agent et vice-versa.

  • CopilotKit est optimisé pour les environnements React et Next.js, contrairement au SDK AI de Vercel qui offre un contrôle de bas niveau plus granulaire.

Timeline

Limites des chatbots IA conventionnels

  • La plupart des fonctionnalités IA actuelles se limitent à des boîtes de dialogue isolées sur le côté de l'écran.
  • Le développement de flux d'événements et la synchronisation d'état pour intégrer réellement l'IA dans une application existante sont complexes et redondants.

Les applications IA classiques agissent comme une seconde application superposée, obligeant l'utilisateur à gérer manuellement le contexte. Cette approche est viable pour du simple questions-réponses, mais échoue dès lors qu'une mise à jour réelle de l'interface ou de l'état du produit est requise. CopilotKit vise à résoudre ce problème en rendant l'agent natif au cœur de l'application.

Fonctionnalités et composants de CopilotKit

  • L'IA peut diffuser des réponses, appeler des outils et rendre des composants réels au sein de l'interface.
  • Le protocole AGUI standardise la communication entre les agents et le front-end.
  • Les co-agents permettent une synchronisation bidirectionnelle de l'état entre l'utilisateur et l'agent.

L'intégration permet à l'agent de ne plus se contenter de générer du texte, mais de déclencher des éléments d'interface spécifiques. Le protocole AGUI élimine le besoin de code personnalisé pour chaque couplage entre un agent et un front-end. De plus, la capacité de l'agent à mettre en pause un flux de travail pour demander une approbation humaine garantit le contrôle final de l'utilisateur sur les actions de l'IA.

Positionnement, compromis et cas d'usage

  • CopilotKit est une solution prête à l'emploi tandis que le SDK AI de Vercel offre un contrôle de bas niveau supérieur.
  • L'outil est particulièrement adapté aux applications complexes sur React ou Next.js.
  • L'utilisation de CopilotKit devient payante à grande échelle.

Pour des fonctionnalités de support basiques, cet outil constitue une surcharge technologique. Cependant, pour des expériences agentiques où l'IA manipule des objets complexes, il surpasse les solutions maison en termes de gain de temps. Une analyse des coûts d'hébergement est nécessaire, car bien que l'outil dispose d'une partie open source, certaines fonctionnalités ou services annexes nécessitent des abonnements.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video