Présentation du Chat SDK

VVercel
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00(musique entraînante)
00:00:02- Bonjour à tous, je m'appelle Malte, je suis le CTO de Vercel.
00:00:16Merci de nous rejoindre aujourd'hui.
00:00:18Début janvier, nous avons donné une mission à tout le monde dans l'entreprise :
00:00:21trouvez comment multiplier votre productivité.
00:00:24Et ce que les gens ont construit continue de nous époustoufler.
00:00:27Presque chaque équipe a créé un agent pour gérer des tâches complexes,
00:00:30et la plupart sont des bots Slack que n'importe qui peut utiliser.
00:00:34Mais nous avons rencontré un problème.
00:00:35Tout le monde faisait le même travail fastidieux d'intégration
00:00:38encore et encore.
00:00:40Quelqu'un créait un agent,
00:00:41puis il fallait se débattre avec la complexité de Slack,
00:00:43et c'est plus difficile qu'il n'y paraît.
00:00:45Il faut comprendre les fils de discussion, les réactions,
00:00:47comment le bot répond, comment gérer l'état.
00:00:50Ensuite, quelqu'un demandait :
00:00:51"Hé, tu peux connecter cet agent à GitHub ?"
00:00:53Et le processus recommençait de zéro
00:00:55avec les API de GitHub.
00:00:56C'était la même logique, mais un code de plateforme différent.
00:00:59Nous avons vite compris que ces API de chat
00:01:01semblent similaires en surface,
00:01:03mais sont totalement différentes sous le capot.
00:01:05Slack supporte le streaming natif.
00:01:06On peut diffuser les tokens directement dans un message
00:01:09à mesure que l'IA les génère.
00:01:10Sur Discord, il faut publier, modifier, publier, modifier.
00:01:14Sur GitHub, aucun streaming possible.
00:01:16Slack a des fenêtres modales, Discord non.
00:01:18Microsoft Teams propose des réactions en lecture seule.
00:01:21Ce ne sont pas des détails, mais des différences fondamentales
00:01:23dans le fonctionnement de chaque plateforme.
00:01:26Ainsi, même pour un seul agent simple,
00:01:28on se retrouve avec une quantité énorme de logique
00:01:31juste pour le rendre utilisable sur différents outils.
00:01:33C'est un cauchemar.
00:01:34Et ce n'est pas seulement un problème interne à Vercel.
00:01:36Chaque entreprise va devoir trouver comment
00:01:38déployer ses agents là où le travail se fait déjà.
00:01:40Cela signifie le chat, la revue de code, le suivi de tickets, et plus encore.
00:01:42L'AI SDK résout un problème similaire pour les fournisseurs de modèles.
00:01:45Vous écrivez le code une fois et il gère
00:01:48toutes les différences d'API,
00:01:50que vous appeliez GPT, Claude ou Gemini.
00:01:51Le Chat SDK fait la même chose pour les agents interactifs.
00:01:54C'est une API unique pour les interactions d'agents sur des plateformes
00:01:58comme Slack, GitHub, Linear, Discord, Telegram,
00:02:01WhatsApp, et bien d'autres.
00:02:04Vous construisez l'agent et le Chat SDK le livre aux utilisateurs
00:02:06dans les applications qu'ils utilisent déjà.
00:02:09Fernando a travaillé sur les agents d'arrière-plan de v0
00:02:11ces dernières semaines,
00:02:15et il va vous expliquer pourquoi le Chat SDK
00:02:16était un élément critique de cette pile technologique.
00:02:18(musique entraînante)
00:02:21(la musique continue)
00:02:24Quand j'ai commencé à créer les agents d'arrière-plan v0,
00:02:28mon but était de vous permettre de taguer v0 depuis Slack
00:02:34pour ouvrir des pull requests.
00:02:36Je voulais un agent de code polyvalent
00:02:38capable de tourner en arrière-plan,
00:02:40sur n'importe quelle base de code et dans n'importe quel langage.
00:02:42J'ai donc commencé le développement,
00:02:45et j'ai envoyé la première version de l'application Slack v0
00:02:47à mes amis.
00:02:49Et la première chose qu'ils ont demandée a été :
00:02:51"Est-ce que je peux aussi l'utiliser dans les tickets Linear ?
00:02:53Et puis-je le taguer depuis un commentaire de PR GitHub ?"
00:02:56Ça m'a rappelé la première fois que j'ai sorti une appli mobile,
00:02:58quand les gens demandaient s'ils pouvaient aussi l'utiliser sur le web.
00:03:02Il est devenu clair que v0 devait fonctionner partout.
00:03:05Les attentes ont changé.
00:03:09J'ai donc dû faire un choix.
00:03:11Devions-nous coder les agents v0 plateforme par plateforme ?
00:03:14Ou pouvions-nous le faire une seule fois avec une API unifiée
00:03:18pour toutes les plateformes ?
00:03:22Comme un React Native pour les agents de chat ?
00:03:24Il se trouve que j'ai passé des années
00:03:27à créer des applications multiplateformes avec React Native.
00:03:30Ce problème ne m'est pas inconnu.
00:03:34Et c'est là que le Chat SDK est intervenu.
00:03:36Avec le Chat SDK,
00:03:39je peux me concentrer sur la création des agents v0,
00:03:40et passer moins de temps
00:03:43à me soucier des API uniques de chaque plateforme.
00:03:45Alors, à quoi cela ressemble-t-il concrètement ?
00:03:48Voici Matt pour vous en montrer plus.
00:03:50(musique entraînante)
00:03:53- Bonjour à tous.
00:03:55Comme Fernando, commençons par Slack.
00:04:11Je mentionne mon bot,
00:04:14et j'obtiens une réponse "hello world" très simple.
00:04:16Révolutionnaire, je sais.
00:04:21Et si vous regardez le code,
00:04:23vous voyez à quel point il a été facile de créer ce bot.
00:04:24Tout ce que j'ai eu à faire, c'est créer une nouvelle instance de chat,
00:04:28ajouter un écouteur de mention (on mention),
00:04:32et renvoyer "hello world" dans le fil de discussion.
00:04:35C'est tout.
00:04:38Mais nous ne voulons pas que les développeurs créent des bots en texte brut.
00:04:39Nous voulons des expériences natives riches
00:04:43qui tirent pleinement parti de chaque plateforme.
00:04:45Et les développeurs adorent JSX.
00:04:48Nous avons donc apporté JSX au Chat SDK.
00:04:51Maintenant, vous construisez avec des composants comme vous en avez l'habitude.
00:04:55Ajoutons deux boutons.
00:04:58Ici, vous pouvez voir,
00:04:59je vais transformer notre message "hello world"
00:05:03en une carte avec un bouton "Continuer"
00:05:05et un bouton "Annuler".
00:05:10Nous allons aussi ajouter un écouteur d'action
00:05:11qui affichera le nom complet de l'utilisateur
00:05:14ayant cliqué sur continuer.
00:05:17De retour dans Slack, je mentionne à nouveau mon bot.
00:05:19Et comme prévu, nous obtenons exactement ce que nous avons construit.
00:05:24Les composants s'affichent nativement.
00:05:29Je clique sur continuer, et le bot gère l'action instantanément.
00:05:32Mais c'est là que ça devient intéressant.
00:05:36Et si je voulais exactement la même expérience sur Discord ?
00:05:41J'ajoute l'adaptateur Discord.
00:05:45C'est tout.
00:05:47Maintenant, si je retourne sur mon canal Discord,
00:05:48je peux mentionner mon bot,
00:05:55et la même interface s'affiche nativement dans Discord.
00:05:57Aucun changement de code pour supporter une toute nouvelle plateforme.
00:06:02C'est génial.
00:06:07Mais parlons des agents.
00:06:08Voici un agent simple que j'ai construit avec l'AI SDK.
00:06:10Et les agents ont besoin du streaming.
00:06:14Avec le Chat SDK, le streaming est un jeu d'enfant.
00:06:17Je crée un flux et je le publie dans le fil de discussion.
00:06:20C'est tout.
00:06:23Je n'ai pas eu besoin de chercher comment Slack gère le streaming
00:06:24ou comment Discord gère les mises à jour partielles.
00:06:27J'ai utilisé une seule API.
00:06:30Et dans Slack, si je mentionne le bot,
00:06:32on le voit nous répondre en streaming de manière native.
00:06:35Mais pourquoi s'arrêter là ?
00:06:40Et si je veux envoyer des messages directs à mon agent
00:06:42sur des plateformes comme WhatsApp ou Telegram ?
00:06:45Avec le Chat SDK, c'est facile.
00:06:49J'ajoute un écouteur de message direct et l'adaptateur nécessaire.
00:06:52Désormais, quiconque envoie un DM à l'agent aura la même expérience.
00:06:56Si j'ouvre WhatsApp sur le web et que je dis :
00:07:02"Salut, comment ça va ?"
00:07:06On verra l'agent répondre à notre message direct
00:07:08en utilisant l'agent que nous avons construit.
00:07:12Maintenant que nous avons créé un agent,
00:07:14pourquoi ne pas ouvrir une pull request ?
00:07:16Mais avant cela,
00:07:18et si le même agent avec lequel j'ai discuté sur WhatsApp
00:07:20pouvait relire mon code ?
00:07:24Il suffit d'ajouter l'adaptateur GitHub.
00:07:25Je viens ici, j'ajoute l'adaptateur GitHub,
00:07:28et j'ai porté mon agent sur une toute nouvelle plateforme.
00:07:32Si j'ouvre GitHub et que je regarde cette pull request,
00:07:35je peux mentionner l'agent dans les commentaires
00:07:39et il répondra avec le même écouteur de message direct
00:07:42que nous avons construit précédemment.
00:07:45Slack, Discord, WhatsApp, Telegram, GitHub.
00:07:46Réfléchissez une seconde à quel point ces API sont différentes.
00:07:51Pourtant, avec un seul fichier et quelques lignes de code,
00:07:56nous y avons déployé notre agent.
00:07:59Avec le Chat SDK, vous créez vos expériences d'agent une fois
00:08:01et vous les déployez partout avec une seule API.
00:08:06Rendez-vous sur chat-sdk.dev pour consulter la doc et les templates.
00:08:09Merci de m'avoir écouté.
00:08:14Et j'ai hâte de voir ce que vous allez construire.
00:08:15(musique entraînante)
00:08:17(musique entraînante)

Key Takeaway

Le Chat SDK est une solution multiplateforme permettant de construire des agents interactifs une seule fois et de les déployer partout via une API unifiée et des composants JSX.

Highlights

Le Chat SDK de Vercel offre une API unique pour déployer des agents IA sur de multiples plateformes comme Slack, Discord et GitHub.

L'outil résout la complexité liée aux différences techniques entre les plateformes, telles que la gestion du streaming ou des composants natifs.

Les développeurs peuvent utiliser JSX pour construire des interfaces riches et interactives de manière familière.

L'intégration d'agents dans le flux de travail existant (tickets Linear, pull requests GitHub) augmente considérablement la productivité.

Le streaming de tokens est géré de façon transparente par le SDK, qu'il soit supporté nativement ou simulé par des mises à jour.

L'ajout d'une nouvelle plateforme de communication se résume souvent à l'ajout d'un simple adaptateur dans le code.

Timeline

Introduction et problématique du développement multiplateforme

Malte, le CTO de Vercel, explique comment l'entreprise a cherché à multiplier sa productivité interne grâce aux agents IA. Il souligne la frustration des équipes devant répéter le même travail d'intégration pour chaque nouvel outil de communication. Chaque plateforme, de Slack à Discord, possède des limitations et des fonctionnalités uniques comme le streaming ou les fenêtres modales. Cette hétérogénéité transforme le déploiement d'un simple agent en un véritable cauchemar logistique et technique. Le Chat SDK est présenté comme la solution permettant d'unifier ces interactions sous une interface de programmation unique.

L'expérience de v0 et la nécessité d'ubiquité

Fernando partage son expérience lors de la création des agents d'arrière-plan pour v0, initialement conçus pour Slack. Très vite, les utilisateurs ont réclamé une intégration dans les tickets Linear et les commentaires de pull requests sur GitHub. Il compare cette situation à l'avènement du développement mobile où les utilisateurs s'attendent à une disponibilité sur tous leurs appareils. Le dilemme était de choisir entre coder chaque plateforme individuellement ou adopter une approche unifiée. En utilisant le Chat SDK, il a pu se concentrer sur la logique de l'agent plutôt que sur les spécificités des API tierces.

Démonstration technique : de Slack à Discord avec JSX

Matt effectue une démonstration technique montrant la simplicité de mise en œuvre d'un bot "Hello World" sur Slack. Il introduit l'utilisation de JSX au sein du Chat SDK pour créer des interfaces riches avec des boutons et des cartes interactives. Le code reste déclaratif et familier pour les développeurs habitués aux frameworks modernes comme React. La force du SDK est démontrée lorsqu'il suffit d'ajouter un adaptateur Discord pour que la même interface s'affiche nativement sans modifier la logique métier. Cette abstraction permet un gain de temps majeur lors du portage d'une application de chat vers un nouvel environnement.

Streaming, messagerie directe et intégration GitHub

Cette section finale aborde des fonctionnalités avancées comme le streaming natif des réponses de l'IA sur diverses plateformes. Matt montre comment un agent peut répondre à des messages directs sur WhatsApp et Telegram en utilisant le même code source. L'intégration s'étend même à GitHub, où l'agent peut participer à des revues de code directement dans les commentaires de pull requests. Le présentateur insiste sur le fait qu'un seul fichier de code peut désormais piloter des expériences utilisateur sur cinq plateformes radicalement différentes. La vidéo se conclut par une invitation à consulter la documentation officielle pour commencer à bâtir des agents universels.

Community Posts

View all posts