Kimi K2.6 peut lancer une entreprise en 40 minutes ! (Analyse complète du modèle)
BBetter Stack
컴퓨터/소프트웨어마케팅/광고창업/스타트업AI/미래기술
Transcript
00:00:00Comme vous pouvez le voir avec cet exemple, vous pouvez pratiquement lancer votre propre petite agence web
00:00:04en 40 minutes grâce à cette fonctionnalité de Kimi.
00:00:07Eh bien les amis, Moonshot AI est de retour avec une nouvelle mise à jour de son modèle phare, Kimi.
00:00:13Kimi K 2.6 est leur dernier modèle qui promet un codage de pointe,
00:00:18une exécution sur le long terme et des capacités d'essaim d'agents.
00:00:22Dans la vidéo d'aujourd'hui, nous allons examiner ce nouveau modèle, voir comment il se comporte sur différentes
00:00:27tâches agentiques, et découvrir s'il est vraiment aussi impressionnant que annoncé.
00:00:32Ça va être très amusant, alors plongeons dans le vif du sujet.
00:00:34Il y a quelques mois, j'ai testé Kimi K 2.5 et il a très bien fonctionné sur le design front-end.
00:00:44Et j'ai été sincèrement impressionné par leur fonctionnalité d'essaim d'agents.
00:00:48J'ai aussi adoré le fait qu'ils aient mis autant d'efforts dans l'UX de leur propre page de chatbot.
00:00:54Donc, dans cette nouvelle version, Kimi promet des avancées assez massives
00:00:57dans la manière dont nous utilisons réellement les agents IA dans un environnement de production.
00:01:02Tout d'abord, l'essaim d'agents a pratiquement triplé.
00:01:05Avec K 2.5, nous étions à environ 100 sous-agents, mais K 2.6 passe à l'échelle horizontalement
00:01:12jusqu'à 300 agents spécialisés capables d'exécuter jusqu'à 4 000 étapes coordonnées.
00:01:18C'est donc une mise à jour assez massive.
00:01:20Désormais, vous pouvez exécuter plus de tâches en parallèle simultanément.
00:01:24Ils ont également ajouté un nouveau mode de réflexion préservée,
00:01:26qui maintient la cohérence du raisonnement du modèle à travers les tâches multi-étapes.
00:01:31Cela empêche la dérive de mémoire qui se produit généralement lorsque vous êtes plongé dans un flux de travail complexe.
00:01:36Ensuite, nous avons les tâches sur le long terme.
00:01:39Et lors de leurs tests, il a géré une tâche d'ingénierie de 13 heures avec un gain de débit de 185 %.
00:01:46Et en ce qui concerne l'esthétique, il s'est orienté vers le design piloté par le code.
00:01:51Au lieu de simplement créer une jolie page d'atterrissage, K 2.6 utilise son propre encodeur de vision natif
00:01:57appelé MoonVIT pour raisonner sur les structures UI et UX à un niveau plus profond.
00:02:03Il peut désormais gérer des flux de travail full-stack, de l'authentification à la journalisation de base de données,
00:02:08transformant une simple référence visuelle ou une invite en un prototype interactif pleinement fonctionnel
00:02:14avec des animations GSAP, des effets de déclenchement au défilement et toutes sortes d'améliorations.
00:02:19Et soit dit en passant, tout cela est open source, y compris l'encodeur de vision.
00:02:23Donc, si vous le souhaitez, vous pourriez réellement l'exécuter de manière autonome,
00:02:26détaché de l'architecture de Kimi, si vous récupérez le modèle sur Hugging Face.
00:02:30Tout cela semble très impressionnant, mais testons-le pour voir comment il se comporte réellement.
00:02:35Et les modèles de Kimi sont open source, donc vous pourriez théoriquement les utiliser dans la configuration que vous préférez.
00:02:40Mais pour tester leur essaim d'agents, je vais utiliser leur propre interface de chatbot
00:02:46pour obtenir les meilleurs résultats. Tout d'abord, je veux essayer la nouvelle fonctionnalité d'essaim d'agents.
00:02:50En regardant leurs exemples sur leur site, une chose a vraiment retenu mon attention.
00:02:54C'était cette section où K 2.6 a été utilisé pour identifier 30 commerces de détail à Los Angeles sans
00:03:01sites web officiels via Google Maps et générer des pages d'atterrissage à fort taux de conversion pour chacun d'eux.
00:03:06J'ai vu cette tendance circuler sur Instagram, donc je veux essayer et voir si nous pouvons réellement
00:03:11créer notre propre petite agence web. Donc, pour ce test, j'ai décidé de faire quelque chose de similaire.
00:03:16Je vis à Toronto et ce que j'ai remarqué, c'est que beaucoup de notaires dans mon quartier ont des sites web
00:03:21inexistants ou très obsolètes. Donc, j'ai pensé que ce serait une bonne idée d'identifier
00:03:2620 notaires dans la grande région de Toronto, de les chercher sur Google Maps ou dans les
00:03:32Pages Jaunes canadiennes, et de générer des pages d'atterrissage à fort taux de conversion pour chacun d'eux.
00:03:37Et pour cette tâche, Kimi a lancé cinq sous-agents, chacun dédié à l'une des sous-tâches.
00:03:43Et c'était intéressant de voir comment les sous-agents naviguaient réellement sur le web et visitaient les
00:03:48sites web. Ils ont même essayé d'estimer si le site web était obsolète ou non en utilisant leur propre
00:03:53jugement. Au total, il a fallu environ 40 minutes à Kimi pour terminer tout le flux de travail.
00:03:58Mais à la fin, Kimi a produit ce rapport d'analyse très détaillé sur toutes les conclusions
00:04:03concernant chacun des sites web. Et il a même généré un exemple d'e-mail de prospection que je pourrais envoyer à des clients potentiels
00:04:09pour des propositions de sites web, ainsi qu'un autre rapport sur la taille globale du marché et l'impact potentiel sur les revenus.
00:04:16Et bien sûr, nous avons également obtenu tous les fichiers générés. Et il y a
00:04:22également une page dédiée créée par Kimi où je peux prévisualiser chacune des pages d'atterrissage. Et je dois
00:04:27dire que toutes ces pages d'atterrissage se ressemblent exactement, ce qui est assez décevant. Mais peut-être
00:04:32que c'était mon erreur de ne pas avoir fourni une invite assez détaillée, bien que leur propre site web ait utilisé
00:04:38la même invite que moi. Mais peut-être avaient-ils des harnais préconfigurés. Donc, en guise de suivi,
00:04:43j'ai demandé à Kimi de parcourir chacune de ces pages et d'appliquer un style unique pour chacune d'elles, et aussi d'ajouter
00:04:49quelques images pour rendre les pages d'atterrissage plus attrayantes. Et ici, nous pouvons voir que Kimi a réellement généré
00:04:55des images personnalisées pour chacun des sites. Et pour la petite histoire, j'ai aussi remarqué comment Kimi aime
00:05:00se vanter. Par exemple, ici, les 20 images sont superbes. Maintenant, je vais construire 20 pages d'atterrissage complètement
00:05:06uniques. Je veux dire, d'accord Kimi, mais laisse-moi en juger. Quoi qu'il en soit, il a fallu à Kimi
00:05:12environ 17 minutes pour terminer cette tâche de suivi. Et encore une fois, nous voyons ici Kimi se féliciter
00:05:17en disant que les pages d'atterrissage sont fantastiques. D'accord Kimi, d'accord. Donc, maintenant nous avons une nouvelle page de prévisualisation,
00:05:23mais celle-ci est bizarrement cassée. Il y avait probablement un problème de style CSS ou quelque chose du genre, mais ce n'est pas grave.
00:05:28Je vais ignorer cela. Je m'intéresse davantage aux pages web elles-mêmes. Donc les nouvelles pages ont l'air beaucoup
00:05:34mieux parce que maintenant nous avons ces belles animations CSS, et chaque page web a maintenant une image
00:05:40d'en-tête, générée par IA, mais néanmoins, c'est un bel en-tête. Mais j'ai aussi remarqué que chaque page
00:05:45suit toujours le même modèle. Nous avons les mêmes sections, la même structure de site. Donc, bien que
00:05:51toutes ces pages semblent différentes maintenant, elles ont toujours le même modèle, ce qui est un peu
00:05:56décevant car j'espérais vraiment une approche plus unique. Mais c'est un bon début
00:06:02néanmoins. Donc, comme vous pouvez le voir avec cet exemple, vous pouvez pratiquement lancer votre propre petite agence web
00:06:07en 40 minutes en utilisant cette fonctionnalité de Kimi. Demandez simplement à l'essaim d'agents de Kimi de parcourir vos
00:06:13entreprises locales et de contacter chacune d'elles avec un site web sur mesure et un e-mail de prospection
00:06:18personnalisé, et vous avez pratiquement un bon petit boulot secondaire. J'imagine qu'après cette vidéo, chaque petite
00:06:25entreprise locale va commencer à recevoir des centaines de ces e-mails de proposition avec des sites web
00:06:29sur mesure générés par IA. Mais bon, c'est comme ça. Et je dois noter que pour utiliser cette fonctionnalité d'essaim
00:06:36d'agents, vous devez être sur leur plan Allegretto. Mais je dois aussi dire que je suis assez
00:06:41sûr que c'est beaucoup moins cher que de demander à Claude Code de faire la même tâche. C'est juste dommage que les statistiques
00:06:46d'utilisation de Kimi ne nous fournissent pas plus de détails sur le nombre de jetons dépensés pour cette tâche gigantesque de 40 minutes.
00:06:53Mais j'ai le sentiment que j'aurais certainement épuisé toutes mes limites d'utilisation d'ici maintenant
00:06:58si j'avais utilisé Claude pour faire la même chose. Quoi qu'il en soit, voilà le nouvel essaim d'agents amélioré. Et soit dit en
00:07:04passant, si vous avez récemment utilisé l'essaim d'agents de Kimi pour mener des expériences intéressantes, partagez vos
00:07:09découvertes dans les commentaires ci-dessous. Maintenant, je veux tester comment Kimi s'est amélioré en termes de codage.
00:07:14Ils prétendent que la version 2.6 a connu de fortes améliorations dans les tâches de codage sur le long terme avec une généralisation
00:07:20fiable. Donc, pour cette tâche, j'ai décidé de demander à Kimi de créer une simple application web avec une interface
00:07:26front-end et back-end qui gère également le web scraping. Nous avons probablement tous entendu parler de la façon dont les prix de la RAM
00:07:31sont devenus incroyablement chers ces derniers mois. J'ai donc pensé que ce serait une bonne idée de
00:07:36créer un site web de comparaison de prix qui récupère activement les données de prix pour diverses RAMs et vous donne
00:07:42un tableau de comparaison pour trouver les options les moins chères. Donc, il a fallu environ 12 minutes à Kimi pour
00:07:47terminer cette tâche. Et je peux voir qu'ils ont maintenant ajouté un compteur de jetons dans leur toute nouvelle
00:07:52version CLI. Nous pouvons donc maintenant suivre notre consommation réelle de jetons, ce qui est plutôt cool. Donc voici
00:07:59le résultat final. Et comme vous pouvez le voir ici, il affiche un joli thème sombre pour le site. Et nous pouvons basculer
00:08:05entre les différentes marques. Et nous pouvons également voir différentes options de prix provenant de différents magasins pour
00:08:11chacune des RAMs. Et ce qui est encore plus cool, c'est que nous pouvons déclencher un rafraîchissement en direct, qui récupère activement
00:08:16les données du magasin. C'est dommage qu'il n'ait pas pu récupérer la plupart des images des produits,
00:08:21mais la plupart des fonctionnalités sont là. Et il y a aussi une section de comparaison. Mais il n'y a aucun moyen d'ajouter
00:08:27quoi que ce soit. Donc, j'ai dû demander à Kimi une tâche de suivi pour corriger ce problème. Et maintenant, nous obtenons ce joli
00:08:34bouton d'ajout à la comparaison. Et si nous passons à l'onglet comparaison, nous obtenons maintenant ce super tableau de comparaison
00:08:41de toutes les RAMs sélectionnées. Donc, c'est plutôt bien. Et en regardant le code, je vois qu'il a choisi de
00:08:46construire le site en utilisant Node JS et Express de base. Et il n'a même pas utilisé React mais a opté pour
00:08:53cette version JavaScript vanille où chaque changement modifie directement l'élément HTML interne, ce qui est
00:08:59un choix intéressant. Mais bon, si ça fonctionne, je ne peux pas me plaindre. Et enfin, il a même ajouté ces jolies
00:09:05fonctions de scraping qui utilisent axios et cheerio pour scraper Amazon, Newegg et Best Buy. Donc c'est
00:09:13plutôt cool. Voilà, les amis, c'est le nouveau modèle Kimi K 2.6. Et pour être honnête,
00:09:19à en juger par tous les tests que nous avons effectués aujourd'hui, je ne dirais pas que c'est une avancée massive par rapport à la version 2.5.
00:09:25Mais il y a quelques améliorations de confort de vie vraiment agréables. Et j'apprécie le fait que
00:09:30Moonshot AI continue d'améliorer considérablement sa plateforme. Et j'aime aussi le fait qu'ils fournissent une alternative solide et
00:09:36moins chère à certains des mastodontes plus coûteux comme Claude Code. Donc, dans l'ensemble,
00:09:43bon travail Moonshot AI, continuez comme ça. Et je suis certainement impatient de voir comment Kimi s'améliorera à
00:09:48l'avenir. Et les amis, si vous avez trouvé cette vidéo utile ou informative, faites-le moi savoir en
00:09:53écrasant ce bouton J'aime sous la vidéo. Et assurez-vous également de vous abonner à notre chaîne pour
00:09:58ne manquer aucune de nos futures vidéos de breakdown technique. C'était Andres de
00:10:04Better Stack et je vous verrai dans les prochaines vidéos.