Kimi K2.6 peut lancer une entreprise en 40 minutes ! (Analyse complète du modèle)

BBetter Stack
Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology

Transcript

00:00:00Comme vous pouvez le voir avec cet exemple, vous pouvez pratiquement lancer votre propre petite agence web
00:00:04en 40 minutes grâce à cette fonctionnalité de Kimi.
00:00:07Eh bien les amis, Moonshot AI est de retour avec une nouvelle mise à jour de son modèle phare, Kimi.
00:00:13Kimi K 2.6 est leur dernier modèle qui promet un codage de pointe,
00:00:18une exécution sur le long terme et des capacités d'essaim d'agents.
00:00:22Dans la vidéo d'aujourd'hui, nous allons examiner ce nouveau modèle, voir comment il se comporte sur différentes
00:00:27tâches agentiques, et découvrir s'il est vraiment aussi impressionnant que annoncé.
00:00:32Ça va être très amusant, alors plongeons dans le vif du sujet.
00:00:34Il y a quelques mois, j'ai testé Kimi K 2.5 et il a très bien fonctionné sur le design front-end.
00:00:44Et j'ai été sincèrement impressionné par leur fonctionnalité d'essaim d'agents.
00:00:48J'ai aussi adoré le fait qu'ils aient mis autant d'efforts dans l'UX de leur propre page de chatbot.
00:00:54Donc, dans cette nouvelle version, Kimi promet des avancées assez massives
00:00:57dans la manière dont nous utilisons réellement les agents IA dans un environnement de production.
00:01:02Tout d'abord, l'essaim d'agents a pratiquement triplé.
00:01:05Avec K 2.5, nous étions à environ 100 sous-agents, mais K 2.6 passe à l'échelle horizontalement
00:01:12jusqu'à 300 agents spécialisés capables d'exécuter jusqu'à 4 000 étapes coordonnées.
00:01:18C'est donc une mise à jour assez massive.
00:01:20Désormais, vous pouvez exécuter plus de tâches en parallèle simultanément.
00:01:24Ils ont également ajouté un nouveau mode de réflexion préservée,
00:01:26qui maintient la cohérence du raisonnement du modèle à travers les tâches multi-étapes.
00:01:31Cela empêche la dérive de mémoire qui se produit généralement lorsque vous êtes plongé dans un flux de travail complexe.
00:01:36Ensuite, nous avons les tâches sur le long terme.
00:01:39Et lors de leurs tests, il a géré une tâche d'ingénierie de 13 heures avec un gain de débit de 185 %.
00:01:46Et en ce qui concerne l'esthétique, il s'est orienté vers le design piloté par le code.
00:01:51Au lieu de simplement créer une jolie page d'atterrissage, K 2.6 utilise son propre encodeur de vision natif
00:01:57appelé MoonVIT pour raisonner sur les structures UI et UX à un niveau plus profond.
00:02:03Il peut désormais gérer des flux de travail full-stack, de l'authentification à la journalisation de base de données,
00:02:08transformant une simple référence visuelle ou une invite en un prototype interactif pleinement fonctionnel
00:02:14avec des animations GSAP, des effets de déclenchement au défilement et toutes sortes d'améliorations.
00:02:19Et soit dit en passant, tout cela est open source, y compris l'encodeur de vision.
00:02:23Donc, si vous le souhaitez, vous pourriez réellement l'exécuter de manière autonome,
00:02:26détaché de l'architecture de Kimi, si vous récupérez le modèle sur Hugging Face.
00:02:30Tout cela semble très impressionnant, mais testons-le pour voir comment il se comporte réellement.
00:02:35Et les modèles de Kimi sont open source, donc vous pourriez théoriquement les utiliser dans la configuration que vous préférez.
00:02:40Mais pour tester leur essaim d'agents, je vais utiliser leur propre interface de chatbot
00:02:46pour obtenir les meilleurs résultats. Tout d'abord, je veux essayer la nouvelle fonctionnalité d'essaim d'agents.
00:02:50En regardant leurs exemples sur leur site, une chose a vraiment retenu mon attention.
00:02:54C'était cette section où K 2.6 a été utilisé pour identifier 30 commerces de détail à Los Angeles sans
00:03:01sites web officiels via Google Maps et générer des pages d'atterrissage à fort taux de conversion pour chacun d'eux.
00:03:06J'ai vu cette tendance circuler sur Instagram, donc je veux essayer et voir si nous pouvons réellement
00:03:11créer notre propre petite agence web. Donc, pour ce test, j'ai décidé de faire quelque chose de similaire.
00:03:16Je vis à Toronto et ce que j'ai remarqué, c'est que beaucoup de notaires dans mon quartier ont des sites web
00:03:21inexistants ou très obsolètes. Donc, j'ai pensé que ce serait une bonne idée d'identifier
00:03:2620 notaires dans la grande région de Toronto, de les chercher sur Google Maps ou dans les
00:03:32Pages Jaunes canadiennes, et de générer des pages d'atterrissage à fort taux de conversion pour chacun d'eux.
00:03:37Et pour cette tâche, Kimi a lancé cinq sous-agents, chacun dédié à l'une des sous-tâches.
00:03:43Et c'était intéressant de voir comment les sous-agents naviguaient réellement sur le web et visitaient les
00:03:48sites web. Ils ont même essayé d'estimer si le site web était obsolète ou non en utilisant leur propre
00:03:53jugement. Au total, il a fallu environ 40 minutes à Kimi pour terminer tout le flux de travail.
00:03:58Mais à la fin, Kimi a produit ce rapport d'analyse très détaillé sur toutes les conclusions
00:04:03concernant chacun des sites web. Et il a même généré un exemple d'e-mail de prospection que je pourrais envoyer à des clients potentiels
00:04:09pour des propositions de sites web, ainsi qu'un autre rapport sur la taille globale du marché et l'impact potentiel sur les revenus.
00:04:16Et bien sûr, nous avons également obtenu tous les fichiers générés. Et il y a
00:04:22également une page dédiée créée par Kimi où je peux prévisualiser chacune des pages d'atterrissage. Et je dois
00:04:27dire que toutes ces pages d'atterrissage se ressemblent exactement, ce qui est assez décevant. Mais peut-être
00:04:32que c'était mon erreur de ne pas avoir fourni une invite assez détaillée, bien que leur propre site web ait utilisé
00:04:38la même invite que moi. Mais peut-être avaient-ils des harnais préconfigurés. Donc, en guise de suivi,
00:04:43j'ai demandé à Kimi de parcourir chacune de ces pages et d'appliquer un style unique pour chacune d'elles, et aussi d'ajouter
00:04:49quelques images pour rendre les pages d'atterrissage plus attrayantes. Et ici, nous pouvons voir que Kimi a réellement généré
00:04:55des images personnalisées pour chacun des sites. Et pour la petite histoire, j'ai aussi remarqué comment Kimi aime
00:05:00se vanter. Par exemple, ici, les 20 images sont superbes. Maintenant, je vais construire 20 pages d'atterrissage complètement
00:05:06uniques. Je veux dire, d'accord Kimi, mais laisse-moi en juger. Quoi qu'il en soit, il a fallu à Kimi
00:05:12environ 17 minutes pour terminer cette tâche de suivi. Et encore une fois, nous voyons ici Kimi se féliciter
00:05:17en disant que les pages d'atterrissage sont fantastiques. D'accord Kimi, d'accord. Donc, maintenant nous avons une nouvelle page de prévisualisation,
00:05:23mais celle-ci est bizarrement cassée. Il y avait probablement un problème de style CSS ou quelque chose du genre, mais ce n'est pas grave.
00:05:28Je vais ignorer cela. Je m'intéresse davantage aux pages web elles-mêmes. Donc les nouvelles pages ont l'air beaucoup
00:05:34mieux parce que maintenant nous avons ces belles animations CSS, et chaque page web a maintenant une image
00:05:40d'en-tête, générée par IA, mais néanmoins, c'est un bel en-tête. Mais j'ai aussi remarqué que chaque page
00:05:45suit toujours le même modèle. Nous avons les mêmes sections, la même structure de site. Donc, bien que
00:05:51toutes ces pages semblent différentes maintenant, elles ont toujours le même modèle, ce qui est un peu
00:05:56décevant car j'espérais vraiment une approche plus unique. Mais c'est un bon début
00:06:02néanmoins. Donc, comme vous pouvez le voir avec cet exemple, vous pouvez pratiquement lancer votre propre petite agence web
00:06:07en 40 minutes en utilisant cette fonctionnalité de Kimi. Demandez simplement à l'essaim d'agents de Kimi de parcourir vos
00:06:13entreprises locales et de contacter chacune d'elles avec un site web sur mesure et un e-mail de prospection
00:06:18personnalisé, et vous avez pratiquement un bon petit boulot secondaire. J'imagine qu'après cette vidéo, chaque petite
00:06:25entreprise locale va commencer à recevoir des centaines de ces e-mails de proposition avec des sites web
00:06:29sur mesure générés par IA. Mais bon, c'est comme ça. Et je dois noter que pour utiliser cette fonctionnalité d'essaim
00:06:36d'agents, vous devez être sur leur plan Allegretto. Mais je dois aussi dire que je suis assez
00:06:41sûr que c'est beaucoup moins cher que de demander à Claude Code de faire la même tâche. C'est juste dommage que les statistiques
00:06:46d'utilisation de Kimi ne nous fournissent pas plus de détails sur le nombre de jetons dépensés pour cette tâche gigantesque de 40 minutes.
00:06:53Mais j'ai le sentiment que j'aurais certainement épuisé toutes mes limites d'utilisation d'ici maintenant
00:06:58si j'avais utilisé Claude pour faire la même chose. Quoi qu'il en soit, voilà le nouvel essaim d'agents amélioré. Et soit dit en
00:07:04passant, si vous avez récemment utilisé l'essaim d'agents de Kimi pour mener des expériences intéressantes, partagez vos
00:07:09découvertes dans les commentaires ci-dessous. Maintenant, je veux tester comment Kimi s'est amélioré en termes de codage.
00:07:14Ils prétendent que la version 2.6 a connu de fortes améliorations dans les tâches de codage sur le long terme avec une généralisation
00:07:20fiable. Donc, pour cette tâche, j'ai décidé de demander à Kimi de créer une simple application web avec une interface
00:07:26front-end et back-end qui gère également le web scraping. Nous avons probablement tous entendu parler de la façon dont les prix de la RAM
00:07:31sont devenus incroyablement chers ces derniers mois. J'ai donc pensé que ce serait une bonne idée de
00:07:36créer un site web de comparaison de prix qui récupère activement les données de prix pour diverses RAMs et vous donne
00:07:42un tableau de comparaison pour trouver les options les moins chères. Donc, il a fallu environ 12 minutes à Kimi pour
00:07:47terminer cette tâche. Et je peux voir qu'ils ont maintenant ajouté un compteur de jetons dans leur toute nouvelle
00:07:52version CLI. Nous pouvons donc maintenant suivre notre consommation réelle de jetons, ce qui est plutôt cool. Donc voici
00:07:59le résultat final. Et comme vous pouvez le voir ici, il affiche un joli thème sombre pour le site. Et nous pouvons basculer
00:08:05entre les différentes marques. Et nous pouvons également voir différentes options de prix provenant de différents magasins pour
00:08:11chacune des RAMs. Et ce qui est encore plus cool, c'est que nous pouvons déclencher un rafraîchissement en direct, qui récupère activement
00:08:16les données du magasin. C'est dommage qu'il n'ait pas pu récupérer la plupart des images des produits,
00:08:21mais la plupart des fonctionnalités sont là. Et il y a aussi une section de comparaison. Mais il n'y a aucun moyen d'ajouter
00:08:27quoi que ce soit. Donc, j'ai dû demander à Kimi une tâche de suivi pour corriger ce problème. Et maintenant, nous obtenons ce joli
00:08:34bouton d'ajout à la comparaison. Et si nous passons à l'onglet comparaison, nous obtenons maintenant ce super tableau de comparaison
00:08:41de toutes les RAMs sélectionnées. Donc, c'est plutôt bien. Et en regardant le code, je vois qu'il a choisi de
00:08:46construire le site en utilisant Node JS et Express de base. Et il n'a même pas utilisé React mais a opté pour
00:08:53cette version JavaScript vanille où chaque changement modifie directement l'élément HTML interne, ce qui est
00:08:59un choix intéressant. Mais bon, si ça fonctionne, je ne peux pas me plaindre. Et enfin, il a même ajouté ces jolies
00:09:05fonctions de scraping qui utilisent axios et cheerio pour scraper Amazon, Newegg et Best Buy. Donc c'est
00:09:13plutôt cool. Voilà, les amis, c'est le nouveau modèle Kimi K 2.6. Et pour être honnête,
00:09:19à en juger par tous les tests que nous avons effectués aujourd'hui, je ne dirais pas que c'est une avancée massive par rapport à la version 2.5.
00:09:25Mais il y a quelques améliorations de confort de vie vraiment agréables. Et j'apprécie le fait que
00:09:30Moonshot AI continue d'améliorer considérablement sa plateforme. Et j'aime aussi le fait qu'ils fournissent une alternative solide et
00:09:36moins chère à certains des mastodontes plus coûteux comme Claude Code. Donc, dans l'ensemble,
00:09:43bon travail Moonshot AI, continuez comme ça. Et je suis certainement impatient de voir comment Kimi s'améliorera à
00:09:48l'avenir. Et les amis, si vous avez trouvé cette vidéo utile ou informative, faites-le moi savoir en
00:09:53écrasant ce bouton J'aime sous la vidéo. Et assurez-vous également de vous abonner à notre chaîne pour
00:09:58ne manquer aucune de nos futures vidéos de breakdown technique. C'était Andres de
00:10:04Better Stack et je vous verrai dans les prochaines vidéos.

Key Takeaway

Le modèle Kimi K2.6 offre une plateforme d'essaim d'agents capable d'automatiser des flux de production complexes, comme la création d'agences web, en intégrant nativement le raisonnement visuel et une architecture horizontale scalable.

Highlights

  • Kimi K2.6 passe à l'échelle jusqu'à 300 agents spécialisés capables d'exécuter jusqu'à 4 000 étapes coordonnées.

  • Un test de workflow agentique automatisé pour identifier des prospects et générer des pages d'atterrissage s'exécute en 40 minutes.

  • L'encodeur de vision natif MoonVIT permet de transformer des références visuelles en prototypes fonctionnels avec animations GSAP.

  • Un mode de réflexion préservée maintient la cohérence du raisonnement sur les tâches multi-étapes et empêche la dérive de mémoire.

  • Le modèle gère des tâches d'ingénierie longue durée avec un gain de débit de 185 % par rapport aux versions précédentes.

  • L'interface CLI inclut désormais un compteur de jetons pour un suivi précis de la consommation des ressources.

Timeline

Mises à jour techniques et capacités d'essaim

  • L'architecture supporte désormais jusqu'à 300 sous-agents spécialisés.
  • Le nouveau mode de réflexion préservée assure la cohérence des flux de travail complexes.
  • L'encodeur de vision natif MoonVIT permet un design piloté par le code.

Cette version marque une augmentation massive de la capacité d'essaim d'agents, triplant le nombre de sous-agents opérationnels simultanément. La gestion de la mémoire a été optimisée pour les flux de travail longs, évitant les pertes d'informations lors de l'exécution de 4 000 étapes coordonnées. L'intégration de MoonVIT transforme les entrées visuelles en code fonctionnel, supportant des animations complexes et une logique full-stack.

Automatisation d'une agence web locale

  • Un processus automatisé identifie des entreprises cibles et génère des pages web personnalisées en 40 minutes.
  • L'essaim d'agents effectue des recherches sur Google Maps et évalue l'obsolescence des sites existants.
  • Le modèle génère des rapports d'analyse de marché et des e-mails de prospection prêts à l'envoi.

Le test pratique démontre la capacité du modèle à naviguer sur le web, extraire des données locales et produire des assets professionnels de manière autonome. Bien que la structure initiale soit répétitive, des instructions de suivi permettent au modèle d'appliquer des styles uniques et des images personnalisées. L'ensemble du flux, de l'identification des prospects à la création du contenu, est réalisé dans un temps restreint.

Performance en codage et outils de développement

  • Le modèle génère des applications web full-stack incluant scraping et gestion de base de données.
  • Le suivi de la consommation de jetons est désormais disponible via l'interface CLI.
  • Le code généré utilise Node.js, Express et du JavaScript natif pour une exécution efficace.

En testant la création d'un comparateur de prix de composants informatiques, Kimi K2.6 démontre sa capacité à orchestrer le scraping de sites marchands et à mettre en place une interface interactive. L'ajout d'un compteur de jetons facilite la gestion des coûts en environnement de production. Le choix technique s'est porté sur une approche légère, optimisant le rendu par modification directe du DOM plutôt que l'usage de frameworks lourds.

Community Posts

View all posts