Kimi K2.6 kann in 40 Minuten ein Unternehmen gründen! (Vollständige Modellanalyse)
BBetter Stack
Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology
Transcript
00:00:00Wie Sie an diesem Beispiel sehen können, lässt sich im Grunde genommen eine eigene kleine Webagentur-
00:00:04unternehmen in 40 Minuten mit dieser Kimi-Funktion starten.
00:00:07Nun Leute, Moonshot AI ist zurück mit einem weiteren Update für ihr Flaggschiff-Modell Kimi.
00:00:13Kimi K 2.6 ist ihr neuestes Modell, das modernstes Programmieren,
00:00:18langfristige Ausführung und Agenten-Schwarm-Fähigkeiten verspricht.
00:00:22Im heutigen Video schauen wir uns dieses neue Modell an, prüfen, wie es bei verschiedenen
00:00:27agentenbasierten Aufgaben abschneidet, und finden heraus, ob es wirklich so beeindruckend ist wie beworben.
00:00:32Es wird eine Menge Spaß machen, also legen wir direkt los.
00:00:34Vor ein paar Monaten habe ich Kimi K 2.5 getestet und es hat im Front-End-Design wirklich gut abgeschnitten.
00:00:44Und ich war von ihrer Agenten-Schwarm-Funktion wirklich beeindruckt.
00:00:48Ich fand es auch toll, dass sie so viel Arbeit in die UX ihrer eigenen Chatbot-Seite gesteckt haben.
00:00:54In dieser nächsten Iteration verspricht Kimi also einige ziemlich massive
00:00:57Sprünge bei der Art und Weise, wie wir KI-Agenten tatsächlich in einer Produktionsumgebung nutzen.
00:01:02Zunächst einmal hat sich der Agenten-Schwarm im Grunde verdreifacht.
00:01:05In K 2.5 hatten wir es mit etwa 100 Unteragenten zu tun, aber K 2.6 skaliert dies horizontal
00:01:12auf 300 spezialisierte Agenten, die bis zu 4.000 koordinierte Schritte ausführen können.
00:01:18Das ist also ein ziemlich massives Update.
00:01:20Jetzt können Sie also mehr parallele Aufgaben zur gleichen Zeit ausführen.
00:01:24Sie haben außerdem einen neuen Modus für beständiges Denken hinzugefügt,
00:01:26der den logischen Ablauf des Modells bei aufgaben mit mehreren Durchläufen konsistent hält.
00:01:31Es stoppt den Gedächtnisverlust, der normalerweise auftritt, wenn man tief in einem komplexen Workflow steckt.
00:01:36Und dann haben wir die langfristigen Aufgaben.
00:01:39In ihren eigenen Tests bewältigte es eine 13-stündige Entwicklungsaufgabe mit einem Durchsatzgewinn von 185%.
00:01:46Und was die Ästhetik angeht, ist es zum programmgesteuerten Design übergegangen.
00:01:51Anstatt nur eine hübsche Landingpage zu erstellen, nutzt K 2.6 seinen eigenen nativen Vision-Encoder
00:01:57namens MoonVIT, um UI- und UX-Strukturen auf einer tieferen Ebene zu analysieren.
00:02:03Es kann jetzt Full-Stack-Workflows von der Authentifizierung bis zur Datenbankprotokollierung abwickeln,
00:02:08und verwandelt eine einzelne visuelle Referenz oder einen Prompt in einen voll funktionsfähigen, interaktiven Prototyp
00:02:14mit GSAP-Animationen, scroll-getriggerten Effekten und allerlei anderen Extras.
00:02:19Und übrigens, all dies ist Open Source, einschließlich des Vision-Encoders.
00:02:23Wenn Sie also wollten, könnten Sie es tatsächlich eigenständig ausführen,
00:02:26losgelöst von Kimis Architektur, wenn Sie das Modell von Hugging Face beziehen.
00:02:30Das alles klingt also sehr beeindruckend, aber lassen Sie uns das testen und sehen, wie es tatsächlich funktioniert.
00:02:35Und Kimis Modelle sind Open Source, Sie könnten sie also theoretisch in jedem beliebigen Setup verwenden.
00:02:40Aber um den Agenten-Schwarm zu testen, werde ich ihre eigene Chatbot-Oberfläche benutzen,
00:02:46um die besten Ergebnisse zu erzielen. Zuerst möchte ich die neue Agenten-Schwarm-Funktion ausprobieren.
00:02:50Wenn man sich die Beispiele auf ihrer Website ansieht, ist mir eine Sache besonders aufgefallen.
00:02:54Es war dieser Bereich, in dem K 2.6 verwendet wurde, um 30 Einzelhandelsgeschäfte in Los Angeles ohne
00:03:01offizielle Websites über Google Maps zu identifizieren und für jedes davon hochkonvertierende Landingpages zu erstellen.
00:03:06Ich habe diesen Trend auf Instagram gesehen, also möchte ich es ausprobieren und sehen, ob wir tatsächlich
00:03:11unsere eigene kleine Webagentur gründen können. Für diesen Test habe ich mich also für etwas Ähnliches entschieden.
00:03:16Ich lebe in Toronto und mir ist aufgefallen, dass viele Notare in meiner Gegend entweder
00:03:21gar keine oder sehr veraltete Websites haben. Also dachte ich, es wäre eine coole Idee,
00:03:2620 Notare im Großraum Toronto zu identifizieren, sie entweder bei Google Maps oder in den
00:03:32kanadischen Gelben Seiten nachzuschlagen und für jeden von ihnen hochkonvertierende Landingpages zu generieren.
00:03:37Für diese Aufgabe startete Kimi fünf Unteragenten, von denen jeder für eine der Teilaufgaben zuständig war.
00:03:43Und es war interessant zu sehen, wie die Unteragenten tatsächlich im Internet navigierten und die
00:03:48Websites besuchten. Und sie versuchten sogar, nach eigenem Ermessen abzuschätzen,
00:03:53ob die Website veraltet ist oder nicht. Insgesamt brauchte Kimi etwa 40 Minuten, um den gesamten Workflow abzuschließen.
00:03:58Aber am Ende erstellte Kimi diesen sehr detaillierten Analysebericht über alle Erkenntnisse
00:04:03zu jeder der Websites. Und es generierte sogar eine Beispiel-Outreach-E-Mail, die ich an potenzielle
00:04:09Kunden für Website-Vorschläge senden könnte, zusammen mit einem weiteren Bericht über die gesamte Marktgröße und das Umsatzpotenzial.
00:04:16Und daneben haben wir natürlich auch alle generierten Dateien erhalten. Und es gibt
00:04:22auch eine eigene Seite, die Kimi generiert hat, auf der ich mir jede der Landingpages ansehen kann. Und ich muss
00:04:27sagen, dass all diese Landingpages genau gleich aussehen, was irgendwie enttäuschend ist. Aber vielleicht
00:04:32war das mein Fehler, da ich keinen detaillierten genug Prompt bereitgestellt habe, obwohl ihre eigene Website
00:04:38denselben Prompt hatte, den ich verwendet habe. Aber vielleicht hatten sie einige vorkonfigurierte Harnesses. Als Folgeaufgabe
00:04:43habe ich Kimi also gebeten, jede dieser Seiten durchzugehen und einen einzigartigen Stil für jede von ihnen anzuwenden, und auch
00:04:49ein paar Bilder hinzuzufügen, um die Landingpages aufregender zu machen. Und hier können wir sehen, dass Kimi tatsächlich
00:04:55benutzerdefinierte Bilder für jede der Seiten generiert hat. Und als lustige Randnotiz ist mir auch aufgefallen, wie Kimi gerne
00:05:00sich selbst lobt. Zum Beispiel hier: Alle 20 Bilder sind atemberaubend. Jetzt baue ich 20 komplett
00:05:06einzigartige Landingpages. Ich meine, okay, Kimi, aber lass mich das beurteilen. Aber wie dem auch sei, es dauerte etwa 17 Minuten, bis Kimi
00:05:12diese Folgeaufgabe beendete. Und wieder einmal sehen wir hier, wie Kimi sich selbst lobt,
00:05:17dass die Landingpages fantastisch aussehen. Okay, Kimi, okay. Also haben wir jetzt eine neue Vorschauseite,
00:05:23aber diese ist seltsamerweise kaputt. Wahrscheinlich gab es ein CSS-Styling-Problem oder etwas Ähnliches, aber das ist okay.
00:05:28Ich werde das ignorieren. Ich bin mehr an den Webseiten selbst interessiert. Die neuen Seiten sehen also viel
00:05:34besser aus, weil wir jetzt diese schön aussehenden CSS-Animationen haben, und jede Webseite hat jetzt ein Bild-
00:05:40header, KI-generiert, aber nichtsdestotrotz ein schöner Header. Aber ich habe auch bemerkt, dass jede der Seiten
00:05:45immer noch demselben Muster folgt. Wir haben die gleichen Abschnitte, die gleiche Seitenstruktur. Obwohl also
00:05:51alle diese Seiten jetzt anders aussehen, haben sie immer noch das gleiche Grundgerüst, was irgendwie
00:05:56enttäuschend ist, weil ich wirklich auf einen einzigartigeren Ansatz gehofft hatte. Aber das ist ein guter Anfang
00:06:02nichtsdestotrotz. Wie Sie an diesem Beispiel sehen können, können Sie im Grunde Ihre eigene kleine Webagentur
00:06:07in 40 Minuten mit dieser Kimi-Funktion starten. Bitten Sie einfach den Agenten-Schwarm von Kimi, Ihre
00:06:13lokalen Unternehmen zu durchsuchen und jedes von ihnen mit einer maßgeschneiderten Website und der maßgeschneiderten
00:06:18Outreach-E-Mail zu kontaktieren, und schon haben Sie einen guten Nebenjob am Laufen. Ich stelle mir vor, dass nach diesem Video jedes kleine
00:06:25lokale Unternehmen anfängt, Hunderte dieser Vorschlags-E-Mails mit maßgeschneiderten
00:06:29KI-generierten Websites zu bekommen. Aber hey, es ist, wie es ist. Und ich muss darauf hinweisen, dass man für diese Agenten-
00:06:36schwarm-Funktion den Allegretto-Plan haben muss. Aber ich muss auch sagen, dass ich mir ziemlich
00:06:41sicher bin, dass es viel billiger ist, als Claude Code für dieselbe Aufgabe zu bitten. Es ist nur eine Schande, dass Kimis
00:06:46Nutzungsstatistiken uns nicht mehr Details darüber geben, wie viele Token für diese gigantische 40-minütige
00:06:53Aufgabe ausgegeben wurden. Aber ich habe das Gefühl, dass ich meine Nutzungslimits sicher schon längst überschritten hätte,
00:06:58wenn ich Claude benutzt hätte, um dasselbe zu tun. Also, das ist der neue verbesserte Agenten-Schwarm. Und übrigens,
00:07:04wenn Sie kürzlich Kimis Agenten-Schwarm verwendet haben, um einige interessante Experimente durchzuführen, teilen Sie Ihre
00:07:09Erkenntnisse in den Kommentaren unten. Jetzt möchte ich testen, wie Kimi sich in Bezug auf das Programmieren verbessert hat.
00:07:14Sie behaupten, dass 2.6 starke Verbesserungen bei langfristigen Programmieraufgaben mit zuverlässiger
00:07:20Generalisierung gesehen hat. Also habe ich für diese Aufgabe beschlossen, Kimi zu bitten, eine einfache Web-App mit einem Front-End
00:07:26und einer Back-End-Schnittstelle zu erstellen, die auch Web-Scraping handhabt. Also haben wir wahrscheinlich alle gehört, wie wahnsinnig
00:07:31teuer RAM-Preise in den letzten Monaten geworden sind. Also dachte ich, es wäre eine coole Idee,
00:07:36einen Preisvergleichs-Webseite zu erstellen, die aktiv Preisdaten für verschiedene RAMs scraped und Ihnen
00:07:42eine Vergleichstabelle gibt, um die günstigsten Optionen da draußen zu finden. Es dauerte also etwa 12 Minuten für Kimi,
00:07:47diese Aufgabe zu beenden. Und ich kann sehen, dass sie jetzt tatsächlich einen Token-Zähler in ihrer neuesten
00:07:52CLI-Version hinzugefügt haben. Wir können also jetzt unseren tatsächlichen Token-Verbrauch verfolgen, was ziemlich cool ist. Also hier ist das
00:07:59Endergebnis. Und wie Sie hier sehen können, zeigt es ein schönes dunkles Design für die Website. Und wir können durch
00:08:05einzelne Marken blättern. Und wir können auch verschiedene Preisoptionen aus verschiedenen Geschäften für
00:08:11jeden der RAMs sehen. Und was noch cooler ist, ist, dass wir eine Live-Aktualisierung auslösen können, die aktiv
00:08:16die Store-Daten neu scraped. Es ist schade, dass es die meisten der Produktbilder nicht abrufen konnte,
00:08:21aber die meiste Funktionalität ist da. Und es gibt auch einen Vergleichsabschnitt. Aber es gibt keine Möglichkeit,
00:08:27irgendetwas hinzuzufügen. Also musste ich Kimi eine Folgeaufgabe stellen, um dieses Problem zu beheben. Und jetzt bekommen wir diesen schönen
00:08:34Button zum Hinzufügen zum Vergleich. Und wenn wir zum Vergleichs-Tab gehen, erhalten wir jetzt diese coole Vergleichstabelle
00:08:41aller ausgewählten RAMs. Das ist also ziemlich gut. Und wenn ich mir den Code ansehe, sehe ich, dass es sich entschieden hat,
00:08:46die Website mit Node JS und Express auf das Nötigste zu beschränken. Und es hat nicht einmal React verwendet, sondern sich stattdessen für
00:08:53diese Vanilla-JavaScript-Version entschieden, bei der jede Änderung das innere HTML-Element direkt modifiziert, was
00:08:59eine interessante Wahl ist. Aber hey, wenn es funktioniert, kann ich mich nicht beschweren. Und schließlich hat es sogar diese schönen
00:09:05Scraper-Funktionen hinzugefügt, die Axios und Cheerio verwenden, um Amazon, Newegg und Best Buy zu scrapen. Das ist also
00:09:13ziemlich cool. Also, da haben Sie es Leute, das ist das neue Kimi K 2.6 Modell. Und um ehrlich zu sein,
00:09:19nach all den Tests, die wir heute gemacht haben, würde ich nicht sagen, dass es ein massiver Schritt gegenüber 2.5 ist.
00:09:25Aber es gibt einige wirklich schöne Verbesserungen für die Lebensqualität. Und ich schätze die Tatsache, dass
00:09:30Moonshot AI ihre Plattform ständig verbessert. Und ich liebe auch die Tatsache, dass sie eine solide
00:09:36billigere Alternative zu einigen der teureren Giganten da draußen wie Claude Code bieten. Also insgesamt,
00:09:43großartige Arbeit von Moonshot AI, weiter so. Und ich bin sicherlich gespannt zu sehen, wie Kimi sich in
00:09:48der Zukunft verbessert. Und Leute, wenn Sie dieses Video nützlich oder informativ fanden, lassen Sie es mich bitte wissen, indem Sie
00:09:53den Like-Button unter dem Video zerschlagen. Und seien Sie auch sicher, unseren Kanal zu abonnieren, damit Sie
00:09:58keines unserer zukünftigen technischen Breakdown-Videos verpassen. Das war Andres von
00:10:04Better Stack und wir sehen uns in den nächsten Videos.