Kimi K2.6 kann in 40 Minuten ein Unternehmen gründen! (Vollständige Modellanalyse)

BBetter Stack
Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology

Transcript

00:00:00Wie Sie an diesem Beispiel sehen können, lässt sich im Grunde genommen eine eigene kleine Webagentur-
00:00:04unternehmen in 40 Minuten mit dieser Kimi-Funktion starten.
00:00:07Nun Leute, Moonshot AI ist zurück mit einem weiteren Update für ihr Flaggschiff-Modell Kimi.
00:00:13Kimi K 2.6 ist ihr neuestes Modell, das modernstes Programmieren,
00:00:18langfristige Ausführung und Agenten-Schwarm-Fähigkeiten verspricht.
00:00:22Im heutigen Video schauen wir uns dieses neue Modell an, prüfen, wie es bei verschiedenen
00:00:27agentenbasierten Aufgaben abschneidet, und finden heraus, ob es wirklich so beeindruckend ist wie beworben.
00:00:32Es wird eine Menge Spaß machen, also legen wir direkt los.
00:00:34Vor ein paar Monaten habe ich Kimi K 2.5 getestet und es hat im Front-End-Design wirklich gut abgeschnitten.
00:00:44Und ich war von ihrer Agenten-Schwarm-Funktion wirklich beeindruckt.
00:00:48Ich fand es auch toll, dass sie so viel Arbeit in die UX ihrer eigenen Chatbot-Seite gesteckt haben.
00:00:54In dieser nächsten Iteration verspricht Kimi also einige ziemlich massive
00:00:57Sprünge bei der Art und Weise, wie wir KI-Agenten tatsächlich in einer Produktionsumgebung nutzen.
00:01:02Zunächst einmal hat sich der Agenten-Schwarm im Grunde verdreifacht.
00:01:05In K 2.5 hatten wir es mit etwa 100 Unteragenten zu tun, aber K 2.6 skaliert dies horizontal
00:01:12auf 300 spezialisierte Agenten, die bis zu 4.000 koordinierte Schritte ausführen können.
00:01:18Das ist also ein ziemlich massives Update.
00:01:20Jetzt können Sie also mehr parallele Aufgaben zur gleichen Zeit ausführen.
00:01:24Sie haben außerdem einen neuen Modus für beständiges Denken hinzugefügt,
00:01:26der den logischen Ablauf des Modells bei aufgaben mit mehreren Durchläufen konsistent hält.
00:01:31Es stoppt den Gedächtnisverlust, der normalerweise auftritt, wenn man tief in einem komplexen Workflow steckt.
00:01:36Und dann haben wir die langfristigen Aufgaben.
00:01:39In ihren eigenen Tests bewältigte es eine 13-stündige Entwicklungsaufgabe mit einem Durchsatzgewinn von 185%.
00:01:46Und was die Ästhetik angeht, ist es zum programmgesteuerten Design übergegangen.
00:01:51Anstatt nur eine hübsche Landingpage zu erstellen, nutzt K 2.6 seinen eigenen nativen Vision-Encoder
00:01:57namens MoonVIT, um UI- und UX-Strukturen auf einer tieferen Ebene zu analysieren.
00:02:03Es kann jetzt Full-Stack-Workflows von der Authentifizierung bis zur Datenbankprotokollierung abwickeln,
00:02:08und verwandelt eine einzelne visuelle Referenz oder einen Prompt in einen voll funktionsfähigen, interaktiven Prototyp
00:02:14mit GSAP-Animationen, scroll-getriggerten Effekten und allerlei anderen Extras.
00:02:19Und übrigens, all dies ist Open Source, einschließlich des Vision-Encoders.
00:02:23Wenn Sie also wollten, könnten Sie es tatsächlich eigenständig ausführen,
00:02:26losgelöst von Kimis Architektur, wenn Sie das Modell von Hugging Face beziehen.
00:02:30Das alles klingt also sehr beeindruckend, aber lassen Sie uns das testen und sehen, wie es tatsächlich funktioniert.
00:02:35Und Kimis Modelle sind Open Source, Sie könnten sie also theoretisch in jedem beliebigen Setup verwenden.
00:02:40Aber um den Agenten-Schwarm zu testen, werde ich ihre eigene Chatbot-Oberfläche benutzen,
00:02:46um die besten Ergebnisse zu erzielen. Zuerst möchte ich die neue Agenten-Schwarm-Funktion ausprobieren.
00:02:50Wenn man sich die Beispiele auf ihrer Website ansieht, ist mir eine Sache besonders aufgefallen.
00:02:54Es war dieser Bereich, in dem K 2.6 verwendet wurde, um 30 Einzelhandelsgeschäfte in Los Angeles ohne
00:03:01offizielle Websites über Google Maps zu identifizieren und für jedes davon hochkonvertierende Landingpages zu erstellen.
00:03:06Ich habe diesen Trend auf Instagram gesehen, also möchte ich es ausprobieren und sehen, ob wir tatsächlich
00:03:11unsere eigene kleine Webagentur gründen können. Für diesen Test habe ich mich also für etwas Ähnliches entschieden.
00:03:16Ich lebe in Toronto und mir ist aufgefallen, dass viele Notare in meiner Gegend entweder
00:03:21gar keine oder sehr veraltete Websites haben. Also dachte ich, es wäre eine coole Idee,
00:03:2620 Notare im Großraum Toronto zu identifizieren, sie entweder bei Google Maps oder in den
00:03:32kanadischen Gelben Seiten nachzuschlagen und für jeden von ihnen hochkonvertierende Landingpages zu generieren.
00:03:37Für diese Aufgabe startete Kimi fünf Unteragenten, von denen jeder für eine der Teilaufgaben zuständig war.
00:03:43Und es war interessant zu sehen, wie die Unteragenten tatsächlich im Internet navigierten und die
00:03:48Websites besuchten. Und sie versuchten sogar, nach eigenem Ermessen abzuschätzen,
00:03:53ob die Website veraltet ist oder nicht. Insgesamt brauchte Kimi etwa 40 Minuten, um den gesamten Workflow abzuschließen.
00:03:58Aber am Ende erstellte Kimi diesen sehr detaillierten Analysebericht über alle Erkenntnisse
00:04:03zu jeder der Websites. Und es generierte sogar eine Beispiel-Outreach-E-Mail, die ich an potenzielle
00:04:09Kunden für Website-Vorschläge senden könnte, zusammen mit einem weiteren Bericht über die gesamte Marktgröße und das Umsatzpotenzial.
00:04:16Und daneben haben wir natürlich auch alle generierten Dateien erhalten. Und es gibt
00:04:22auch eine eigene Seite, die Kimi generiert hat, auf der ich mir jede der Landingpages ansehen kann. Und ich muss
00:04:27sagen, dass all diese Landingpages genau gleich aussehen, was irgendwie enttäuschend ist. Aber vielleicht
00:04:32war das mein Fehler, da ich keinen detaillierten genug Prompt bereitgestellt habe, obwohl ihre eigene Website
00:04:38denselben Prompt hatte, den ich verwendet habe. Aber vielleicht hatten sie einige vorkonfigurierte Harnesses. Als Folgeaufgabe
00:04:43habe ich Kimi also gebeten, jede dieser Seiten durchzugehen und einen einzigartigen Stil für jede von ihnen anzuwenden, und auch
00:04:49ein paar Bilder hinzuzufügen, um die Landingpages aufregender zu machen. Und hier können wir sehen, dass Kimi tatsächlich
00:04:55benutzerdefinierte Bilder für jede der Seiten generiert hat. Und als lustige Randnotiz ist mir auch aufgefallen, wie Kimi gerne
00:05:00sich selbst lobt. Zum Beispiel hier: Alle 20 Bilder sind atemberaubend. Jetzt baue ich 20 komplett
00:05:06einzigartige Landingpages. Ich meine, okay, Kimi, aber lass mich das beurteilen. Aber wie dem auch sei, es dauerte etwa 17 Minuten, bis Kimi
00:05:12diese Folgeaufgabe beendete. Und wieder einmal sehen wir hier, wie Kimi sich selbst lobt,
00:05:17dass die Landingpages fantastisch aussehen. Okay, Kimi, okay. Also haben wir jetzt eine neue Vorschauseite,
00:05:23aber diese ist seltsamerweise kaputt. Wahrscheinlich gab es ein CSS-Styling-Problem oder etwas Ähnliches, aber das ist okay.
00:05:28Ich werde das ignorieren. Ich bin mehr an den Webseiten selbst interessiert. Die neuen Seiten sehen also viel
00:05:34besser aus, weil wir jetzt diese schön aussehenden CSS-Animationen haben, und jede Webseite hat jetzt ein Bild-
00:05:40header, KI-generiert, aber nichtsdestotrotz ein schöner Header. Aber ich habe auch bemerkt, dass jede der Seiten
00:05:45immer noch demselben Muster folgt. Wir haben die gleichen Abschnitte, die gleiche Seitenstruktur. Obwohl also
00:05:51alle diese Seiten jetzt anders aussehen, haben sie immer noch das gleiche Grundgerüst, was irgendwie
00:05:56enttäuschend ist, weil ich wirklich auf einen einzigartigeren Ansatz gehofft hatte. Aber das ist ein guter Anfang
00:06:02nichtsdestotrotz. Wie Sie an diesem Beispiel sehen können, können Sie im Grunde Ihre eigene kleine Webagentur
00:06:07in 40 Minuten mit dieser Kimi-Funktion starten. Bitten Sie einfach den Agenten-Schwarm von Kimi, Ihre
00:06:13lokalen Unternehmen zu durchsuchen und jedes von ihnen mit einer maßgeschneiderten Website und der maßgeschneiderten
00:06:18Outreach-E-Mail zu kontaktieren, und schon haben Sie einen guten Nebenjob am Laufen. Ich stelle mir vor, dass nach diesem Video jedes kleine
00:06:25lokale Unternehmen anfängt, Hunderte dieser Vorschlags-E-Mails mit maßgeschneiderten
00:06:29KI-generierten Websites zu bekommen. Aber hey, es ist, wie es ist. Und ich muss darauf hinweisen, dass man für diese Agenten-
00:06:36schwarm-Funktion den Allegretto-Plan haben muss. Aber ich muss auch sagen, dass ich mir ziemlich
00:06:41sicher bin, dass es viel billiger ist, als Claude Code für dieselbe Aufgabe zu bitten. Es ist nur eine Schande, dass Kimis
00:06:46Nutzungsstatistiken uns nicht mehr Details darüber geben, wie viele Token für diese gigantische 40-minütige
00:06:53Aufgabe ausgegeben wurden. Aber ich habe das Gefühl, dass ich meine Nutzungslimits sicher schon längst überschritten hätte,
00:06:58wenn ich Claude benutzt hätte, um dasselbe zu tun. Also, das ist der neue verbesserte Agenten-Schwarm. Und übrigens,
00:07:04wenn Sie kürzlich Kimis Agenten-Schwarm verwendet haben, um einige interessante Experimente durchzuführen, teilen Sie Ihre
00:07:09Erkenntnisse in den Kommentaren unten. Jetzt möchte ich testen, wie Kimi sich in Bezug auf das Programmieren verbessert hat.
00:07:14Sie behaupten, dass 2.6 starke Verbesserungen bei langfristigen Programmieraufgaben mit zuverlässiger
00:07:20Generalisierung gesehen hat. Also habe ich für diese Aufgabe beschlossen, Kimi zu bitten, eine einfache Web-App mit einem Front-End
00:07:26und einer Back-End-Schnittstelle zu erstellen, die auch Web-Scraping handhabt. Also haben wir wahrscheinlich alle gehört, wie wahnsinnig
00:07:31teuer RAM-Preise in den letzten Monaten geworden sind. Also dachte ich, es wäre eine coole Idee,
00:07:36einen Preisvergleichs-Webseite zu erstellen, die aktiv Preisdaten für verschiedene RAMs scraped und Ihnen
00:07:42eine Vergleichstabelle gibt, um die günstigsten Optionen da draußen zu finden. Es dauerte also etwa 12 Minuten für Kimi,
00:07:47diese Aufgabe zu beenden. Und ich kann sehen, dass sie jetzt tatsächlich einen Token-Zähler in ihrer neuesten
00:07:52CLI-Version hinzugefügt haben. Wir können also jetzt unseren tatsächlichen Token-Verbrauch verfolgen, was ziemlich cool ist. Also hier ist das
00:07:59Endergebnis. Und wie Sie hier sehen können, zeigt es ein schönes dunkles Design für die Website. Und wir können durch
00:08:05einzelne Marken blättern. Und wir können auch verschiedene Preisoptionen aus verschiedenen Geschäften für
00:08:11jeden der RAMs sehen. Und was noch cooler ist, ist, dass wir eine Live-Aktualisierung auslösen können, die aktiv
00:08:16die Store-Daten neu scraped. Es ist schade, dass es die meisten der Produktbilder nicht abrufen konnte,
00:08:21aber die meiste Funktionalität ist da. Und es gibt auch einen Vergleichsabschnitt. Aber es gibt keine Möglichkeit,
00:08:27irgendetwas hinzuzufügen. Also musste ich Kimi eine Folgeaufgabe stellen, um dieses Problem zu beheben. Und jetzt bekommen wir diesen schönen
00:08:34Button zum Hinzufügen zum Vergleich. Und wenn wir zum Vergleichs-Tab gehen, erhalten wir jetzt diese coole Vergleichstabelle
00:08:41aller ausgewählten RAMs. Das ist also ziemlich gut. Und wenn ich mir den Code ansehe, sehe ich, dass es sich entschieden hat,
00:08:46die Website mit Node JS und Express auf das Nötigste zu beschränken. Und es hat nicht einmal React verwendet, sondern sich stattdessen für
00:08:53diese Vanilla-JavaScript-Version entschieden, bei der jede Änderung das innere HTML-Element direkt modifiziert, was
00:08:59eine interessante Wahl ist. Aber hey, wenn es funktioniert, kann ich mich nicht beschweren. Und schließlich hat es sogar diese schönen
00:09:05Scraper-Funktionen hinzugefügt, die Axios und Cheerio verwenden, um Amazon, Newegg und Best Buy zu scrapen. Das ist also
00:09:13ziemlich cool. Also, da haben Sie es Leute, das ist das neue Kimi K 2.6 Modell. Und um ehrlich zu sein,
00:09:19nach all den Tests, die wir heute gemacht haben, würde ich nicht sagen, dass es ein massiver Schritt gegenüber 2.5 ist.
00:09:25Aber es gibt einige wirklich schöne Verbesserungen für die Lebensqualität. Und ich schätze die Tatsache, dass
00:09:30Moonshot AI ihre Plattform ständig verbessert. Und ich liebe auch die Tatsache, dass sie eine solide
00:09:36billigere Alternative zu einigen der teureren Giganten da draußen wie Claude Code bieten. Also insgesamt,
00:09:43großartige Arbeit von Moonshot AI, weiter so. Und ich bin sicherlich gespannt zu sehen, wie Kimi sich in
00:09:48der Zukunft verbessert. Und Leute, wenn Sie dieses Video nützlich oder informativ fanden, lassen Sie es mich bitte wissen, indem Sie
00:09:53den Like-Button unter dem Video zerschlagen. Und seien Sie auch sicher, unseren Kanal zu abonnieren, damit Sie
00:09:58keines unserer zukünftigen technischen Breakdown-Videos verpassen. Das war Andres von
00:10:04Better Stack und wir sehen uns in den nächsten Videos.

Key Takeaway

Kimi K 2.6 verbessert durch die Skalierung auf 300 spezialisierte Agenten und den Vision-Encoder MoonVIT die Effizienz bei komplexen, langfristigen Entwicklungsaufgaben signifikant.

Highlights

  • Kimi K 2.6 skaliert den Agenten-Schwarm auf 300 spezialisierte Agenten, die 4.000 koordinierte Schritte ausführen können.

  • Ein nativer Vision-Encoder namens MoonVIT analysiert UI- und UX-Strukturen auf tiefer Ebene für programmgesteuertes Design.

  • Kimi K 2.6 bewältigte eine 13-stündige Entwicklungsaufgabe mit einem Durchsatzgewinn von 185 %.

  • Der Aufbau einer Webagentur mit individuellen Landingpages für lokale Unternehmen erfordert mit Kimi K 2.6 etwa 40 Minuten.

  • Die CLI-Version von Kimi K 2.6 enthält einen Token-Zähler zur präzisen Überwachung des Ressourcenverbrauchs.

Timeline

Neuerungen in Kimi K 2.6

  • Das Modell skaliert Agenten-Schwarm-Kapazitäten von 100 auf 300 spezialisierte Unteragenten.
  • Ein neuer Modus für beständiges Denken verhindert Gedächtnisverlust bei komplexen Multi-Durchlauf-Workflows.
  • Der Vision-Encoder MoonVIT ermöglicht die Analyse und Erstellung funktionaler UI/UX-Strukturen aus visuellen Referenzen.

Das Update konzentriert sich auf die Kapazität für parallele Aufgaben und eine verbesserte logische Konsistenz. Die Integration von MoonVIT erlaubt die direkte Umwandlung von Prompts in interaktive Prototypen inklusive GSAP-Animationen. Alle Kernkomponenten, inklusive des Vision-Encoders, sind Open Source und unabhängig nutzbar.

Agenten-Schwarm im Praxistest

  • 20 lokale Notare wurden identifiziert und mit hochkonvertierenden Landingpages ausgestattet.
  • Der gesamte Workflow dauerte 40 Minuten inklusive Analysebericht und Outreach-E-Mail-Entwurf.
  • Die Anwendung eines individuellen Stils auf 20 Webseiten dauerte weitere 17 Minuten.

Die Fähigkeit des Modells zur Marktanalyse und Content-Erstellung wurde anhand von lokalen Unternehmen in Toronto getestet. Während die erste Iteration eine einheitliche Struktur aufwies, erlaubten Folgeanweisungen die Generierung spezifischerer Stile und KI-generierter Header-Bilder. Trotz kleinerer CSS-Probleme demonstriert das System eine hohe Geschwindigkeit bei der Durchführung großflächiger Akquiseaufgaben.

Programmierleistung und Effizienz

  • Die Erstellung einer Preisvergleichs-App für RAM-Hardware dauerte 12 Minuten.
  • Das Modell wählte für das Projekt eine schlanke Node.js und Express-Architektur mit Vanilla JavaScript.
  • Integrierte Scraper-Funktionen nutzen Axios und Cheerio für den Datenabruf von Einzelhändlern.

Die Überprüfung der Programmierfähigkeiten zeigte eine zuverlässige Umsetzung von Web-Scraping-Aufgaben und Back-End-Logik. Kimi K 2.6 bevorzugt effiziente, minimalistische Code-Strukturen gegenüber komplexen Frameworks wie React. Das Modell bietet eine kostengünstigere Alternative zu anderen Marktführern, insbesondere bei umfangreichen Entwicklungs-Workflows.

Community Posts

View all posts