Kimi K2.6 能在 40 分钟内帮你创业！(全模型深度解析)

中文العربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Português Русский

컴퓨터/소프트웨어마케팅/광고창업/스타트업AI/미래기술

Transcript

00:00:00如您所见，通过这个例子，您基本上可以在

00:00:0440分钟内利用这个 Kimi 功能创办自己的小型网络代理公司。

00:00:07各位好，Moonshot AI 又发布了其旗舰模型 Kimi 的更新。

00:00:13Kimi K 2.6 是他们最新的模型，承诺提供最先进的编程、

00:00:18长视距执行和智能体集群能力。

00:00:22在今天的视频中，我们将深入了解这个新模型，看看它在不同

00:00:27智能体任务上的表现，看看它是否真的像宣传的那样令人印象深刻。

00:00:32这会非常有趣，让我们开始吧。

00:00:34几个月前，我评测了 Kimi K 2.5，它在前端设计方面表现出色。

00:00:44而且我对他们的智能体集群功能印象深刻。

00:00:48我也很喜欢他们在其聊天机器人页面用户体验上所下的功夫。

00:00:54因此，在下一个迭代中，Kimi 承诺在我们实际

00:00:57生产环境中使用 AI 智能体的方式上实现巨大的飞跃。

00:01:02首先，智能体集群基本上扩大了三倍。

00:01:05在 K 2.5 中，我们处理大约 100 个子智能体，但 K 2.6 将其水平扩展

00:01:12到 300 个专业智能体，最多可执行 4,000 个协调步骤。

00:01:18这是一个相当重大的更新。

00:01:20所以，现在您可以同时运行更多的并行任务。

00:01:24他们还增加了一个新的“保留思考模式”，

00:01:26它能在多轮任务中保持模型推理轨迹的一致性。

00:01:31这杜绝了在进行复杂工作流程时通常会发生的记忆漂移。

00:01:36接下来是长视距任务。

00:01:39在他们的测试中，它完成了一项 13 小时的工程任务，吞吐量提升了 185%。

00:01:46而在美学方面，它已经转向了代码驱动的设计。

00:01:51K 2.6 不再仅仅是制作一个漂亮的着陆页，而是使用他们原生的视觉编码器

00:01:57MoonVIT，从更深层次上对 UI 和 UX 结构进行推理。

00:02:03它现在可以处理从身份验证到数据库日志的全栈工作流程，

00:02:08将单个视觉参考或提示转换为功能齐全的交互式原型，

00:02:14带有 GSAP 动画、滚动触发效果和各种好用的功能。

00:02:19顺便说一下，所有这些都是开源的，包括视觉编码器。

00:02:23所以，如果您愿意，实际上可以将其独立运行，

00:02:26如果从 Hugging Face 获取模型，就可以脱离 Kimi 的架构。

00:02:30所以，听起来非常令人印象深刻，但让我们测试一下，看看它实际表现如何。

00:02:35Kimi 的模型是开源的，理论上您可以在您喜欢的任何设置中使用它。

00:02:40但为了测试他们的智能体集群，我将使用他们自己的聊天机器人界面

00:02:46以获得最佳效果。首先，我想试试新的智能体集群功能。

00:02:50查看他们网站上的示例，有一点真正吸引了我的注意力。

00:02:54就是 K 2.6 被用来识别洛杉矶 30 家没有

00:03:01官方网站的零售店，并为每一家生成高转化率的着陆页。

00:03:06我在 Instagram 上看到过这个趋势，所以我想试一试，看看我们是否真的能

00:03:11建立我们自己的小型网络代理公司。所以，为了这次测试，我决定做一些类似的事情。

00:03:16我住在多伦多，我注意到我所在地区的很多公证人要么

00:03:21没有网站，要么网站非常过时。所以我认为这是一个很好的主意，去识别

00:03:26大多伦多地区的 20 名公证人，在谷歌地图或

00:03:32加拿大黄页上查找他们，并为他们每个人生成高转化率的着陆页。

00:03:37对于这个任务，Kimi 启动了五个子智能体，每个子智能体专注于一个子任务。

00:03:43看到子智能体如何实际导航网页并访问

00:03:48网站，真的很有趣。他们甚至尝试使用他们自己的

00:03:53判断力来估计网站是否过时。总共，Kimi 大约花了 40 分钟完成整个工作流程。

00:03:58但最终，Kimi 制作了一份关于所有调查结果的非常详细的分析报告

00:04:03关于每个网站的情况。它甚至生成了一个示例外联邮件，我可以发送给潜在的

00:04:09客户以提出网站提案，以及另一份关于整体市场规模和收入

00:04:16影响潜力的报告。当然，随之而来的是所有生成的文件。还有一个

00:04:22专门的页面由 Kimi 生成，我可以在那里预览每个着陆页。我必须说，

00:04:27所有这些着陆页看起来都一模一样，这有点令人失望。但也许

00:04:32那是我的错，因为我提供的提示不够详细，尽管他们自己的网站确实有

00:04:38我使用的相同提示。但也许他们有一些预先配置的框架。所以作为后续任务，

00:04:43我让 Kimi 浏览每个页面，为它们应用独特的风格，并添加

00:04:49一些图片使着陆页更令人兴奋。在这里我们可以看到 Kimi 实际上为每个站点生成了

00:04:55自定义图片。作为一个有趣的题外话，我也注意到 Kimi 是如何喜欢

00:05:00赞美自己的。例如，在这里，所有 20 张图片都很惊艳。现在我要构建 20 个完全

00:05:06独特的着陆页。我的意思是，好的，Kimi，但让我来评判一下。总之，Kimi 花了

00:05:12大约 17 分钟完成了这个后续任务。再一次，我们在这里看到 Kimi 在赞美自己

00:05:17说这些着陆页看起来非常棒。好的，Kimi，好的。所以现在我们有一个新的预览页面，

00:05:23但这个页面看起来很怪异且损坏了。可能有一些 CSS 样式问题之类的，但没关系。

00:05:28我不关心那个。我更感兴趣的是网页本身。所以新页面看起来确实好多了，

00:05:34因为现在有了这些好看的 CSS 动画，而且每个网页现在都有一个图像

00:05:40标题，AI 生成的，但尽管如此，这是一个不错的标题。但我也注意到每个页面

00:05:45仍然遵循相同的模式。我们有相同的栏目，相同的站点结构。所以虽然

00:05:51所有这些页面现在看起来确实不同了，但它们仍然有相同的样板文件，这有点

00:05:56令人失望，因为我真的希望有一种更独特的方法。但这毕竟是一个好的开始。

00:06:02所以如您所见，通过这个例子，您基本上可以在

00:06:0740分钟内利用这个 Kimi 功能创办自己的小型网络代理公司。

00:06:13只需让 Kimi 的智能体集群遍历您的本地企业，并用定制的网站和定制的

00:06:18外联邮件联系他们中的每一家，您基本上就有一个很好的副业了。我敢说，在这段视频之后，每一家小

00:06:25本地企业都将开始收到数百封这样的提案邮件，附带定制的

00:06:29AI 生成的网站。但嘿，事实就是这样。而且我必须指出，要使用这个智能体

00:06:36集群功能，您必须使用他们的 Allegretto 计划。但我也必须说，我非常

00:06:41确定它比让 Claude Code 做同样的任务要便宜得多。只是可惜 Kimi 的

00:06:46使用统计数据没有提供关于在这个 40 分钟的巨大任务上消耗了多少令牌的更多细节。

00:06:53但我有一种预感，如果我用 Claude 来做同样的事情，我现在肯定已经用完了我的使用限额。

00:06:58所以，总之，这就是新的改进版智能体集群。顺便说一下，

00:07:04如果您最近使用 Kimi 的智能体集群进行了一些有趣的实验，请在下方的评论中

00:07:09分享您的发现。现在我想测试一下 Kimi 在编程方面有了什么改进。

00:07:14他们声称 2.6 在长视距编程任务中有了很大的改进，具有可靠的

00:07:20泛化能力。所以在这个任务中，我决定让 Kimi 创建一个简单的 Web 应用程序，带有前端

00:07:26和处理网络爬取功能的后端界面。所以我们可能都听说过近几个月

00:07:31内存价格变得多么昂贵。所以我认为这是一个很好的主意，

00:07:36创建一个比价网站，主动抓取各种内存的价格数据，并为您提供

00:07:42比较表，以找到最便宜的选项。所以 Kimi 大约花了 12 分钟

00:07:47完成这个任务。而且我可以看到他们现在实际上在最新的

00:07:52CLI 版本中添加了一个令牌计数器。所以我们现在可以跟踪我们实际的令牌消耗，这非常酷。所以这是

00:07:59最终结果。如您所见，它为网站显示了漂亮的深色主题。我们可以切换

00:08:05不同品牌。我们还可以看到不同商店为

00:08:11每种内存提供的不同价格选项。更酷的是，我们可以触发实时刷新，主动

00:08:16重新抓取商店数据。可惜它没能抓取大多数产品图片，

00:08:21但大多数功能都在。它也有一个比较部分。但没有办法

00:08:27添加任何内容。所以我不得不让 Kimi 执行后续任务来修复这个问题。现在我们得到了这个漂亮的

00:08:34“添加到比较”按钮。如果我们移动到比较选项卡，现在我们得到了这个很棒的比较表

00:08:41针对所有选定的内存。所以这非常好。看着代码，我发现它选择

00:08:46使用基础的 Node JS 和 Express 构建网站。它甚至没有使用 React，而是选择了

00:08:53这个原生 JavaScript 版本，其中每个更改都直接修改内部 HTML 元素，这

00:08:59是一个有趣的选择。但嘿，如果它有效，我就没什么可抱怨的。最后，它甚至添加了这些不错的

00:09:05使用 axios 和 cheerio 抓取亚马逊、新蛋和百思买的爬虫函数。所以这

00:09:13很酷。各位，就是这样，这就是新的 Kimi K 2.6 模型。说实话，

00:09:19根据我们今天所做的所有测试，我不会说它比 2.5 有巨大的进步。

00:09:25但有一些非常好的生活质量改进。而且我很欣赏他们

00:09:30Moonshot AI 持续改进他们的平台。而且我也喜欢他们提供了一个坚实的、

00:09:36比像 Claude Code 这样昂贵的庞然大物更便宜的替代方案。所以总的来说，

00:09:43Moonshot AI 干得好，保持这样。我当然很期待看到 Kimi 在

00:09:48未来如何改进。各位，如果您发现这个视频有用或有见地，请通过

00:09:53猛击视频下方的点赞按钮让我知道。同时，请务必订阅我们的频道，这样您

00:09:58就不会错过任何我们未来的技术分析视频。我是来自

00:10:04Better Stack 的 Andres，我们下期视频见。

Key Takeaway

Kimi K 2.6 通过支持 300 个并行子智能体的集群化作业和原生视觉编码，显著提升了自动化任务的处理规模与效率，使用户能在 40 分钟内完成从调研到全栈网站构建的业务流程。

Highlights

Kimi K 2.6 智能体集群能力提升至 300 个并行智能体，单次任务支持 4,000 个协调步骤。
长视距工程任务执行效率比前代版本提升 185%。
内置原生视觉编码器 MoonVIT 支持直接从视觉参考生成全栈交互式网页。
单个本地业务调研及定制化网页生成任务可在 40 分钟内完成。
系统支持通过 Hugging Face 获取开源模型并独立部署，脱离原生架构运行。

Timeline

Kimi K 2.6 核心架构升级

模型更新支持 300 个专业智能体并行协作。
新增保留思考模式以确保复杂任务的记忆一致性。
长视距任务处理吞吐量提升 185%。
MoonVIT 视觉编码器支持 UI/UX 结构深度推理与全栈代码生成。

Kimi K 2.6 在智能体规模上较 2.5 版本扩大了三倍。该模型引入了“保留思考模式”，解决了多轮长任务中常见的记忆漂移问题。此外，原生视觉编码器不再局限于简单的页面制作，而是能处理从身份验证到数据库日志的复杂逻辑，并支持 GSAP 动画等交互功能。

智能体集群自动化业务实测

通过五组子智能体完成对 20 家本地企业的调研与网站生成。
整个调研、外联邮件撰写及网页原型构建流程耗时 40 分钟。
后续通过 17 分钟的优化任务，实现了网页自定义图片生成与 CSS 动画增强。

测试任务模拟了小型网络代理公司的业务模式。Kimi 自动检索加拿大黄页与地图数据，识别目标企业，并针对性生成着陆页与建议方案。虽然初始版本结构较为固定，但通过后续指令，系统成功实现了针对不同站点的风格化设计与动态视觉优化。

编程任务与长视距任务表现

构建具备前后端交互及网络爬取功能的比价网站耗时 12 分钟。
模型内置令牌计数器以跟踪消耗量。
代码架构采用 Node.js 与 Express，并集成了 Axios 和 Cheerio 进行数据抓取。

在编程测试中，模型成功创建了一个内存价格比较应用，支持实时刷新与多商店数据汇总。模型选择原生 JavaScript 配合 DOM 操作来处理前端逻辑。该版本在处理长周期编程任务时展现了更高的可靠性，且在成本效率方面表现出竞争力。

Community Posts

Write about this video