Kimi K2.6 能在 40 分钟内帮你创业!(全模型深度解析)

BBetter Stack
컴퓨터/소프트웨어마케팅/광고창업/스타트업AI/미래기술

Transcript

00:00:00如您所见,通过这个例子,您基本上可以在
00:00:0440分钟内利用这个 Kimi 功能创办自己的小型网络代理公司。
00:00:07各位好,Moonshot AI 又发布了其旗舰模型 Kimi 的更新。
00:00:13Kimi K 2.6 是他们最新的模型,承诺提供最先进的编程、
00:00:18长视距执行和智能体集群能力。
00:00:22在今天的视频中,我们将深入了解这个新模型,看看它在不同
00:00:27智能体任务上的表现,看看它是否真的像宣传的那样令人印象深刻。
00:00:32这会非常有趣,让我们开始吧。
00:00:34几个月前,我评测了 Kimi K 2.5,它在前端设计方面表现出色。
00:00:44而且我对他们的智能体集群功能印象深刻。
00:00:48我也很喜欢他们在其聊天机器人页面用户体验上所下的功夫。
00:00:54因此,在下一个迭代中,Kimi 承诺在我们实际
00:00:57生产环境中使用 AI 智能体的方式上实现巨大的飞跃。
00:01:02首先,智能体集群基本上扩大了三倍。
00:01:05在 K 2.5 中,我们处理大约 100 个子智能体,但 K 2.6 将其水平扩展
00:01:12到 300 个专业智能体,最多可执行 4,000 个协调步骤。
00:01:18这是一个相当重大的更新。
00:01:20所以,现在您可以同时运行更多的并行任务。
00:01:24他们还增加了一个新的“保留思考模式”,
00:01:26它能在多轮任务中保持模型推理轨迹的一致性。
00:01:31这杜绝了在进行复杂工作流程时通常会发生的记忆漂移。
00:01:36接下来是长视距任务。
00:01:39在他们的测试中,它完成了一项 13 小时的工程任务,吞吐量提升了 185%。
00:01:46而在美学方面,它已经转向了代码驱动的设计。
00:01:51K 2.6 不再仅仅是制作一个漂亮的着陆页,而是使用他们原生的视觉编码器
00:01:57MoonVIT,从更深层次上对 UI 和 UX 结构进行推理。
00:02:03它现在可以处理从身份验证到数据库日志的全栈工作流程,
00:02:08将单个视觉参考或提示转换为功能齐全的交互式原型,
00:02:14带有 GSAP 动画、滚动触发效果和各种好用的功能。
00:02:19顺便说一下,所有这些都是开源的,包括视觉编码器。
00:02:23所以,如果您愿意,实际上可以将其独立运行,
00:02:26如果从 Hugging Face 获取模型,就可以脱离 Kimi 的架构。
00:02:30所以,听起来非常令人印象深刻,但让我们测试一下,看看它实际表现如何。
00:02:35Kimi 的模型是开源的,理论上您可以在您喜欢的任何设置中使用它。
00:02:40但为了测试他们的智能体集群,我将使用他们自己的聊天机器人界面
00:02:46以获得最佳效果。首先,我想试试新的智能体集群功能。
00:02:50查看他们网站上的示例,有一点真正吸引了我的注意力。
00:02:54就是 K 2.6 被用来识别洛杉矶 30 家没有
00:03:01官方网站的零售店,并为每一家生成高转化率的着陆页。
00:03:06我在 Instagram 上看到过这个趋势,所以我想试一试,看看我们是否真的能
00:03:11建立我们自己的小型网络代理公司。所以,为了这次测试,我决定做一些类似的事情。
00:03:16我住在多伦多,我注意到我所在地区的很多公证人要么
00:03:21没有网站,要么网站非常过时。所以我认为这是一个很好的主意,去识别
00:03:26大多伦多地区的 20 名公证人,在谷歌地图或
00:03:32加拿大黄页上查找他们,并为他们每个人生成高转化率的着陆页。
00:03:37对于这个任务,Kimi 启动了五个子智能体,每个子智能体专注于一个子任务。
00:03:43看到子智能体如何实际导航网页并访问
00:03:48网站,真的很有趣。他们甚至尝试使用他们自己的
00:03:53判断力来估计网站是否过时。总共,Kimi 大约花了 40 分钟完成整个工作流程。
00:03:58但最终,Kimi 制作了一份关于所有调查结果的非常详细的分析报告
00:04:03关于每个网站的情况。它甚至生成了一个示例外联邮件,我可以发送给潜在的
00:04:09客户以提出网站提案,以及另一份关于整体市场规模和收入
00:04:16影响潜力的报告。当然,随之而来的是所有生成的文件。还有一个
00:04:22专门的页面由 Kimi 生成,我可以在那里预览每个着陆页。我必须说,
00:04:27所有这些着陆页看起来都一模一样,这有点令人失望。但也许
00:04:32那是我的错,因为我提供的提示不够详细,尽管他们自己的网站确实有
00:04:38我使用的相同提示。但也许他们有一些预先配置的框架。所以作为后续任务,
00:04:43我让 Kimi 浏览每个页面,为它们应用独特的风格,并添加
00:04:49一些图片使着陆页更令人兴奋。在这里我们可以看到 Kimi 实际上为每个站点生成了
00:04:55自定义图片。作为一个有趣的题外话,我也注意到 Kimi 是如何喜欢
00:05:00赞美自己的。例如,在这里,所有 20 张图片都很惊艳。现在我要构建 20 个完全
00:05:06独特的着陆页。我的意思是,好的,Kimi,但让我来评判一下。总之,Kimi 花了
00:05:12大约 17 分钟完成了这个后续任务。再一次,我们在这里看到 Kimi 在赞美自己
00:05:17说这些着陆页看起来非常棒。好的,Kimi,好的。所以现在我们有一个新的预览页面,
00:05:23但这个页面看起来很怪异且损坏了。可能有一些 CSS 样式问题之类的,但没关系。
00:05:28我不关心那个。我更感兴趣的是网页本身。所以新页面看起来确实好多了,
00:05:34因为现在有了这些好看的 CSS 动画,而且每个网页现在都有一个图像
00:05:40标题,AI 生成的,但尽管如此,这是一个不错的标题。但我也注意到每个页面
00:05:45仍然遵循相同的模式。我们有相同的栏目,相同的站点结构。所以虽然
00:05:51所有这些页面现在看起来确实不同了,但它们仍然有相同的样板文件,这有点
00:05:56令人失望,因为我真的希望有一种更独特的方法。但这毕竟是一个好的开始。
00:06:02所以如您所见,通过这个例子,您基本上可以在
00:06:0740分钟内利用这个 Kimi 功能创办自己的小型网络代理公司。
00:06:13只需让 Kimi 的智能体集群遍历您的本地企业,并用定制的网站和定制的
00:06:18外联邮件联系他们中的每一家,您基本上就有一个很好的副业了。我敢说,在这段视频之后,每一家小
00:06:25本地企业都将开始收到数百封这样的提案邮件,附带定制的
00:06:29AI 生成的网站。但嘿,事实就是这样。而且我必须指出,要使用这个智能体
00:06:36集群功能,您必须使用他们的 Allegretto 计划。但我也必须说,我非常
00:06:41确定它比让 Claude Code 做同样的任务要便宜得多。只是可惜 Kimi 的
00:06:46使用统计数据没有提供关于在这个 40 分钟的巨大任务上消耗了多少令牌的更多细节。
00:06:53但我有一种预感,如果我用 Claude 来做同样的事情,我现在肯定已经用完了我的使用限额。
00:06:58所以,总之,这就是新的改进版智能体集群。顺便说一下,
00:07:04如果您最近使用 Kimi 的智能体集群进行了一些有趣的实验,请在下方的评论中
00:07:09分享您的发现。现在我想测试一下 Kimi 在编程方面有了什么改进。
00:07:14他们声称 2.6 在长视距编程任务中有了很大的改进,具有可靠的
00:07:20泛化能力。所以在这个任务中,我决定让 Kimi 创建一个简单的 Web 应用程序,带有前端
00:07:26和处理网络爬取功能的后端界面。所以我们可能都听说过近几个月
00:07:31内存价格变得多么昂贵。所以我认为这是一个很好的主意,
00:07:36创建一个比价网站,主动抓取各种内存的价格数据,并为您提供
00:07:42比较表,以找到最便宜的选项。所以 Kimi 大约花了 12 分钟
00:07:47完成这个任务。而且我可以看到他们现在实际上在最新的
00:07:52CLI 版本中添加了一个令牌计数器。所以我们现在可以跟踪我们实际的令牌消耗,这非常酷。所以这是
00:07:59最终结果。如您所见,它为网站显示了漂亮的深色主题。我们可以切换
00:08:05不同品牌。我们还可以看到不同商店为
00:08:11每种内存提供的不同价格选项。更酷的是,我们可以触发实时刷新,主动
00:08:16重新抓取商店数据。可惜它没能抓取大多数产品图片,
00:08:21但大多数功能都在。它也有一个比较部分。但没有办法
00:08:27添加任何内容。所以我不得不让 Kimi 执行后续任务来修复这个问题。现在我们得到了这个漂亮的
00:08:34“添加到比较”按钮。如果我们移动到比较选项卡,现在我们得到了这个很棒的比较表
00:08:41针对所有选定的内存。所以这非常好。看着代码,我发现它选择
00:08:46使用基础的 Node JS 和 Express 构建网站。它甚至没有使用 React,而是选择了
00:08:53这个原生 JavaScript 版本,其中每个更改都直接修改内部 HTML 元素,这
00:08:59是一个有趣的选择。但嘿,如果它有效,我就没什么可抱怨的。最后,它甚至添加了这些不错的
00:09:05使用 axios 和 cheerio 抓取亚马逊、新蛋和百思买的爬虫函数。所以这
00:09:13很酷。各位,就是这样,这就是新的 Kimi K 2.6 模型。说实话,
00:09:19根据我们今天所做的所有测试,我不会说它比 2.5 有巨大的进步。
00:09:25但有一些非常好的生活质量改进。而且我很欣赏他们
00:09:30Moonshot AI 持续改进他们的平台。而且我也喜欢他们提供了一个坚实的、
00:09:36比像 Claude Code 这样昂贵的庞然大物更便宜的替代方案。所以总的来说,
00:09:43Moonshot AI 干得好,保持这样。我当然很期待看到 Kimi 在
00:09:48未来如何改进。各位,如果您发现这个视频有用或有见地,请通过
00:09:53猛击视频下方的点赞按钮让我知道。同时,请务必订阅我们的频道,这样您
00:09:58就不会错过任何我们未来的技术分析视频。我是来自
00:10:04Better Stack 的 Andres,我们下期视频见。

Key Takeaway

Kimi K 2.6 通过支持 300 个并行子智能体的集群化作业和原生视觉编码,显著提升了自动化任务的处理规模与效率,使用户能在 40 分钟内完成从调研到全栈网站构建的业务流程。

Highlights

  • Kimi K 2.6 智能体集群能力提升至 300 个并行智能体,单次任务支持 4,000 个协调步骤。

  • 长视距工程任务执行效率比前代版本提升 185%。

  • 内置原生视觉编码器 MoonVIT 支持直接从视觉参考生成全栈交互式网页。

  • 单个本地业务调研及定制化网页生成任务可在 40 分钟内完成。

  • 系统支持通过 Hugging Face 获取开源模型并独立部署,脱离原生架构运行。

Timeline

Kimi K 2.6 核心架构升级

  • 模型更新支持 300 个专业智能体并行协作。
  • 新增保留思考模式以确保复杂任务的记忆一致性。
  • 长视距任务处理吞吐量提升 185%。
  • MoonVIT 视觉编码器支持 UI/UX 结构深度推理与全栈代码生成。

Kimi K 2.6 在智能体规模上较 2.5 版本扩大了三倍。该模型引入了“保留思考模式”,解决了多轮长任务中常见的记忆漂移问题。此外,原生视觉编码器不再局限于简单的页面制作,而是能处理从身份验证到数据库日志的复杂逻辑,并支持 GSAP 动画等交互功能。

智能体集群自动化业务实测

  • 通过五组子智能体完成对 20 家本地企业的调研与网站生成。
  • 整个调研、外联邮件撰写及网页原型构建流程耗时 40 分钟。
  • 后续通过 17 分钟的优化任务,实现了网页自定义图片生成与 CSS 动画增强。

测试任务模拟了小型网络代理公司的业务模式。Kimi 自动检索加拿大黄页与地图数据,识别目标企业,并针对性生成着陆页与建议方案。虽然初始版本结构较为固定,但通过后续指令,系统成功实现了针对不同站点的风格化设计与动态视觉优化。

编程任务与长视距任务表现

  • 构建具备前后端交互及网络爬取功能的比价网站耗时 12 分钟。
  • 模型内置令牌计数器以跟踪消耗量。
  • 代码架构采用 Node.js 与 Express,并集成了 Axios 和 Cheerio 进行数据抓取。

在编程测试中,模型成功创建了一个内存价格比较应用,支持实时刷新与多商店数据汇总。模型选择原生 JavaScript 配合 DOM 操作来处理前端逻辑。该版本在处理长周期编程任务时展现了更高的可靠性,且在成本效率方面表现出竞争力。

Community Posts

View all posts