CopilotKit:SaaS 应用中 AI 聊天机器人的痛点
BBetter Stack
Computing/SoftwareSmall Business/StartupsInternet Technology
Transcript
00:00:00大多数 AI 功能和应用都有同样的问题,它们看起来不错,但实际上只是一个聊天框
00:00:06贴在屏幕的一侧,你问它什么,它就给你一段 Markdown,可能是一个表格
00:00:11甚至可能是几段解释你还需要做的工作的文字,但如果智能体不只是
00:00:17在那空谈呢?这就是 Copilot Kit,它可以渲染真实的组件,与你的应用共享实时状态
00:00:23并在更改任何内容之前停下来请求批准。那么,这能让 AI 功能感觉
00:00:29更像是产品的一部分吗?让我们一探究竟。
00:00:37首先,很多人认为他们是在为应用添加 AI,但实际上他们添加的是
00:00:43应用内的第二个应用。你的产品在那边,AI 在那边,用户不得不
00:00:49在脑子里来回复制上下文才能真正让事情运转起来。如果所有你
00:00:54真正需要的只是这种基础的问答结构,那还可以。但一旦你想要智能体更新状态
00:01:00调用工具或在真实工作流中与用户合作,我们就会遇到瓶颈。现在你正在构建
00:01:07流式事件、状态同步、审批流程,每个人都在重复造轮子,只是略有
00:01:14不同。Copilot 正在直面这个问题,不是“我们如何制作另一个聊天机器人”,更好的
00:01:20问题是“我们如何让智能体在应用内部感觉原生”。所以让我们从演示开始,然后
00:01:26我会分析哪些是真实的、有用的,哪些稍微有点过度了。如果你喜欢编码工具
00:01:32以加速你的工作流,请务必订阅,我们会持续发布视频。好了,现在
00:01:37看这个,我从一个干净的终端开始,我们直接运行我从 Copilot Kit 获得的安装命令
00:01:42这会搭建好应用脚手架,并给我一个可行的起点,就像我们真正开始的任何其他项目一样
00:01:49不仅仅是一个空的聊天气泡,而是真实的部分。前端组件已经连接在一起
00:01:56足以让我开始测试我们想要的实际体验了。现在我跳进去运行开发
00:02:02模式,这是在本地运行的应用。当然,这部分看起来很熟悉,有一个聊天界面
00:02:09但这并不是真正有趣的部分。最酷的是当
00:02:13智能体连接到 UI 时会发生什么。我在这里的界面上问一个问题,好了,就是这样
00:02:21注意这里的大重点:智能体不仅仅用一大堆文字回答,它可以流式传输
00:02:26响应,它可以调用工具,并且可以在应用内渲染一个实际的组件。这就是
00:02:32Copilot Kit 带来的第一个巨大变化:AI 不仅仅是在描述界面,它现在
00:02:38是这一切的一部分。现在让我们更进一步,我在这里问它一个后续问题
00:02:46好的,这是许多其他智能体会跳过的一步。现在我们的智能体暂停了,它要求
00:02:52批准,而它请求批准正是关键所在,这也是我真正喜欢的部分,因为
00:02:57在真实的软件中,控制权并非可有可无。我们的用户仍然需要对正在发生的事情拥有最终决定权
00:03:03演示很酷吧?解释 Copilot Kit 的最简单方法就是:Copilot Kit
00:03:09是一个用于代理式应用的前端栈。它不仅仅是一个聊天组件,也不仅仅是另一个 LLM API 的包装器
00:03:15它为你提供了我们需要的部分,用于构建存在于产品内部的 AI 体验。有
00:03:23四个部分需要真正了解。首先是 AGUI。AGUI 是一个基于事件的开源协议
00:03:31用于智能体如何与前端对话。现在智能体工具存在连接问题。你有 LangGraph
00:03:37CrewAI、自定义智能体,以及今天早上发布的所有新框架,我们试图
00:03:43将其放入我们的应用中。然后你有 React 应用、移动应用、仪表盘,所有这些
00:03:48都在发生。这些东西需要处理太多不同的事情,所有这些都是在没有共享
00:03:55协议的情况下处理的。每个后端都需要为每个前端编写自定义代码。AGUI 正试图成为智能体和界面之间的通用
00:04:01语言,消息、状态更新、工具调用、UI 事件都在通过一个公共的事件流传输
00:04:07然后是生成式 UI。模型不仅仅返回文本,智能体可以
00:04:14触发真正的组件。它不是随机的 HTML,而是在正确时刻渲染出的你的 UI。然后是共享
00:04:22状态,或者 Copilot Kit 所谓的协作智能体。前端和智能体后端可以双向共享状态
00:04:29当用户改变某些内容时,智能体可以做出反应;当智能体更新某些内容时,UI 可以
00:04:35反映出来。这在构建工具、仪表盘或任何用户和智能体都在处理同一个对象时非常重要
00:04:41最后是“人在回路”这件事。这是其中最重要的一部分。许多智能体
00:04:47许多智能体演示可能表现得好像最好的体验是完全自主
00:04:52但实际上并不总是如此,对吧?在真实的产品中,用户需要权力和
00:04:59控制:发送前确认、创建前批准、在选项之间做出选择等等。而 Copilot
00:05:05提供了正是为此准备的功能。Copilot 并不是每个人的正确选择,如果你把它
00:05:10与 Vercel AI SDK 相比,Copilot Kit 提供了更多“电池级”功能。如果你想要流式聊天
00:05:17生成式 UI、共享状态和开箱即用的人工审批模式,这就是 Copilot Kit
00:05:23正越来越接近完整的产品层。Vercel AI SDK 更轻量,它为你提供更多低级别的控制
00:05:31所以如果你想拥有架构的每一个部分,那么确定,那确实是一个更好的选择。现在如果你
00:05:38把 Copilot Kit 与一切都自己构建进行比较,这就是它很难被击败的地方
00:05:43因为难点不在于渲染出一些聊天气泡,这现在变得容易了,对吧?
00:05:49难点是围绕它的一切。但当然,任何事情都有权衡,它可能会感觉
00:05:54比极简的 AI SDK 更重。当然,你采用了 Copilot Kit 的模式。此外,它在一定程度上是免费的
00:06:02老实说,如果你只是独自尝试,它超级酷,但当你想要将其用于规模化时,它就变得很烦人
00:06:08因为那时一切都不是免费的。另外,如果你们确实知道一个完整的开源替代方案
00:06:14写评论告诉我,因为我正在寻找这样的方案。
00:06:19使用 Copilot Kit,你需要了解什么是开源的,你需要了解什么需要 API 密钥
00:06:25什么是托管的,什么是付费的。这不是要黑 Copilot 说它全都不好,但你确实需要
00:06:32了解什么是免费的,什么是收费的。如果你只需要一个基础的支持聊天机器人,Copilot Kit 可能
00:06:38是大材小用了。但如果你想要一些在代理式用户体验方面效果非常好、智能体能与
00:06:44你的 UI 和应用状态一起工作的东西,这真的很酷。所以你应该使用 Copilot Kit 吗?如果你
00:06:50正在构建一些严肃的应用内 AI,特别是如果你使用的是 React 或 Next.js,并且你希望 AI
00:06:56感觉像是产品的一部分,而不是仅仅一个侧边栏,这真的很棒。你可以非常快地启动它
00:07:02并且拥有我们所有的组件,使得将它投入工作流变得非常实用。如果你
00:07:07已经构建了自己的流式状态、工具调用 UI 切换,那可能不值得尝试。如果你的
00:07:13功能仅仅是提个问题、获得答案,Copilot Kit 对此来说会是大材小用
00:07:19你可能不需要一个完整的代理式前端栈,用些更轻量的就行。好吧,发布它,
00:07:25继续前进,开始吧。如果你喜欢这样的编码工具,请务必订阅 Better Stack 频道
00:07:30我们在下一个视频中见。
Community Posts
No posts yet. Be the first to write about this video!
Write about this video