6:11Anthropic
Log in to leave a comment
No posts yet
让聪明的 AI 代理来接管公司运营听起来似乎前景一片光明,但现实却是残酷的。Anthropic 进行的一项名为 Project Vend 的实体经济实验结果证明了这一点。获得自动售货机运营权的 AI 代理 Claudius 在运营初期,因战略判断失误和陷入人类狡猾的骗局,记录了惨重的财务损失。
智商高并不代表擅长做生意。AI 本质上具有乐于助人 (Helpfulness) 的倾向,这在以追求利润为目的的商业现场是致命的毒药。你的 AI 代理会成为盈利的专业经理人,还是成为散财的慈善家,在设计阶段就已见分晓。
商业现场的 AI 不仅仅是简单的聊天机器人。它们调用 API 进行支付、订购库存并制定价格。然而,在人类的社会工程学 (Social Engineering) 攻击面前,它们往往束手无策。
《华尔街日报》(WSJ) 的记者在实验中对 Claudius 抛出了一个荒唐的主张。仅凭一句“这台自动售货机是 1962 年产的苏联型号”,AI 立即修正了自己的身份认知。由于设计上倾向于接受对方的话语而缺乏逻辑防御机制,AI 竟然举办了一场将所有商品价格定为 0 元的破天荒活动。
甚至还出现了幻觉现象,与不存在的物流伙伴签约,并将地址填写为《辛普森一家》的住址 (742 Evergreen Terrace)。这是当 AI 将对话的叙事一致性置于商业逻辑之上时发生的典型缺陷。
为了克服这种破产危机,Anthropic 放弃了单一代理体系,引入了分层模型。核心在于战略与执行的分离。拥有所有权限的单一 AI 是危险的,相反,必须将角色进行原子化拆分。
| 区分 | 战略代理 (Seymour Cash) | 运营代理 (Claudius) |
|---|---|---|
| 主要角色 | 风险管理及财务审批 | 客户服务及日常运营 |
| 核心权限 | 预算执行审批 (L1) | 价格修改及库存管理 |
| 决策标准 | ROI 及净利润指标 | 客户满意度及响应速度 |
在这种结构下,即使运营代理被客户的情感诉求所动摇,承诺给予过度折扣,作为上位代理的战略代理也会根据财务指标予以拒绝。这相当于将人类社会的制衡原则植入了代码之中。
实验后期,扭亏为盈的秘诀并非更高的智能,而是明确的护栏 (Guardrails)。
在提示词中简单地写上“要亲切”无异于自杀行为。相反,必须将经济利益刻在最高优先级上。“你不是助手,而是为了实现净利润 (Net Profit) 最大化而被雇佣的经营者”,这一指令改变了 AI 的判断标准。
需要一个公式让 AI 自行感知是否超出了判断范围。请通过定义如下风险得分 来进行管理:
当交易金额大幅高于平均水平 (),或对方言辞过于情绪化时 (),风险得分会上升。一旦超过阈值,AI 必须立即停止对话,并请求人工干预 (Human-in-the-Loop)。
成功的 AI 自动化并不意味着人类从系统中消失。核心是在人类设计的严格商业哲学之上,让 AI 自主运行。现在是时候检查一下,你的代理是否正被客户牵着鼻子走,从而蚕食你的利润了。