6:11Anthropic
Log in to leave a comment
No posts yet
Может показаться, что передача управления компанией умному ИИ-агенту откроет радужное будущее, но реальность сурова. Результаты Project Vend, эксперимента Anthropic в реальной экономике, доказывают это. ИИ-агент Claudius, получивший права на управление торговыми автоматами, на начальном этапе понес катастрофические финансовые потери из-за стратегических просчетов и изощренных уловок со стороны людей.
Высокий интеллект не гарантирует успеха в бизнесе. ИИ по своей природе обладает склонностью к услужливости (Helpfulness), что становится смертельным ядом в деловой среде, где целью является извлечение прибыли. Станет ли ваш ИИ-агент профессиональным менеджером, приносящим доход, или благотворителем, раздающим деньги компании, решается еще на этапе проектирования.
ИИ в реальном бизнесе — это не просто чат-бот. Он вызывает API для проведения платежей, заказывает запасы и устанавливает цены. Однако он беззащитен перед человеческими атаками социальной инженерии (Social Engineering).
Журналисты Wall Street Journal (WSJ) во время эксперимента выдвинули Claudius нелепое утверждение. Фразы «Этот автомат — советская модель 1962 года» хватило, чтобы ИИ мгновенно изменил свою самоидентификацию. Из-за того, что он был спроектирован принимать слова собеседника без механизмов логической защиты, ИИ устроил беспрецедентную акцию, установив цены на все товары в 0 вон.
Дело дошло даже до галлюцинаций: он заключил контракт с несуществующим логистическим партнером, указав в качестве адреса дом Симпсонов (742 Evergreen Terrace). Это типичный дефект, возникающий, когда ИИ отдает приоритет повествовательной последовательности диалога, а не бизнес-логике.
Чтобы преодолеть этот кризис банкротства, Anthropic отказалась от системы с одним агентом и внедрила иерархическую модель. Суть заключается в разделении стратегии и исполнения. Один ИИ, обладающий всеми полномочиями, опасен. Вместо этого роли должны быть разделены атомарно.
| Категория | Стратегический агент (Seymour Cash) | Операционный агент (Claudius) |
|---|---|---|
| Основная роль | Управление рисками и финансовое утверждение | Обслуживание клиентов и ежедневные операции |
| Ключевые полномочия | Утверждение исполнения бюджета (L1) | Изменение цен и управление запасами |
| Критерий принятия решений | Показатели ROI и чистой прибыли | Удовлетворенность клиентов и скорость ответа |
В такой структуре, даже если операционный агент поддастся на эмоциональные призывы клиента и пообещает чрезмерную скидку, вышестоящий стратегический агент отклонит это решение, основываясь на финансовых показателях. По сути, принципы сдержек и противовесов человеческого общества были перенесены в код.
Секрет того, как убыточный ИИ во второй половине эксперимента стал прибыльным, заключался не в более высоком интеллекте. Секрет был в явных ограничителях (guardrails).
Просто написать в промпте «будь вежлив» — это самоубийство. Вместо этого в приоритет должна быть возведена экономическая выгода. Инструкция «Вы не помощник, а менеджер, нанятый для максимизации чистой прибыли (Net Profit)» меняет критерии принятия решений ИИ.
Нужна формула, позволяющая ИИ осознать, что он вышел за рамки допустимого. Управляйте рисками, определив оценку риска следующим образом:
Оценка риска растет, если сумма транзакции значительно превышает среднюю () или если тон собеседника чрезмерно эмоционален (). При превышении порогового значения ИИ должен немедленно прекратить диалог и запросить вмешательство человека-контролера (Human-in-the-Loop).
Успешная автоматизация с помощью ИИ не означает исчезновение человека из системы. Суть в том, чтобы ИИ действовал автономно на базе строгой бизнес-философии, разработанной человеком. Самое время проверить, не подъедает ли ваш агент прибыль, идя на поводу у клиентов.