Los Agentes Gestionados de Anthropic son diferentes (te explicamos por qué)

BBetter Stack
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00El equipo de Claude ha lanzado los agentes gestionados de Claude, que es lo que llaman la siguiente evolución
00:00:09después del SDK de agentes.
00:00:11Esto es algo que te permite crear agentes personalizados sin escribir una sola línea de código.
00:00:16Y estos agentes se ejecutan en la propia infraestructura gestionada de Anthropic, que tiene una arquitectura genial
00:00:22que es perfecta para lanzar agentes seguros, escalables y listos para producción que pueden hacer prácticamente
00:00:27cualquier cosa que desees.
00:00:28También responden consultas de clientes basadas en tu base de conocimientos, o incluso realizan investigaciones regulares
00:00:32por ti y te las envían a una hora específica usando Slack.
00:00:36¿Pero por qué alguien usaría esto en lugar de instalar Claude Code en su propio VPS?
00:00:40Suscríbete y vamos a profundizar en ello.
00:00:46Pero antes de entrar en materia, hablemos un poco de Anthropic porque han estado muy ocupados
00:00:49estas últimas semanas.
00:00:50Recientemente han impedido que la gente use la suscripción de Claude en herramientas de terceros
00:00:55como OpenClaw, lo cual la gente piensa que es por los agentes gestionados, pero no son
00:01:00exactamente lo mismo.
00:01:01Yo diría que OpenClaw es un poco como Linux.
00:01:04Es un agente para entusiastas.
00:01:06Tú eliges tu propio hardware, tu modelo, te encargas de la seguridad y de todo
00:01:11lo demás.
00:01:12Mientras que los agentes gestionados de Claude son, me atrevería a decir, como Apple, porque no necesitas
00:01:17hacer nada de eso.
00:01:19Claude se encarga de la infraestructura y la seguridad; solo le dices lo que quieres en
00:01:24inglés sencillo y él se encargará de construir tu agente perfecto.
00:01:28De hecho, déjame mostrarte lo fácil que es mediante un ejemplo sencillo pero muy personal.
00:01:34Tengo un repositorio privado de GitHub que contiene toda mi información médica extraída de la
00:01:39aplicación del NHS.
00:01:40Y quiero comunicarme con esos datos o extraer información de ellos usando Slack.
00:01:45Así puedo usarlo desde mi escritorio, mi móvil, básicamente dondequiera que esté.
00:01:49Entre esas dos cosas, me gustaría que un agente gestionado de Claude se encargue de
00:01:54extraer los datos usando herramientas para obtener la información correcta y traducirla de forma que pueda entenderla.
00:02:01entenderla.
00:02:02Para empezar, podría ir a la consola de Claude, a la nueva opción de agentes gestionados
00:02:07y escribir aquí en lenguaje natural para crear mi agente desde cero.
00:02:11Esto se comunicará con la API de Claude usando comandos curl y alojará cualquier código necesario
00:02:16en la infraestructura de Anthropic.
00:02:19Pero también podría usar la habilidad de agentes gestionados en el lenguaje que prefiera.
00:02:23En este caso, elegiré TypeScript y esta habilidad usará el SDK de Claude para TypeScript
00:02:29para crear un agente por mí.
00:02:31Para hacerlo, necesitarás tener esta versión del código de Claude o una superior, que incluye la
00:02:36habilidad integrada de agentes gestionados.
00:02:38En mi caso, tengo una versión superior y puedo activar la habilidad usando el comando
00:02:42/claude-api seguido de "managed-agents onboarding".
00:02:46Tras pulsar intro, me pregunta si sé qué tipo de agente quiero construir, lo cual
00:02:50no sé, pero veremos qué hace.
00:02:52Y me dice que me guiará a través de estos tres pasos.
00:02:55Herramientas, habilidades, archivos y repositorios, y luego entorno e identidad.
00:02:59Sorprendentemente, usa mucho contexto, por lo que podría haber algo de compactación, pero veremos
00:03:04qué sucede.
00:03:05En fin, le daré la orden de crear un agente médico que lea archivos markdown de
00:03:10un repositorio privado de GitHub, entienda la información como un médico y me permita comunicarme
00:03:15con él usando Slack.
00:03:17Luego me recomienda usar el conjunto de herramientas predefinidas (read, glob, grep) y no usar
00:03:22write, edit o bash, ya que el médico no tiene razón para modificar el repositorio, lo cual tiene sentido.
00:03:27También me pide la URL del repositorio, así que le diré que use las herramientas y
00:03:31permisos recomendados y le daré el enlace al repositorio.
00:03:35Después de eso, sugiere lo que deberían ser las rondas B y C, que al ser un agente
00:03:39muy básico, se explican por sí solas.
00:03:41Y luego crea un prompt de sistema para mi agente, además de sugerir el modelo que
00:03:45debería usar.
00:03:46Le diré que use Sonnet porque no quiero gastar demasiado dinero en Opus.
00:03:49Explicaré por qué más tarde, pero aparte de eso, esto se ve bien y le proporcionaré estas
00:03:53credenciales así como el idioma que quiero.
00:03:56Y ahora ha creado los dos archivos para mí en TypeScript.
00:03:59El primero es la configuración, que establecerá cosas como el entorno, el agente
00:04:04y cualquier habilidad necesaria dentro de la infraestructura de Anthropic.
00:04:07El segundo es el tiempo de ejecución, que es lo que realmente se comunicará con
00:04:12los servidores de Anthropic y entregará esa información a Slack.
00:04:15Así que procederé a configurar todo esto y les mostraré cómo queda cuando esté terminado.
00:04:19Tras ejecutar este archivo de configuración, me da un ID de entorno, que está aquí.
00:04:24Y también me da el ID del agente, que también está por aquí.
00:04:27Como mencioné antes, estas cosas se crean en la infraestructura de Anthropic.
00:04:32Así que dentro de la consola de Claude, puedo ver mi agente aquí, así como el entorno que
00:04:36acabo de crear.
00:04:37También he creado mi aplicación de Slack y he puesto toda la información dentro de mi archivo .env para
00:04:42que este archivo apps.ts la use, lo que significa que si ejecuto ese archivo, debería funcionar mi bot de Slack.
00:04:48Así que podría preguntarle: "¿qué modelo estás usando?".
00:04:50Y después de un momento responde diciendo: "Soy Claude, creado por Anthropic.
00:04:54¿Hay algo médico en lo que pueda ayudarte?".
00:04:56Esto es genial.
00:04:57Pero lo que es aún más genial es que puedo ver la sesión aquí en la consola de Claude.
00:05:01Sí, he estado probando esto un par de veces y aquí obtenemos más detalles de lo ocurrido.
00:05:04Si cierro esto para hacerlo más grande, pueden ver la pregunta que hizo el usuario.
00:05:09Luego usó la herramienta de mensajes de Slack y el agente respondió.
00:05:12Olvidé mencionar antes cómo funciona el precio de esto.
00:05:15Si vamos a la documentación, vemos que todos los tokens usados por los agentes gestionados
00:05:20se cobran con el modelo de precios que usa la API de Claude, que está aquí.
00:05:25Lamentablemente, tu suscripción Pro, Max o Team no sirve para los agentes gestionados, pero además
00:05:30de pagar por los tokens, también tendrás que pagar por las sesiones, que son 8 centavos por hora
00:05:35de sesión.
00:05:36Y esto es solo cuando la sesión está activa.
00:05:38Si vuelvo a la consola de Claude y hago clic en sesiones, por todas estas sesiones inactivas
00:05:42no se me está cobrando.
00:05:43Bien, hagamos algo un poco más interesante con este bot.
00:05:46Le voy a preguntar: "basado en lo que sabes de mí médicamente, ¿puedo comer
00:05:50calamares?".
00:05:51Aquí ha procedido a ejecutar la herramienta bash para obtener información del repositorio.
00:05:56Ha realizado dos lecturas de archivos y, unos segundos después, me envió un mensaje de Slack que me
00:06:01dice que debería tener cuidado con los calamares porque soy alérgico a las gambas, lo cual es cierto.
00:06:06Diría que me ha dado demasiada información hablando desde el picor de lengua hasta la hinchazón de garganta
00:06:11y demás.
00:06:12Pero para ser sincero, funciona realmente bien.
00:06:13De hecho, ajusté un poco el agente.
00:06:15Si hacemos clic aquí en la consola de Claude, podemos ver que hay tres versiones, lo que indica
00:06:19que este agente ha sido modificado tres veces.
00:06:21Cambié el prompt del sistema para que sonara un poco más humano y cambié el modelo
00:06:26de Opus a Sonnet.
00:06:27Pero aquí en la interfaz, puedo cambiar el prompt de sistema, el modelo y
00:06:32las herramientas a las que tiene acceso, lo cual es útil para hacer pruebas.
00:06:35Así que eso es básicamente todo.
00:06:36Aparte de unos pequeños ajustes de código que descubrí consultando con Claude, así
00:06:41de fácil es construir un agente.
00:06:44No hace falta aprender cómo funciona el SDK de agentes de Claude.
00:06:47Solo tienes que comunicarte con Claude usando una habilidad y crear tu propio agente.
00:06:51¿Pero cómo funciona todo esto internamente?
00:06:54Anthropic ha escrito un artículo muy detallado sobre cómo funciona todo, el cual
00:06:58enlazaré en la descripción.
00:07:00Pero yo diría que toda la arquitectura se compone de tres componentes clave.
00:07:05La sesión, el arnés (harness) y la orquestación; no es que el sandbox y las herramientas sean menos
00:07:09importantes, pero diría que estos tres son muy singulares.
00:07:12El arnés, también conocido como las "manos" del sistema, es donde se usa el modelo Claude.
00:07:17Y también se conoce como un enrutador sin estado porque dirige las llamadas a herramientas, recursos y MCPs a
00:07:23su lugar correspondiente o ejecuta código y edita archivos en un entorno sandbox.
00:07:28Hablaré de los beneficios de tener las llamadas a herramientas separadas del propio arnés
00:07:32en sí.
00:07:33Pero la sesión aquí es como la memoria del sistema y contiene registros de solo adición (append-only) del
00:07:37arnés.
00:07:38Quizás piensen que el arnés es Claude Code, pero en realidad es un arnés hecho a medida
00:07:43para los agentes gestionados.
00:07:44También explicaré por qué un poco más adelante.
00:07:47Y finalmente, el orquestador es el que decide en qué modos debe estar el arnés.
00:07:51Como el plan de construcción y demás.
00:07:54Y lo más importante, crea un nuevo arnés si este falla.
00:07:58Imaginen que tienen un arnés aquí que falla o se cae.
00:08:02El orquestador puede crear un nuevo arnés.
00:08:04Y como los registros de la sesión están separados del propio arnés, el nuevo arnés puede leer
00:08:09los registros para saber qué ha estado pasando y exactamente desde dónde continuar.
00:08:13De hecho, todo está construido para escalar.
00:08:15Así que puedes tener tantos modelos y tantos entornos como quieras, y la arquitectura
00:08:20podrá manejarlo.
00:08:21Otro beneficio de esta arquitectura es el aspecto de la seguridad.
00:08:25Si vuelvo a la consola de Claude y hago clic en la bóveda de credenciales, pueden ver que
00:08:30las credenciales se almacenan en una ubicación segura.
00:08:32Si tengo un agente ejecutándose localmente, eso podría ser el archivo .env o algo personalizado que
00:08:36yo haya implementado.
00:08:37Pero si estoy usando la consola de Claude o la interfaz, entonces todas las credenciales se guardan
00:08:41aquí.
00:08:42Y lo bueno de eso es que estas credenciales se llaman en tiempo de ejecución.
00:08:45Así que si tienes una clave de API específica para un MCP o para una herramienta, el arnés o el modelo
00:08:50no saben nada al respecto y no pueden tener acceso a ella.
00:08:54Por ejemplo, si necesitara llamar a la herramienta MCP del clima y tuviera esa clave de API, el arnés
00:09:00llamará a la herramienta y la clave de API existirá dentro de la propia llamada a la herramienta o del MCP.
00:09:05Y se usará en tiempo de ejecución.
00:09:07Del mismo modo, si el sandbox necesitara usar una clave, esa se guardaría en la bóveda.
00:09:12Y eso también se usará en tiempo de ejecución y el modelo no lo sabría.
00:09:15De hecho, ni siquiera conoce su propia clave de API de Anthropic, ya que esa también se usa
00:09:20en tiempo de ejecución.
00:09:21Recomiendo encarecidamente leer el resto de este artículo para tener una visión detallada de cómo se
00:09:25armó todo el asunto, pero es muy único.
00:09:28Sinceramente, disfruto mucho creando agentes gestionados de Claude.
00:09:31Hay gente por ahí que piensa que esto va a morir, igual que los
00:09:36agentes de OpenAI.
00:09:37Si los agentes de OpenAI no están muertos, por favor díganmelo en los comentarios porque no oigo
00:09:39mucho sobre ellos.
00:09:40Pero creo que esto se va a quedar por mucho tiempo simplemente porque es muy fácil
00:09:45crear un agente.
00:09:46No tienes que aprender sobre SDKs, no tienes que usar la terminal para crear uno si
00:09:51no quieres, y puedes hacer prácticamente toda la conexión con servidores MCP y herramientas
00:09:56dentro de la interfaz, lo cual es muy agradable para quienes no quieren escribir código.
00:10:01Pero debo decir que algo un poco decepcionante es el hecho de que tienes que pagar usando
00:10:06tokens de API o pagar mediante facturación de API, porque como suscriptor de Claude Pro,
00:10:12me encantaría usar mis límites, es decir, los límites que están dentro del rango Pro, en los agentes gestionados,
00:10:17para no tener que pagar por dos cosas diferentes.
00:10:20Pero para ser justos, no es excesivamente caro si usas un modelo más barato como Sonnet o Haiku.
00:10:26Y aunque está algo curado, como pueden ver, les da acceso a Notion,
00:10:31Slack, servidores MCP y demás, pero si quieres crear algo que no exista dentro de
00:10:36esos límites, entonces tendrías que escribir tu propio código, algo para lo que
00:10:40OpenClaw es muy bueno.
00:10:41OpenClaw es súper abierto, está en su nombre, y tiene muchos canales, desde Telegram hasta
00:10:46Discord o WhatsApp, mientras que si quieres hacer lo mismo con agentes gestionados,
00:10:51es posible que tengas que programar tu propia solución o pedirle a Claude que la programe por ti.

Key Takeaway

Los agentes gestionados de Anthropic automatizan tareas complejas mediante una infraestructura escalable que separa la memoria de la sesión del motor de ejecución, permitiendo crear herramientas seguras sin código por 8 centavos la hora de actividad.

Highlights

Los agentes gestionados de Anthropic permiten crear automatizaciones personalizadas sin escribir código a través de lenguaje natural en la consola de Claude.

La arquitectura separa el almacenamiento de la sesión del motor de ejecución para que el sistema recupere el contexto exacto si ocurre un fallo.

El uso de estos agentes tiene un costo de 8 centavos por hora de sesión activa más el consumo de tokens según los precios estándar de la API de Claude.

Las credenciales de servicios externos como Slack o GitHub se almacenan en una bóveda segura y se inyectan en tiempo de ejecución sin que el modelo tenga acceso directo a ellas.

Es posible integrar repositorios privados de GitHub mediante herramientas predefinidas como read, glob y grep para analizar datos sensibles como historiales médicos.

Timeline

Naturaleza de los agentes gestionados de Anthropic

  • Los agentes gestionados representan la evolución del SDK de agentes hacia un entorno sin código.
  • La ejecución ocurre directamente en la infraestructura de Anthropic para garantizar escalabilidad y seguridad.
  • El sistema funciona de forma análoga a un ecosistema cerrado donde el usuario define objetivos en inglés sencillo.

Esta herramienta elimina la necesidad de configurar servidores propios o escribir scripts complejos para tareas de investigación o atención al cliente. Mientras herramientas como OpenClaw requieren gestión manual de hardware y modelos, esta opción gestionada asume la responsabilidad de la infraestructura. El objetivo principal es facilitar el despliegue de agentes listos para producción que se integren con Slack o bases de conocimientos.

Proceso de creación y despliegue técnico

  • La creación se realiza mediante comandos de lenguaje natural en la consola o a través de habilidades en el SDK de TypeScript.
  • El asistente guía la configuración en tres etapas: herramientas, repositorios y entorno de identidad.
  • La definición del agente genera dos archivos principales que controlan la configuración del entorno y el tiempo de ejecución.

Un ejemplo práctico es la creación de un agente médico que lee archivos Markdown desde un repositorio privado de GitHub. Al configurar el agente, se restringen los permisos a lectura para evitar modificaciones accidentales en los datos. El sistema sugiere automáticamente el modelo más apto, aunque el usuario puede optar por Claude 3.5 Sonnet para optimizar los costos frente a la potencia de Opus.

Validación funcional e interfaz de usuario

  • La consola de Claude permite monitorear cada sesión activa y ver las llamadas específicas a herramientas en tiempo real.
  • El agente puede razonar sobre datos complejos, como verificar alergias alimentarias cruzando información de un repositorio.
  • Los cambios en el prompt del sistema o el modelo se aplican instantáneamente creando nuevas versiones del agente en la interfaz.

Tras la ejecución del archivo de configuración, se obtienen IDs únicos para el entorno y el agente que se vinculan con aplicaciones externas como Slack. En las pruebas, el agente detectó correctamente una alergia a las gambas para desaconsejar el consumo de calamares tras leer el historial médico privado. La interfaz administrativa facilita el ajuste de parámetros sin necesidad de reiniciar el código base del bot.

Arquitectura interna y modelo de costos

  • La arquitectura se divide en tres componentes: sesión (memoria), arnés (ejecución) y orquestación (gestión).
  • El orquestador reinicia el arnés en caso de error utilizando los registros de solo adición de la sesión para no perder el progreso.
  • El sistema de facturación es independiente de las suscripciones Claude Pro o Team y requiere créditos de API.

El arnés actúa como un enrutador sin estado que dirige las llamadas a herramientas y recursos sin conocer las claves de API, las cuales se extraen de una bóveda segura solo cuando es estrictamente necesario. Esta separación garantiza que, si un componente falla, el nuevo motor de ejecución pueda leer la historia de la sesión y continuar desde el último punto. El costo se limita estrictamente al tiempo que la sesión permanece activa, evitando cobros por periodos de inactividad.

Comparativa y limitaciones del sistema

  • La facilidad de conexión con servidores MCP y herramientas integradas como Notion es la principal ventaja competitiva.
  • Los suscriptores de planes Pro no pueden aplicar sus límites de uso actuales a esta plataforma de agentes.
  • Las integraciones con canales no oficiales como WhatsApp o Telegram requieren programación personalizada adicional.

Aunque el sistema es robusto para usuarios que prefieren no programar, presenta rigideces en comparación con OpenClaw, que es totalmente abierto y soporta más canales de comunicación. Existe una desconexión entre el modelo de suscripción de consumo individual y la facturación de nivel desarrollador para estos agentes. Para funcionalidades fuera de las integraciones predefinidas, el usuario debe recurrir a escribir código propio o solicitar asistencia de Claude para generarlo.

Community Posts

View all posts