¡El agente de programación "PI" es mucho más que un simple y asombroso asistente de código!

MMaximilian Schwarzmüller
Computing/SoftwareSmall Business/StartupsStocksInternet Technology

Transcript

00:00:00Tengo que hablar de otro agente de programación. Y lo sé, lo sé, ya he creado videos
00:00:07y cursos sobre Claude Code y Codex porque ambos son increíbles y también tienen, por supuesto,
00:00:15Cursor y GitHub Copilot, y también tengo un curso sobre eso; encontrarán los enlaces abajo. Pero hoy
00:00:21quiero hablar del agente de programación Pi, también porque es mucho más que un simple agente de código. Ahora,
00:00:31reitero, todas estas herramientas te servirán. No hay una elección correcta o incorrecta. Y entiendo perfectamente que
00:00:38todo esto pueda parecerse a las guerras de frameworks, las guerras de frameworks de JavaScript de 2019 de nuevo, donde
00:00:46cada semana salía una herramienta nueva y brillante. Y sí, hasta cierto punto, es un poco así,
00:00:53supongo. Pero por otro lado, al igual que en aquel entonces, si somos honestos, no importa
00:01:00mucho cuál elijas. Este tampoco es un video patrocinado y no tengo un curso sobre esto.
00:01:06Simplemente creo sinceramente que este agente Pi es una herramienta que también querrías considerar. Ahora,
00:01:13a diferencia de Codex y Claude Code u Open Code, por ejemplo, esto no viene con una suscripción
00:01:20que debas adquirir. Con Open Code, por supuesto, también puedes usarlo sin suscripción usando otra
00:01:27suscripción como la de Codex o pagando por uso. Con el agente de programación Pi,
00:01:32solo tienes la opción de pagar por uso o de usar otra suscripción. Por ejemplo,
00:01:39aquí, si empiezo, lo instalé en mi sistema y lo uso con mi suscripción a Codex, la cual
00:01:45podría usar con la app de Codex o la CLI de Codex, pero que también puedo usar aquí. Creo que también puedes
00:01:50usarlo con la suscripción de Anthropic para Claude Code, pero quizás escucharon que a ellos
00:01:55no les gusta eso y que podrían banearte la cuenta, por lo que sé. Ahora, ¿qué tiene de especial
00:02:00esto de Pi? ¿Por qué lo usarías en lugar de la CLI regular de Codex? Por varias razones. Primero,
00:02:08Pi, este agente, es súper ligero y sencillo, en el buen sentido. Tiene un prompt de sistema muy minimalista
00:02:20y solo viene con unas pocas herramientas. Básicamente, por lo que sé, si eso no ha cambiado,
00:02:28solo viene con herramientas de lectura, escritura, edición y una de bash. Y la de bash, por supuesto, es la potente,
00:02:36porque si tienes una herramienta bash, básicamente tienes acceso a todo porque puedes,
00:02:44por supuesto, controlar todo tu sistema, toda tu máquina solo con bash, con la línea de comandos
00:02:50al final, porque puedes invocar muchas otras herramientas desde ahí. Y resulta que,
00:02:55como también cubrí en otro video, las CLI parecen ser, al menos ahora mismo, lo principal que quieres
00:03:03exponer a tus agentes, a tus agentes de código, porque son realmente buenos usando CLIs incluso
00:03:10las que no han visto antes. Y, por supuesto, a través de las CLIs, interfaces de línea de comandos
00:03:15o herramientas escritas por otras personas, tus agentes pueden hacer un montón de cosas en tu computadora. Pueden enviar
00:03:21peticiones HTTP. Pueden crear y ejecutar scripts. Pueden analizar datos JSON. Pueden hacer
00:03:29todo tipo de cosas. Y esa es la filosofía de este agente Pi. Muy minimalista, pero dándole acceso
00:03:35a la herramienta más potente, la herramienta bash, para que básicamente pueda hacerlo todo. Y combinado con
00:03:41un prompt de sistema integrado muy ligero y minimalista, obtienes un agente con una ventana de contexto que
00:03:50no está saturada y que es realmente flexible para hacer lo que quieras que haga, por así decirlo. Y
00:03:57su filosofía es realmente que, en lugar de meterle muchas cosas, obtienes un agente
00:04:04que es súper extensible. Puedes instalar algo llamado extensiones. Volveremos a eso.
00:04:10Puedes usar “agent skills” (habilidades de agente). Aquí hablo de este estándar oficial, que es como un estándar,
00:04:17supongo, aunque ciertas herramientas lo implementan distinto. Pero la idea central tras las habilidades de agente es
00:04:24que tienes directorios de habilidades y archivos markdown de habilidades, y tienes prompts ahí o contexto extra,
00:04:31como quieras llamarlo. Y estos se cargan bajo demanda, no de forma inmediata, sino de forma diferida
00:04:39según la tarea en la que trabaje tu agente. Por ejemplo, aquí en esta sesión de Pi que tengo abierta,
00:04:46tengo varias habilidades cargadas: algunas globales que configuré mientras experimentaba con ellas,
00:04:53y otras que resultan muy útiles, como una habilidad de investigación de código, por ejemplo. Y si
00:04:59echamos un vistazo, verán que es solo un archivo markdown con un nombre y una descripción. La descripción es,
00:05:03por supuesto, súper importante en estas habilidades porque es, al final, lo que hace que un agente realmente
00:05:08active y use una habilidad. Luego carga el resto del archivo solo si decide que la
00:05:16habilidad es relevante para la tarea dada basándose en el nombre y la descripción. Y luego, bueno, de nuevo,
00:05:21eso es solo un poco de contexto extra, un prompt adicional donde, en este caso para mi habilidad
00:05:26de investigación de código, le digo a cualquier agente interesado, como Pi, pero también a Codex si carga esta habilidad,
00:05:32cómo investigar código, cómo quiero que lo haga, que debería usar la herramienta MC Porter de
00:05:38Peter Steinberger para usar otros servidores MCP como el servidor MCP deep wiki, que es un servidor
00:05:46que sirve para explorar repositorios de GitHub y aprender más sobre ellos, y algunas otras herramientas
00:05:51que debería usar para investigar. Y eso es otra cosa importante aquí, hablando de los MCP, el agente
00:05:58Pi no tiene soporte para MCP. La razón es que los MCP tienden a llenar mucho tu ventana
00:06:05de contexto porque hay mucha información sobre las herramientas y recursos MCP disponibles
00:06:10que debe incluirse en su ventana de contexto para que la IA los conozca. Y el equipo o la persona
00:06:18detrás de Pi no quiere eso. Ese es el razonamiento. Es una opinión compartida por muchos otros,
00:06:23incluyéndome a mí. Y sé que hay soluciones como la búsqueda MCP para eso, pero aun así
00:06:28aquí no hay soporte MCP. Y no lo necesitas si usas algo como esta herramienta MC Porter. Y
00:06:35cuando digo usar, me refiero a que le digo a la IA cómo invocar esta herramienta MC Porter al vuelo cuando quiera
00:06:43trabajar con MCP, de modo que esto no sea algo que necesite instalarse o exponerse
00:06:49en la ventana de contexto. Así que captan la idea. Es muy minimalista y ligero. Y esa es toda la
00:06:54historia o lo principal de este agente Pi. Ya lo mencioné. Otra cosa genial sobre
00:07:01este agente es su extensibilidad. Y no son solo las habilidades. Es, ante todo, creo,
00:07:08las extensiones. Y la idea tras las extensiones es que este agente Pi tiene soporte nativo
00:07:16para extenderlo, para conectarse a diferentes partes del agente, conectándose a diferentes pasos del
00:07:22bucle de agentes. Así, mientras el agente trabaja, te permite hacer todo tipo de cosas y ampliar
00:07:30este agente de mil maneras. Podrías, por ejemplo, añadir soporte MCP si quisieras.
00:07:36Ahora, yo tengo configuradas varias extensiones por mi cuenta. Por ejemplo, añadí un modo de planificación mediante
00:07:41una extensión. Se puede hacer. No hay un modo de planificación integrado por defecto, pero es tan extensible
00:07:47que puedes añadir uno que bloquee al agente para que no use herramientas de escritura o edición. Si aún está en
00:07:53modo planificación, esta extensión te permite configurar un atajo para cambiar a ese modo
00:08:00de planificación. Te permite actualizar la interfaz, la UI de la terminal, para mostrar al usuario que estás en modo plan.
00:08:07También puedes añadir comandos extra como /plan, que me pone en modo planificación y me da este
00:08:14indicador aquí. Y ahora, por ejemplo, ciertas herramientas quedarían bloqueadas y puedo salir del modo de nuevo.
00:08:20Así que ese es el tipo de cosas que puedes hacer con extensiones. Y también hay
00:08:24una especie de mercado oficial de extensiones porque este agente Pi también tiene la idea de permitirte
00:08:31empaquetar tus extensiones o habilidades y compartirlas con otros. Y otras personas como tú y yo,
00:08:36podemos instalar esos paquetes para, por ejemplo, instalar extensiones creadas por otros.
00:08:40Y hay cosas como sub-agentes, que puedes añadir mediante un paquete que incluye una extensión
00:08:47para añadirlos, o el paquete de acceso web, que es genial, el cual le da al agente herramientas extra
00:08:54para investigar en la web y obtener contenido de sitios de forma eficiente. Así que captan la idea. Es muy
00:09:00extensible. Tienes un núcleo mínimo y luego puedes ampliarlo como quieras, añadir cualquier
00:09:06habilidad o extensión que desees. Y eso ya es muy interesante de por sí porque, claro,
00:09:12con Claude Code y con Codex y todas esas otras herramientas, obtienes herramientas preinstaladas que
00:09:20son mucho más potentes de serie, pero también menos extensibles. Con Pi, la idea es la opuesta.
00:09:28Obtienes un núcleo mínimo y puedes convertirlo en lo que quieras. Y puedes hacerlo
00:09:33globalmente, pero también por cada proyecto porque todas estas habilidades y extensiones pueden
00:09:39instalarse globalmente o por proyecto. Y eso lo hace muy versátil. Por eso vale la
00:09:46pena echarle un vistazo. Lo he estado usando estas últimas semanas. Además de Claude Code y Codex, voy cambiando
00:09:51todo el tiempo porque estas herramientas evolucionan muy rápido y Pi me gusta mucho. Ahora, aquí está
00:09:59lo interesante. No estás limitado a usar Pi solo para programar. Se llama agente
00:10:08de programación y eso es principalmente para lo que probablemente lo usarás y para lo que yo lo he estado
00:10:15usando. Pero no es algo a lo que estés limitado. Por ejemplo, instalé el paquete de acceso
00:10:21web aquí y lo conecté con mi clave de API de Gemini para darle a este agente Pi acceso total a la investigación
00:10:30web basada en la API de Gemini. Por lo tanto, podría ejecutar este agente fuera de cualquier proyecto,
00:10:35fuera de cualquier proyecto de código, y podría darle al agente una tarea como esta: Haz una investigación sobre los
00:10:41últimos siete días de las acciones de Apple y Nvidia, obtén sus precios y haz un análisis de su
00:10:46rendimiento en esos siete días. Y si hago eso, irá y lo hará. Y encontrará la forma de
00:10:55obtener los datos de precios de estas acciones. Hará una búsqueda web, quizás visite sus páginas de
00:11:04relaciones con inversores, ya veremos. Y luego, por supuesto, también hará los cálculos reales, creará un
00:11:12script temporal o hará algo así. Veremos qué hace. Por ejemplo, aquí activó una habilidad de investigación
00:11:18web que añadí donde le doy más detalles sobre cómo debería investigar en la web. Y luego intenta
00:11:23hacerlo. Ahora, hay un problema aquí porque no tengo Python instalado o al menos no el ejecutable
00:11:29de Python así, tendría que haber sido Python 3 y él también se dio cuenta. Y luego escribió
00:11:34el script donde obtuvo algunos datos de un sitio web con ayuda de Python, un script temporal,
00:11:40que ejecutó aquí, y parece que obtuvo algunos precios de acciones. Y luego muy probablemente
00:11:47también escribirá un pequeño script que le permita hacer cálculos basados en eso y calcular el
00:11:55movimiento en el precio de la acción. Y tras un rato trabajando e investigando un montón de
00:12:01cosas, incluyendo algunas noticias, ha terminado. Y me da los últimos siete días de Apple
00:12:08y Nvidia mostrándome cómo evolucionaron sus acciones en esos días. Me da algunos resúmenes de rendimiento
00:12:14aquí. Y me da un análisis verbal donde resume sus resultados para que los
00:12:23lea como un informe ejecutivo. Y todo eso lo hizo este agente de código Pi con las
00:12:29extensiones y habilidades que le di, nada más. Sin código por mi parte, sin instrucciones específicas
00:12:36sobre qué sitios visitar. Lo hizo todo por su cuenta. Y podrías hacer eso perfectamente con Claude Code
00:12:43o Codex, porque al final todos son agentes de IA que tienen varias herramientas para hacer las cosas.
00:12:50Y aunque están construidos principalmente para programar, puedes, por supuesto, “abusar” un poco de ellos para
00:12:56muchas otras cosas. Porque al final, claro, esta tarea también implicaba consultar algunos
00:13:01sitios web y escribir algunos scripts, lo cual es muy similar a los proyectos de código donde también querrías
00:13:06que consulte documentación y escriba código, ¿verdad? Así que puede hacer muchas otras cosas.
00:13:11La razón por la que Pi, en mi opinión, es un poco mejor para tareas como esta que quizás Codex o
00:13:17Claude es que tiene este núcleo mínimo y puede extenderse para ser exactamente la herramienta que quieres,
00:13:24incluso por cada proyecto si quieres. Podrías tener un proyecto en tu sistema que sea un
00:13:29experto en investigación, otro proyecto que sea, no sé, un experto en investigación bursátil, y un tercer proyecto
00:13:37que tenga un experto totalmente distinto, uno para analizar tu sistema y la utilización de tu disco duro
00:13:42o no sé, cualquier cosa por el estilo. Y esa es también la razón por la que probablemente OpenClaw
00:13:50está usando Pi internamente. Aquí estoy en Deep Wiki para el repositorio de OpenClaw. Por si no lo
00:13:55conocen, es un sitio genial para aprender más sobre repositorios de GitHub. Los analiza y luego
00:14:00te da una documentación creada al vuelo basada en el código que ve allí. Y también puedes
00:14:05chatear con el repositorio, por así decirlo. Y aquí podría preguntar: ¿está OpenClaw usando el agente Pi
00:14:12internamente? Si es así, ¿cómo? Y analizará ese código, el cual ya ha cargado. Y me dice:
00:14:18sí, OpenClaw está usando el agente Pi. Y luego me explica exactamente cómo está implementado. Así que
00:14:24sí, ese es el agente Pi. Y simplemente sentí que debía compartirlo. De nuevo, no porque esté ganando
00:14:31nada con ello. No tengo un curso, no tengo nada. Pero es una gran herramienta, especialmente
00:14:38si planeas o quieres experimentar con agentes para tareas que no sean de programación. Pero claro,
00:14:44solo para ser muy claro con esto también, para tareas de programación también sirve, puede hacer ambas. Es un
00:14:50agente de IA muy versátil. Incluso puedes construir tus propias herramientas sobre él, como ves con OpenClaw.
00:14:56Y puedes hacer todas estas cosas con Codex también. Pero insisto, el núcleo minimalista es increíble aquí.
00:15:02Así que además de Codex o Claude Code, o en lugar de ellos, este podría valer la pena. Y sí,
00:15:09es algo con lo que me he divertido mucho estas últimas semanas. Y me emociona ver
00:15:14hacia dónde va todo este tema de los agentes y qué podremos hacer con ellos dentro de un año. Da
00:15:18un poco de miedo, debo decir, pero también es muy, muy interesante. Una mezcla extraña.

Key Takeaway

El agente Pi es una herramienta de programación minimalista y altamente extensible que utiliza una interfaz de línea de comandos para ejecutar tareas complejas de desarrollo y análisis de datos fuera del código.

Highlights

El agente Pi destaca por su núcleo minimalista y un prompt de sistema extremadamente ligero.

A diferencia de otras herramientas, Pi es altamente extensible mediante "habilidades" y extensiones personalizables.

Utiliza la herramienta Bash como su motor principal, permitiendo ejecutar scripts y controlar el sistema de forma total.

El diseño evita el soporte nativo de MCP para no saturar la ventana de contexto, optando por soluciones bajo demanda.

Pi no se limita a la programación; puede realizar investigaciones web complejas y análisis de datos financieros.

Su versatilidad permite configuraciones específicas por proyecto, convirtiéndolo en un experto en diferentes nichos.

Timeline

Introducción al agente Pi y comparación de herramientas

El ponente introduce al agente de programación Pi como una alternativa a herramientas populares como Claude Code, Codex, Cursor y GitHub Copilot. Explica que la proliferación actual de agentes de IA se asemeja a las guerras de frameworks de JavaScript ocurridas en 2019. Se enfatiza que este video no es un contenido patrocinado y que la elección de la herramienta depende de la preferencia personal. El autor argumenta que, aunque existen muchas opciones brillantes, Pi ofrece características únicas que vale la pena considerar. Esta sección establece el contexto de un ecosistema en rápida evolución donde la flexibilidad es clave.

Modelos de suscripción y ligereza del sistema

Se analiza el modelo de pago por uso de Pi, diferenciándolo de las suscripciones fijas de otras plataformas. El usuario puede integrar su propia suscripción de Codex o Anthropic para alimentar al agente en su sistema local. Una de las mayores ventajas mencionadas es que Pi es extremadamente ligero y sencillo, contando con un prompt de sistema minimalista. Solo incluye herramientas básicas de lectura, escritura y edición, además de una potente integración con Bash. Esta simplicidad inicial previene que la ventana de contexto del modelo se sature con instrucciones innecesarias.

La potencia de la CLI y la filosofía de diseño

El video profundiza en por qué las interfaces de línea de comandos (CLI) son el medio ideal para que los agentes de IA interactúen con la computadora. Al tener acceso a Bash, el agente Pi puede realizar peticiones HTTP, analizar archivos JSON y ejecutar scripts creados por terceros. La filosofía central de Pi es proporcionar un núcleo mínimo pero capaz de invocar herramientas externas de gran potencia. Esto permite que el agente realice tareas complejas sin necesidad de tener todas las capacidades integradas desde el inicio. El ponente destaca que esta arquitectura ofrece una flexibilidad superior para adaptarse a las necesidades del usuario.

Habilidades del agente y el estándar de archivos Markdown

Se explica el concepto de "agent skills" o habilidades, las cuales son archivos Markdown que contienen prompts y contexto adicional. Estas habilidades se cargan de forma diferida o bajo demanda, basándose en la descripción y el nombre del archivo cuando la tarea lo requiere. El autor muestra un ejemplo de una habilidad de investigación de código que utiliza la herramienta MC Porter para interactuar con repositorios de GitHub. Se menciona explícitamente que Pi no soporta MCP (Model Context Protocol) de forma nativa para mantener la ventana de contexto limpia. Este enfoque modular permite que el agente aprenda a usar nuevas herramientas solo cuando es estrictamente necesario.

Extensibilidad mediante extensiones y modo de planificación

El ponente demuestra cómo las extensiones permiten intervenir en diferentes pasos del bucle de ejecución del agente. Como ejemplo práctico, se muestra un modo de planificación personalizado que bloquea las herramientas de escritura mientras se define la estrategia de trabajo. Existe un mercado o repositorio oficial donde los usuarios pueden compartir y descargar paquetes de extensiones creados por la comunidad. Se mencionan herramientas específicas como sub-agentes y paquetes de acceso web que amplían drásticamente las capacidades del núcleo. Esta capacidad de personalización permite transformar a Pi en una herramienta adaptada a flujos de trabajo específicos de cada desarrollador.

Casos de uso fuera de la programación: Análisis de acciones

En esta sección, se demuestra que Pi puede ser utilizado para tareas que no están relacionadas con el desarrollo de software. El autor solicita un análisis del rendimiento bursátil de Apple y Nvidia durante los últimos siete días utilizando acceso web y la API de Gemini. El agente escribe y ejecuta scripts temporales en Python para recopilar datos, realizar cálculos y generar un informe ejecutivo verbal. Se resalta que el agente solucionó errores de ejecución, como la versión correcta de Python, de forma autónoma. Esto demuestra la versatilidad de los agentes de código cuando se aplican a la investigación general y al procesamiento de datos.

Implementación interna en OpenClaw y conclusiones

El video concluye revelando que proyectos de código abierto como OpenClaw utilizan internamente el agente Pi debido a su arquitectura robusta. El ponente utiliza el sitio Deep Wiki para explorar el repositorio de OpenClaw y confirmar técnicamente cómo se integra Pi en su estructura. Se reitera que Pi es una excelente herramienta para construir aplicaciones propias sobre ella gracias a su minimalismo. El autor reflexiona sobre el futuro de los agentes, admitiendo que la rapidez de su evolución es tanto emocionante como inquietante. Finalmente, invita a los usuarios a experimentar con esta herramienta para descubrir su potencial en diversos entornos de trabajo.

Community Posts

View all posts