Por Fin Hay Una Razón Para Cambiarse A Cursor

AAI LABS
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00Con el avance de la IA y el creciente poder de cada nuevo modelo que se lanza,
00:00:03la forma en que producimos código ha sido completamente transformada.
00:00:07Ahora existen muchas herramientas especializadas para programar,
00:00:10como ClodCode,
00:00:11Cursor,
00:00:11Antigravity y otras,
00:00:12cada una con sus propias capacidades únicas.
00:00:14Pero los buenos modelos por sí solos no determinan la calidad del código que produces.
00:00:18Cómo usas la herramienta y gestionas el contexto importa igual de mucho.
00:00:22Todas estas herramientas tienen algún mecanismo inherente para la ingeniería de contexto,
00:00:25pero Cursor acaba de hacer un gran avance con un nuevo enfoque,
00:00:27construyéndolo de forma nativa en la propia aplicación.
00:00:29Mientras revisaba su artículo,
00:00:31me di cuenta de que estos principios son genuinamente sólidos.
00:00:33Tenemos mucho de qué hablar hoy porque estas ideas se pueden aplicar ampliamente a cualquier plataforma que uses para construir aplicaciones.
00:00:40La gestión de contexto siempre ha sido crítica al trabajar con agentes de IA porque una buena gestión de contexto determina la calidad del resultado.
00:00:47Previamente hemos hablado en nuestros videos sobre cuán importante es la gestión de contexto y hemos discutido flujos de trabajo para ello.
00:00:53Cursor implementó funcionalidades de gestión de contexto directamente en su producto y publicó un artículo al respecto.
00:00:58Estos principios se basan en su observación de que,
00:01:00para obtener buenos resultados de los modelos,
00:01:02es mejor proporcionar la menor cantidad de detalles posible en la ventana de contexto.
00:01:06Cuanta menos información recibe el modelo de una vez,
00:01:08menos datos tiene que procesar simultáneamente,
00:01:10lo que significa menos confusión y más enfoque en la tarea que necesita hacer en ese momento,
00:01:14porque solo se incluye información relevante.
00:01:17Este enfoque es lo que ellos llaman descubrimiento dinámico de contexto.
00:01:20La idea es la toma de notas estructurada.
00:01:22Es decir,
00:01:22la información que no se necesita en este momento no debería estar en la ventana de contexto,
00:01:26excluyendo detalles potencialmente confusos o contradictorios,
00:01:29mejora significativamente la calidad de las respuestas del agente.
00:01:32La versión actual de Cursor añade cinco métodos dinámicos de gestión de contexto que se implementarán pronto para los usuarios.
00:01:37Aunque Cursor está implementando esto como una actualización de producto,
00:01:41estos principios son ampliamente transferibles a todos los agentes de IA.
00:01:44La primera actualización que mencionó Cursor es que las respuestas largas de herramientas deben guardarse en archivos.
00:01:48Los MCP a menudo devuelven respuestas grandes que permanecen en la ventana de contexto.
00:01:52No toda la información de las respuestas siempre es necesaria.
00:01:55Cursor mencionó que el enfoque común de la mayoría de las herramientas de codificación es truncar las respuestas largas de MCP,
00:02:01lo que lleva a pérdida de datos o información importante que podría ser necesaria para el contexto siendo eliminada.
00:02:07La extensión de Chrome de Claude es una extensión muy cargada de herramientas,
00:02:10y solo unos pocos prompts pueden llenar el contexto debido a que carga una enorme cantidad de datos en la ventana de contexto.
00:02:15Así que añadí una instrucción en el archivo Claude.md de que cualquier respuesta de herramienta MCP mayor a 50 líneas debe guardarse en una carpeta MCP dentro de la carpeta .context ejecutando un comando echo en la terminal.
00:02:27Cuando ejecuté la extensión de Chrome para analizar la UI de una página de destino,
00:02:30cada vez que Claude se encontraba con una herramienta como ReadPage que hincha significativamente la ventana de contexto,
00:02:36guardaba la respuesta del MCP en un archivo para lectura posterior,
00:02:39usando el cual analizó toda la página y me dio un reporte.
00:02:42Esta solución alternativa mejoró la precisión del análisis de respuestas de la herramienta al permitir que Claude analizara las respuestas de los archivos tantas veces como fuera necesario y eliminó la necesidad de llamadas repetitivas a herramientas.
00:02:52Cuando se necesitan datos de llamadas MCP anteriores,
00:02:54Claude puede leerlos directamente desde la carpeta .context en lugar de hacer llamadas a herramientas,
00:02:58ahorrando un tiempo significativo.
00:03:00Antes de pasar al siguiente cambio,
00:03:02escuchemos a nuestro patrocinador,
00:03:03Zen Rose.
00:03:04Si estás construyendo productos de IA,
00:03:06automatizaciones o sistemas impulsados por datos,
00:03:08ya sabes una cosa: todo comienza con datos web confiables.
00:03:11Pero obtener datos limpios y estructurados a escala es más difícil de lo que parece.
00:03:15Ahí es donde Zen Rose encaja perfectamente en el stack..
00:03:18Zen Rose maneja la extracción de datos de sitios web complejos mientras gestiona automáticamente la evasión de anti-bots para que puedas enfocarte en lo que realmente importa: usar los datos.
00:03:27En lugar de lidiar con resultados desordenados,
00:03:29Zen Rose entrega resultados estructurados como JSON o Markdown listos para integrar directamente en tus pipelines.
00:03:34Está listo para integración y enfocado en negocios,
00:03:36lo que lo hace ideal para startups de IA,
00:03:38equipos de datos y creadores de automatizaciones que no quieren estar supervisando infraestructura..
00:03:43Ya sea que estés enriqueciendo leads,
00:03:45potenciando agentes de IA o automatizando investigación,
00:03:47Zen Rose simplemente funciona.
00:03:48Si tu trabajo depende de datos web,
00:03:50Zen Rose debe estar en tu stack..
00:03:52Haz clic en el enlace del comentario fijado y comienza a construir hoy.
00:03:55Sabemos que el paso de resumen cuando se llena la ventana de contexto es desordenado y lleva a perder mucha información.
00:04:00La mayoría de las herramientas,
00:04:02incluyendo Cursor y Claude Code,
00:04:03activan un paso de resumen e inician la sesión con una ventana de contexto fresca usando el resumen como punto de partida..
00:04:09Cuando presionas compactar una y otra vez,
00:04:11el resumen empieza a olvidar detalles que podrían ser importantes para ti pero que el resumen del modelo puede omitir.
00:04:16Hay un límite de cuánto control tienes sobre la compactación automática,
00:04:20y la compresión repetida conduce a la pérdida de información crucial si tienes que hacerlo repetidamente.
00:04:24La solución de Cursor es guardar todo el historial de chat anterior como un archivo para que el agente lo consulte más tarde.
00:04:30Cuando proporcionamos un prompt muy específico y el modelo no puede encontrar la información en el resumen,
00:04:35la transcripción anterior sirve como su base de conocimiento.
00:04:37El modelo usa esa transcripción para generar la solución,
00:04:40permitiéndole recuperar cualquier cosa que se haya perdido del resumen.
00:04:43Hasta que la implementación de Cursor se lance y esté disponible para todos,
00:04:47intenté implementar esta función con Claude Code.
00:04:50Agregué la instrucción dentro del archivo Claude.md para actualizar el historial de chat después de cada turno,
00:04:55documentando todas las decisiones clave y pasos dados.
00:04:58Usaba una carpeta de historial dentro de la carpeta .context con el nombre de cada archivo reflejando la sesión.
00:05:03Así que cada vez que le pido que realice alguna tarea,
00:05:05al final de su sesión de ejecución de tarea,
00:05:07documenta el historial de chat en el archivo de historial correspondiente,
00:05:11agregando todo a ese archivo.
00:05:12De esta manera,
00:05:13la carpeta .context contiene registros detallados de todas las sesiones y todo lo que se hizo.
00:05:18A los agentes se les dieron habilidades para ayudar a gestionar el problema de contexto que estaban causando los MCPs.
00:05:23El propósito completo de las habilidades es hacer que los agentes proporcionen mejor capacidad para usar sus propias capacidades guiándolos a través de scripts y archivos de instrucciones,
00:05:30reduciendo la sobrecarga de contexto mediante revelación progresiva.
00:05:33Anthropic fue el primero en proponer la idea,
00:05:35que básicamente consiste en dar a los agentes un conjunto de instrucciones,
00:05:38scripts y recursos que el agente puede descubrir y usar para desempeñarse mejor en tareas específicas.
00:05:43Anthropic básicamente liberó como código abierto estas habilidades de agentes,
00:05:46estableciendo un estándar que otros podrían implementar.
00:05:49Tras esto,
00:05:49Codex,
00:05:50Gemini y otros comenzaron a implementar habilidades de agentes,
00:05:52después de lo cual finalmente llegó el turno de Cursor de hacer lo mismo.
00:05:55Las habilidades de Cursor son básicamente los mismos ejecutables y scripts empaquetados juntos en una sola habilidad que el agente puede usar para sus respectivas tareas.
00:06:03Solo el nombre y la descripción de las habilidades están en el contexto estático..
00:06:07Una vez que están dentro del contexto estático,
00:06:09los agentes pueden utilizar sus habilidades por sí mismos,
00:06:11usando grep y la búsqueda semántica de Cursor.
00:06:13Esto es lo que lo hace diferente,
00:06:15porque la búsqueda semántica de Cursor utiliza su propio modelo de incrustación y pipelines de indexación en segundo plano,
00:06:20en lugar de la simple coincidencia de patrones,
00:06:22como las búsquedas basadas en expresiones regulares en los comandos grep.
00:06:26Las habilidades de Claude solo exponen el nombre y la descripción en el contexto,
00:06:29sin importar cuántos archivos utilice el script,
00:06:31evitando la saturación del contexto.
00:06:33En mi proyecto,
00:06:34había configurado 5 habilidades,
00:06:35cada una consumiendo muy pocos tokens,
00:06:37solo alrededor del 0,
00:06:382% del total,
00:06:38dejando más espacio para trabajar.
00:06:40Lo diferente es que las habilidades de Claude también se pueden acceder mediante /comandos,
00:06:44lo que te permite activarlas manualmente cuando sea necesario,
00:06:46abordando las quejas de las personas sobre que las habilidades no se cargaban bajo demanda correctamente.
00:06:51Los MCP contienen muchas herramientas,
00:06:53todas expuestas en la ventana de contexto,
00:06:55saturando innecesariamente la ventana de contexto.
00:06:57Cursor tomó la iniciativa y enfatizó que es responsabilidad de los agentes de codificación,
00:07:01no de los servidores MCP,
00:07:02solucionar la saturación del contexto.
00:07:04La solución para esto fue el descubrimiento dinámico de contexto mediante la sincronización de las descripciones de herramientas en una carpeta.
00:07:10La idea de Cursor es tener todos los MCP con sus nombres en carpetas separadas,
00:07:14nombradas según cada MCP conectado,
00:07:15y dentro de cada carpeta,
00:07:16todas las herramientas deben estar listadas.
00:07:18Con esto,
00:07:19el agente solo recibe los nombres de las herramientas,
00:07:21y cuando necesita alguna herramienta,
00:07:23la busca a través de las carpetas.
00:07:24En las pruebas que realizaron,
00:07:26descubrieron que el descubrimiento dinámico de herramientas MCP redujo el uso en un 46,
00:07:299%,
00:07:30lo que representa una enorme diferencia si estás trabajando en un sistema de ejecución prolongada.
00:07:34Esta implementación también ayuda en casos donde los servidores MCP se desconectan accidentalmente o requieren reautenticación.
00:07:40Normalmente,
00:07:40el sistema simplemente olvidaría esas herramientas,
00:07:43pero ahora el agente puede notificar al usuario que se requiere reautenticación.
00:07:46Claude también tiene una herramienta de búsqueda avanzada que está específicamente diseñada para abordar este problema,
00:07:51utilizando un conjunto determinado de indicadores para informar a Claude si debe cargarla o no.
00:07:56Implementa la idea exacta de Cursor sobre el descubrimiento dinámico de contexto,
00:07:59pero esto está limitado a la plataforma de desarrolladores,
00:08:02y solo para aquellos que construyen con APIs.
00:08:04No podemos modificar cómo se usan los MCP en Claude Code,
00:08:06porque están integrados por Anthropic.
00:08:08Justo cuando estaba buscando formas de implementar esto en Claude Code,
00:08:11encontré un indicador oculto.
00:08:12Sin establecer este indicador,
00:08:14todas las herramientas MCP que había conectado estaban expuestas en el contexto de Claude Code.
00:08:18Cuando establecí el indicador experimental enable experimental MCP CLI,
00:08:21todas las herramientas fueron eliminadas de la ventana de contexto,
00:08:24liberando espacio que antes estaba ocupado por las herramientas MCP.
00:08:27Pero eso no significa que los MCP se desconecten cuando este CLI está habilitado.
00:08:31La única diferencia es que no están expuestos de inmediato en la ventana de contexto.
00:08:34En lugar de poner todos los esquemas en el contexto,
00:08:37Claude ahora usa una capa bash intermedia llamada MCP CLI,
00:08:39que maneja todas las tareas relacionadas con MCP.
00:08:42Claude utiliza esta capa intermedia para buscar,
00:08:44obtener información e invocar las herramientas.
00:08:46Siempre que le pides a Claude que realice cualquier tarea que requiera una llamada de herramienta MCP,
00:08:50en lugar de usar el método habitual,
00:08:52utiliza los MCP a través de MCP CLI y realiza la tarea que se le requiere.
00:08:55Al usar esta herramienta,
00:08:56Claude ejecuta todas las tareas como de costumbre,
00:08:58solo que a través de esta capa intermedia.
00:09:00Reportar errores de terminal es difícil en Cursor debido a su acceso limitado.
00:09:04Si la terminal mostraba algún error,
00:09:05necesitabas agregarlo al chat y luego corregirlo.
00:09:08La solución de Cursor para esto también es mover las sesiones de terminal a archivos.
00:09:11Entonces,
00:09:12siempre que le haces alguna pregunta,
00:09:14hace referencia a esos archivos de historial y usa grep para extraer la salida relevante..
00:09:20Dado que los registros del servidor suelen ser de larga duración y contienen mucho ruido para el agente,
00:09:25usar la tarea grep es más eficiente porque permite que el agente busque patrones.
00:09:29Obtuvieron esta idea de los agentes de codificación basados en CLI,
00:09:32que ejecutan los comandos,
00:09:33pero luego la salida se inyecta en el contexto exactamente de la forma en que Claude Code y otros lo hacen por defecto.
00:09:39Aunque Claude maneja esto inteligentemente por sí solo,
00:09:41podemos gestionarlo aún más usando instrucciones en Claude.md para indicarle que agregue todos los registros de terminal en un archivo dentro de la carpeta terminal dentro de la carpeta .context.
00:09:50Básicamente,
00:09:51si Claude ejecuta algún comando npm,
00:09:53ejecuta un comando especial que registra tanto el flujo de salida como el flujo de entrada en los archivos de documentos.
00:09:58Aquí,
00:09:592 representa el flujo de error estándar y 1 representa el flujo de salida estándar.
00:10:03Escribe estos registros en la carpeta terminal,
00:10:05marcándolos con una marca de tiempo.
00:10:07Luego,
00:10:07siempre que necesita buscar en ellos,
00:10:09simplemente usa un comando grep con un patrón especificado y carga las últimas 20 líneas para extraer solo lo que importa..
00:10:15Así que cada vez que probé mi servidor de desarrollo,
00:10:17usó estos comandos y siguió escribiendo las ejecuciones de terminal en archivos de acuerdo con el archivo Claude.md.
00:10:23Después de ejecutar el servidor,
00:10:24consultó los archivos de registro y descubrió qué estaba causando el problema y lo solucionó por mí..
00:10:29Ahora,
00:10:29aunque este complemento para Claude Code pueda parecer insignificante porque no parece tener mucho impacto en el trabajo inmediato,
00:10:35puede ser muy útil cuando quieres consultar el funcionamiento de tu aplicación.
00:10:38Justo como cuando necesité identificar qué servicio estaba causando que mi aplicación se bloqueara,
00:10:42simplemente le dije a Claude que consultara los registros de prueba en lugar de ejecutar las pruebas nuevamente,
00:10:47ahorrándome tener que volver a ejecutar un conjunto de pruebas de 2 minutos solo para reproducir un error que ya había visto.
00:10:53Eso nos lleva al final de este video.
00:10:54Si te gustaría apoyar el canal y ayudarnos a seguir haciendo videos como este,
00:10:58puedes hacerlo usando el botón de Super Thanks aquí abajo.
00:11:00Como siempre, gracias por ver y nos vemos en el próximo..

Key Takeaway

Cursor revoluciona la programación asistida por IA mediante gestión dinámica de contexto que incluye solo información relevante, mejorando significativamente la calidad del código y reduciendo el uso de tokens hasta en un 46.9%.

Highlights

Cursor implementa gestión dinámica de contexto para mejorar la calidad del código generado por IA, reduciendo la información innecesaria en la ventana de contexto

Las respuestas largas de herramientas MCP deben guardarse en archivos en lugar de truncarse, evitando pérdida de datos importantes

Guardar el historial completo de chat en archivos permite recuperar información que se pierde durante la compactación automática

El descubrimiento dinámico de herramientas MCP reduce el uso de contexto en un 46.9% al cargar solo nombres y descripciones

Las habilidades de agentes permiten revelar progresivamente capacidades sin saturar el contexto con todos los detalles desde el inicio

Registrar las sesiones de terminal en archivos permite consultar errores mediante grep sin reejecutar comandos largos

Timeline

Introducción: La revolución de las herramientas de IA para programar

El video presenta cómo la inteligencia artificial ha transformado completamente la producción de código, mencionando herramientas especializadas como ClodCode, Cursor y Antigravity. Se establece el argumento principal de que los buenos modelos por sí solos no determinan la calidad del código producido. Se enfatiza que la gestión del contexto y cómo se usa la herramienta son igualmente importantes que el modelo subyacente. Cursor ha realizado un gran avance con un nuevo enfoque de ingeniería de contexto construido nativamente en la aplicación, cuyos principios son transferibles a cualquier plataforma de desarrollo.

El principio fundamental: Descubrimiento dinámico de contexto

Se explica el concepto central de gestión de contexto basado en observaciones de Cursor: proporcionar la menor cantidad de detalles posible en la ventana de contexto mejora los resultados. Cuando el modelo recibe menos información simultáneamente, procesa menos datos, lo que reduce la confusión y aumenta el enfoque en la tarea específica. Este enfoque se denomina 'descubrimiento dinámico de contexto' y se basa en la idea de toma de notas estructurada. La información que no se necesita en el momento presente no debe estar en la ventana de contexto, ya que excluir detalles potencialmente confusos o contradictorios mejora significativamente la calidad de las respuestas del agente.

Primera mejora: Guardar respuestas largas de MCP en archivos

Cursor identifica que las herramientas MCP a menudo devuelven respuestas grandes que permanecen en la ventana de contexto innecesariamente. El enfoque común de truncar estas respuestas lleva a pérdida de datos importantes. La solución implementada consiste en guardar cualquier respuesta de herramienta MCP mayor a 50 líneas en archivos dentro de una carpeta específica. El presentador demuestra cómo implementó esto en Claude Code usando instrucciones en el archivo Claude.md, logrando que las respuestas grandes se guarden automáticamente para lectura posterior. Esta técnica mejoró la precisión del análisis al permitir que el agente consulte los archivos múltiples veces sin necesidad de llamadas repetitivas a herramientas, ahorrando tiempo significativo.

Patrocinio de Zen Rose

Segmento publicitario sobre Zen Rose, una herramienta de extracción de datos web para productos de IA y automatizaciones. Se destaca que Zen Rose maneja la extracción de sitios web complejos con evasión automática de anti-bots, entregando resultados estructurados en JSON o Markdown. La herramienta está diseñada para equipos de datos, startups de IA y creadores de automatizaciones que necesitan datos web confiables sin gestionar infraestructura. Se menciona su utilidad para casos de uso como enriquecimiento de leads, potenciación de agentes de IA y automatización de investigación.

Segunda mejora: Preservar historial completo de chat en archivos

Se aborda el problema de la compactación automática de contexto, que es desordenada y causa pérdida de información importante. Cuando las herramientas activan el paso de resumen repetidamente, los detalles cruciales pueden omitirse del resumen del modelo. La solución de Cursor es guardar todo el historial de chat anterior como archivo para consulta posterior, permitiendo que el agente recupere información perdida del resumen. El presentador implementó esta función en Claude Code agregando instrucciones para actualizar el historial de chat después de cada turno en una carpeta dedicada. De esta manera, la carpeta .context contiene registros detallados de todas las sesiones y decisiones tomadas, sirviendo como base de conocimiento para el modelo.

Tercera mejora: Habilidades de agentes con revelación progresiva

Se explica cómo las habilidades de agentes ayudan a gestionar el problema de contexto causado por MCPs mediante revelación progresiva. Las habilidades son conjuntos de instrucciones, scripts y recursos que los agentes pueden descubrir y usar para tareas específicas. Anthropic fue el primero en proponer esta idea como código abierto, seguido por implementaciones de Codex, Gemini y finalmente Cursor. La innovación clave es que solo el nombre y descripción de las habilidades están en el contexto estático, mientras que los agentes pueden utilizar búsqueda semántica de Cursor para acceder a los detalles cuando se necesitan. En el ejemplo del presentador, 5 habilidades consumían solo 0.2% del contexto total, dejando más espacio para trabajo productivo.

Cuarta mejora: Descubrimiento dinámico de herramientas MCP

Se presenta el problema de que los MCP contienen muchas herramientas, todas expuestas en la ventana de contexto simultáneamente, saturándola innecesariamente. Cursor enfatiza que es responsabilidad de los agentes de codificación, no de los servidores MCP, solucionar esta saturación. La solución implementada es sincronizar las descripciones de herramientas en carpetas separadas nombradas según cada MCP conectado, con todas las herramientas listadas dentro. El agente solo recibe los nombres de las herramientas inicialmente y las busca dinámicamente cuando las necesita. Esta implementación redujo el uso de contexto en un 46.9%, una diferencia enorme para sistemas de ejecución prolongada. El presentador descubre un indicador oculto en Claude Code (enable_experimental_MCP_CLI) que implementa esta funcionalidad mediante una capa bash intermedia.

Quinta mejora: Registrar sesiones de terminal en archivos

Se aborda la dificultad de reportar errores de terminal debido al acceso limitado de los agentes. La solución de Cursor es mover las sesiones de terminal a archivos para que el agente pueda referenciarlos y usar grep para extraer salida relevante sin reejecutar comandos. Los registros de servidor suelen ser largos y contienen mucho ruido, por lo que buscar patrones con grep es más eficiente. El presentador implementa esto en Claude Code mediante instrucciones en Claude.md que registran tanto el flujo de salida como el de error en archivos con marca de tiempo dentro de una carpeta terminal. Esta técnica resultó especialmente útil para consultar el funcionamiento de la aplicación y diagnosticar problemas sin reejecutar conjuntos de pruebas largos, ahorrando tiempo significativo en el ejemplo de 2 minutos de pruebas.

Conclusión y llamado a la acción

El video concluye con un resumen de todas las mejoras de gestión de contexto presentadas y su impacto en la calidad del código generado por IA. Se invita a los espectadores a apoyar el canal usando el botón de Super Thanks para continuar produciendo contenido educativo de este tipo. El presentador agradece por ver el video y se despide prometiendo contenido futuro. Esta sección breve cierra el círculo sobre los cinco métodos de gestión dinámica de contexto explicados a lo largo del video y sus aplicaciones prácticas tanto en Cursor como en Claude Code.

Community Posts

View all posts