La caja de herramientas del CEO de Y Combinator que hace que Claude Code sea increíble

BBetter Stack
컴퓨터/소프트웨어창업/스타트업경영/리더십AI/미래기술

Transcript

00:00:00El CEO de Y Combinator ha creado su propio kit de herramientas para el código de Claude llamado GStack, su secreto
00:00:06para liquidar casi cien PR en siete días, el cual incluye nueve flujos de trabajo especializados,
00:00:13un modo de navegación sin interfaz usando Playwright, integración con Greptile, un QA consciente de las diferencias y mucho
00:00:18mucho más.
00:00:19Pero el reciente tuit de Gary sobre el futuro del código ha molestado mucho a
00:00:24muchos desarrolladores.
00:00:25Entonces, ¿qué significa eso para el futuro de GStack?
00:00:28Suscríbete y vamos a descubrirlo.
00:00:33Gary Tan es el CEO de Y Combinator desde 2023 y, antes de eso, cofundó una firma de capital
00:00:39de riesgo en 2011.
00:00:42Así que tiene muchísima experiencia revisando propuestas y descubriendo qué
00:00:46hace que una nueva tecnología sea única.
00:00:49Y ha puesto todo ese conocimiento en su propio kit de herramientas de Claude, lo cual puedes
00:00:53notar al ver los nombres que le ha dado a muchos de sus flujos de trabajo.
00:00:57De hecho, vamos a probar GStack.
00:00:59Para que GStack funcione, necesitarás tener instalado Claude Code y también Bun, pero una vez
00:01:03que lo instales correctamente en Claude Code mediante este texto exacto o simplemente
00:01:08descargando las habilidades, deberías ver esta información añadida a tu archivo Claude.md.
00:01:12El mío estaba vacío.
00:01:13Por eso esto es lo único que hay aquí, pero si tienes algún texto, esto se añadirá
00:01:17al mismo.
00:01:18También coloca todas las habilidades relevantes en el directorio de habilidades si quieres compartirlas con
00:01:21tus compañeros de equipo y luego instala Playwright con el navegador adecuado.
00:01:25Ahora voy a usar GStack para añadir una función a esta aplicación React Vite para dar
00:01:30al usuario la capacidad de descargar una imagen de un tuit con una URL específica.
00:01:34Quizás me hayas visto añadir esta función en un video anterior.
00:01:37Dejaré un enlace en la descripción si quieres ver cuáles fueron los resultados, pero
00:01:41veremos si GStack puede hacerlo mejor que eso.
00:01:44Primero, tendré que empezar en modo de planificación, luego usar la habilidad "plan CEO review" y darle a GStack
00:01:49información sobre la función.
00:01:51Voy a decir: añade una función que tome una captura de pantalla de un tuit desde la URL proporcionada
00:01:56por el usuario.
00:01:57También quiero que el usuario personalice y descargue la imagen, y que Claude respete el
00:02:02diseño y los estilos existentes.
00:02:03Tras pulsar Enter, GStack primero comprueba si hay actualizaciones para esa habilidad y luego
00:02:08revisa el registro de git antes de proceder.
00:02:10Este modo replantea el problema desde la perspectiva de un fundador o CEO e intenta pensar
00:02:16en la mejor versión posible de lo que intentamos construir y cuestiona las suposiciones
00:02:20sobre el alcance y el valor.
00:02:21Una vez hecho esto, nos permite elegir cuánto queremos desafiar el alcance
00:02:26original.
00:02:27Aquí voy a optar por la expansión del alcance porque ofrece la mayor cantidad de funciones.
00:02:30Luego nos permite elegir una decisión arquitectónica crítica.
00:02:33Voy a ir con la recomendada, ya que es la más sencilla.
00:02:36Y luego hace algunas preguntas más, en las que, de nuevo, voy a seguir el
00:02:39enfoque recomendado.
00:02:40Ahora que ha terminado, ha elaborado un megaplan que muestra el modo de alcance seleccionado
00:02:44y todo lo que va a hacer dentro de ese alcance.
00:02:47También ha anotado algunas cosas que quedan fuera del alcance de esta función.
00:02:50Y aquí abajo tenemos el plan de implementación, que incluye un diagrama de arquitectura, decisiones
00:02:55clave y los diferentes pasos.
00:02:57Es un plan increíblemente detallado, similar a lo que obtendría de Superpowers si siguiera
00:03:01la misma ruta.
00:03:02Ojo, también hay una habilidad "plan engineering review" en GStack, que convierte a Claude en un
00:03:07gerente de ingeniería o líder técnico para crear diagramas arquitectónicos, fijar el
00:03:12stack tecnológico, definir casos de borde y demás.
00:03:15Pero parece que la habilidad "plan CEO review" se ha adelantado y ya ha hecho parte de eso.
00:03:20Así que saltamos a la implementación.
00:03:22Y ahora que ha terminado, podemos ejecutar el comando "review" para revisar casos de borde omitidos,
00:03:27encontrar errores que habrían pasado el CI y, básicamente, detectar cualquier problema antes de llegar a producción.
00:03:32De nuevo, comprueba si hay nuevas actualizaciones en el script y revisa el diff.
00:03:36Y ahora está comprobando que la tarea esté completa antes de darnos un resumen diciendo que
00:03:40no se han encontrado problemas.
00:03:41Y ahora podemos ejecutar el comando "ship", que sincroniza con la rama principal, ejecuta pruebas
00:03:46y resuelve cualquier revisión de Greptile si existe.
00:03:49Y aquí podemos ver que ha procedido a crear una pull request sin que yo se lo pidiera.
00:03:54Llegados a este punto, podemos ejecutar el comando "QA", que probará solo los cambios que hemos
00:03:58realizado basándose en el diff.
00:03:59Aquí vemos que ha iniciado el servidor localmente y está recorriendo el sitio web para probar
00:04:05las funciones que se acaban de implementar mediante capturas de pantalla y mucho más.
00:04:09Ha encontrado algunos errores 500 en las capturas y un error con el parseo de JSON, el cual
00:04:15parece haber corregido.
00:04:16Aquí está.
00:04:17Ha verificado y subido la corrección.
00:04:20Y ahora ha escrito un informe final con los problemas que ha resuelto.
00:04:24Esto es genial.
00:04:25Muy bien.
00:04:26Ya está terminado.
00:04:27Vamos a probar la función.
00:04:28Ahora tenemos una página de capturas de pantalla.
00:04:30Vamos a tomar un tuit de Tana.
00:04:32Este mismo, y lo pegaré aquí.
00:04:34No es el tuit más emocionante, pero es solo para probar si esto funciona.
00:04:37Y... vaya, esto es súper impresionante.
00:04:40Aquí tenemos el tuit.
00:04:42Podemos elegir entre luces y está capturando de nuevo.
00:04:44Ah, vaya.
00:04:45Increíble.
00:04:46Así que tenemos modo claro y oscuro.
00:04:47Veremos si lo ha guardado en caché.
00:04:49Y sí, genial.
00:04:51Puedo ocultar las acciones y aquí lo tenemos.
00:04:53Puedo mostrar y ocultar las imágenes y puedo cambiar el fondo.
00:04:58Esto mola mucho.
00:04:59Tenemos LinkedIn, Twitter, blog, degradado púrpura, e incluso podemos personalizarlo
00:05:03o cambiar el ángulo del degradado.
00:05:07Guau.
00:05:08Es súper completo y podemos cambiar la relación de aspecto.
00:05:11Tenemos 9:16, 16:9, 1:1 y demás.
00:05:16Ahora vamos a descargar la imagen.
00:05:18Y aquí está.
00:05:19Si ahora hago clic en esto, habréis visto todas mis pestañas.
00:05:22Tenemos la imagen aquí.
00:05:23Voy a abrirla en Vista Previa.
00:05:24Y aquí la tenéis.
00:05:25Esta es la imagen que acabo de tomar con la función que construí con GStack, lo cual es increíblemente
00:05:29impresionante, pero hay más que podemos hacer porque si volvemos a la PR, vemos que
00:05:34Greptile tiene un resumen; ha encontrado agotamiento de recursos del servidor, condiciones de carrera,
00:05:40falta de expiración de caché, etcétera.
00:05:42Y en lugar de pedirle a Claude que mire los problemas y los resuelva, simplemente
00:05:47vamos a ejecutar el comando "review".
00:05:49Ha encontrado todos los comentarios.
00:05:50Me ha dado algunas opciones aquí abajo sobre cómo arreglarlos, las cuales revisaré.
00:05:53Y ahora ha solucionado todos los problemas.
00:05:55Bueno, salvo un falso positivo, y ha subido el código. Greptile parece estar contento.
00:06:00Como alguien que usa Superpowers habitualmente, ya veo las ventajas de GStack, aunque
00:06:05algunos aspectos sean bastante complejos.
00:06:08Pero ¿qué hay del comentario de Gary en Twitter diciendo que Markdown es el nuevo código?
00:06:13Bueno, puedo entender por dónde va.
00:06:15No creo que esté diciendo que alguien con un grado en informática haya perdido el tiempo solo
00:06:20porque puedas escribir Markdown y este genere el código.
00:06:22Creo que se refiere más a las instrucciones, porque los nuevos modelos están mejorando a la hora de
00:06:27obedecer instrucciones en Markdown. Antes necesitaba tener un hook de Claude Code
00:06:32solo para asegurarme de que usara Bun para instalar en lugar de NPM.
00:06:36Pero ahora puedo ponerlo en el Claude.md y, con un buen modelo como Opus, suele obedecer el 90
00:06:42o 95 % de las veces.
00:06:44Así que creo que lo que intenta decir es que si tienes un archivo Markdown lo suficientemente detallado
00:06:49y bien estructurado, el modelo puede crear un buen software basado en esas instrucciones.
00:06:55Pero esto no quiere decir que GStack sea solo un montón de instrucciones en Markdown.
00:06:59Cada habilidad tiene su propio directorio, incluso la capacidad de actualizar GStack.
00:07:03Y si nos fijamos en la habilidad "browse", vemos que hay un archivo de plantilla y el archivo
00:07:08de la habilidad en sí.
00:07:09Y esto no tiene nada que ver con las plantillas de Go, independientemente de lo que diga la página de GitHub.
00:07:14Como funciona es que, si vamos a scripts y luego a genskill, el archivo TypeScript
00:07:20leerá las plantillas y sustituirá los marcadores de posición por Markdown real.
00:07:26Pero no me voy a centrar en cada habilidad individualmente porque son bastante detalladas.
00:07:30En lo que sí me centraré es en que la habilidad "browse" tiene algo más que un simple archivo skill.md porque
00:07:35tenemos un directorio de pruebas aquí y también el directorio source que contiene la
00:07:40implementación real para la gestión del navegador y demás.
00:07:42Así que ya vemos que los comandos aquí son bastante elaborados.
00:07:46Pero si echamos un vistazo al registro de cambios, este muestra funciones muy interesantes como
00:07:49observabilidad de extremo a extremo, guardado de evaluaciones incrementales, etc., que se usan para desarrollar
00:07:55la aplicación.
00:07:56Comparte las revisiones en formato de lista de tareas.
00:07:58Admite capturas de elementos y recorte de regiones, sin mencionar todas las integraciones
00:08:03con Greptile y el hecho de que fue diseñado pensando en Conductor.
00:08:07Así que la pregunta del millón es: ¿usaré yo personalmente GStack?
00:08:11Y yo diría que, de hecho, voy a probarlo durante 30 días.
00:08:15Voy a eliminar el plugin de Superpowers y convertiré a GStack en mi herramienta principal para preparar
00:08:21funciones y corregir errores, a ver qué tal va.
00:08:23Quién sabe.
00:08:24Igual clono la próxima herramienta de código abierto de Vercel y armo más bronca en Twitter.

Key Takeaway

GStack transforma a Claude Code en un ingeniero de software autónomo capaz de gestionar el ciclo de vida completo del desarrollo, desde la visión estratégica de un CEO hasta el despliegue técnico y la corrección de errores.

Highlights

GStack es un kit de herramientas personalizado por Gary Tan, CEO de Y Combinator, para optimizar Claude Code.

La herramienta incluye nueve flujos de trabajo especializados, como el modo de planificación desde la perspectiva de un CEO.

GStack integra capacidades avanzadas de automatización como navegación sin interfaz con Playwright y revisiones de código con Greptile.

El sistema permite una implementación end-to-end que abarca desde la creación del plan arquitectónico hasta la corrección automática de errores en PR.

El flujo de trabajo destaca por su capacidad de realizar pruebas de QA automáticas mediante capturas de pantalla y navegación real del sitio.

Gary Tan sostiene que Markdown es el nuevo código, enfatizando que instrucciones bien estructuradas permiten a la IA generar software complejo.

GStack no es solo una colección de prompts, sino un sistema técnico con scripts en TypeScript y plantillas dinámicas.

Timeline

Introducción a GStack y la trayectoria de Gary Tan

El video comienza presentando GStack, el kit de herramientas personal que permitió al CEO de Y Combinator, Gary Tan, cerrar casi cien solicitudes de extracción en solo siete días. Se mencionan características clave como los nueve flujos de trabajo especializados y la integración con herramientas como Playwright y Greptile. Gary Tan aporta su vasta experiencia desde 2011 identificando tecnologías disruptivas para dar forma a estas habilidades de Claude. El narrador explica que estas herramientas reflejan el conocimiento acumulado de Tan en la revisión de propuestas de startups. Esta sección establece la importancia de GStack como una evolución en la forma en que los fundadores interactúan con el código.

Instalación y Configuración del Entorno

En este segmento se detallan los requisitos técnicos para poner en marcha GStack, destacando la necesidad de tener instalados Claude Code y Bun. El proceso implica la descarga de habilidades específicas que se integran en el archivo Claude.md y el directorio de habilidades del proyecto. Se explica cómo la herramienta configura automáticamente el entorno, incluyendo la instalación de navegadores para Playwright. El presentador prepara el escenario para un experimento real utilizando una aplicación React con Vite. El objetivo es añadir una función compleja de captura de pantalla de tuits para evaluar si GStack supera los métodos de codificación tradicionales.

Modo de Planificación: CEO y Engineering Review

El flujo de trabajo comienza con la habilidad "plan CEO review", que analiza el problema desde una perspectiva empresarial y de producto. Este modo cuestiona las suposiciones iniciales, permitiendo al usuario elegir entre mantener el alcance original o expandirlo para añadir más valor. Tras definir la visión, GStack genera un plan de implementación detallado que incluye diagramas de arquitectura y decisiones técnicas críticas. También existe una habilidad de "engineering review" para roles de líder técnico, aunque el modo CEO a menudo cubre aspectos arquitectónicos fundamentales de antemano. Este enfoque garantiza que la IA no solo escriba código, sino que entienda el propósito y la escalabilidad de la función solicitada.

Implementación y Control de Calidad Automático

Una vez aprobado el plan, se procede a la implementación automática seguida del comando "review" para detectar errores antes de producción. Una de las funciones más sorprendentes es el comando "QA", que lanza un servidor local y navega por la aplicación como un usuario real. Durante esta fase, la herramienta utiliza Playwright para tomar capturas de pantalla y detectar errores de servidor o fallos en el procesamiento de JSON. Si se encuentran problemas, GStack intenta corregirlos de forma autónoma y verifica la solución inmediatamente. El resultado es un informe final exhaustivo que documenta todos los errores resueltos y la validación de la tarea.

Demostración Funcional y Gestión de PR

El video muestra los resultados tangibles de la nueva función, que permite descargar imágenes de tuits con múltiples opciones de personalización. La interfaz generada incluye modos claro y oscuro, gestión de caché, diferentes fondos de degradado y ajustes de relación de aspecto. Posteriormente, el narrador utiliza el comando "ship" para sincronizar con la rama principal y crear una Pull Request automáticamente. GStack también gestiona las revisiones de Greptile, identificando problemas como condiciones de carrera o falta de expiración de caché. El sistema resuelve estos comentarios de revisión de forma inteligente, demostrando una capacidad de mantenimiento de código poco común en herramientas de IA estándar.

Análisis Técnico y Reflexión sobre Markdown

El presentador analiza la controvertida afirmación de Gary Tan sobre que "Markdown es el nuevo código". Se aclara que esto no invalida el conocimiento informático, sino que resalta la capacidad de los modelos modernos como Opus para seguir instrucciones estructuradas en archivos Markdown. El video profundiza en la estructura interna de GStack, revelando que utiliza TypeScript para procesar plantillas y generar contenido dinámico. Cada habilidad tiene su propio ciclo de vida, incluyendo pruebas unitarias y gestión de dependencias. Esta distinción es crucial para entender que GStack es una infraestructura de ingeniería robusta, no simplemente una lista de prompts de texto.

Futuro de GStack y Veredicto Final

En la conclusión, se revisan las características avanzadas registradas en el historial de cambios, como la observabilidad extremo a extremo y las capturas de regiones. El narrador decide adoptar GStack como su herramienta principal durante los próximos 30 días, reemplazando otros plugins como Superpowers. Se destaca la eficiencia de GStack para preparar funciones complejas y corregir errores de manera sistemática. La sección cierra con una nota de curiosidad sobre el impacto que estas herramientas de código abierto tendrán en la comunidad de desarrolladores. El video termina sugiriendo que la integración profunda entre modelos de lenguaje y flujos de trabajo tradicionales es el futuro inevitable del desarrollo de software.

Community Posts

View all posts