O kit de ferramentas do CEO da Y Combinator que torna o Claude Code incrível

BBetter Stack
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00O CEO da YCombinator criou seu próprio conjunto de ferramentas para o Claude Code chamado GStack, seu segredo
00:00:06para esmagar quase cem PRs em sete dias, o que inclui nove fluxos de trabalho especializados,
00:00:13um modo de navegação headless usando Playwright, integração com Greptile, um QA ciente de diffs e muito
00:00:18muito mais.
00:00:19Mas o tweet recente de Garry sobre o futuro do código deixou muitos desenvolvedores realmente
00:00:24irritados.
00:00:25Então, o que isso significa para o futuro do GStack?
00:00:28Inscreva-se e vamos descobrir.
00:00:33Garry Tan é o CEO da YCombinator desde 2023 e, antes disso, co-fundou uma empresa de capital
00:00:39de risco em 2011.
00:00:42Portanto, ele tem muita experiência quando se trata de analisar pitches e descobrir o que
00:00:46torna uma nova tecnologia única.
00:00:49E ele colocou todo esse conhecimento em seu próprio kit de ferramentas do Claude Code, o que você pode
00:00:53notar pelos nomes que ele deu a muitos de seus fluxos de trabalho.
00:00:57Na verdade, vamos testar o GStack.
00:00:59Para o GStack funcionar, você precisará ter o Claude Code instalado, bem como o Bun, mas uma vez
00:01:03instalado corretamente no Claude Code via prompt com este texto exato ou apenas
00:01:08baixando as skills, você deve ter estas informações adicionadas ao seu arquivo claude.md.
00:01:12O meu estava vazio.
00:01:13Por isso, esta é a única coisa aqui, mas se você tiver algum texto, isso será adicionado
00:01:17a ele.
00:01:18Ele também coloca todas as skills relevantes no diretório de skills se quiser compartilhar com
00:01:21seus colegas de equipe e, em seguida, instala o Playwright com o navegador apropriado.
00:01:25Agora, vou usar o GStack para adicionar uma funcionalidade a esta aplicação React Vite para dar ao
00:01:30usuário a capacidade de baixar uma imagem de um tweet com uma URL específica.
00:01:34Talvez você tenha me visto adicionar essa funcionalidade em um vídeo anterior.
00:01:37Deixarei o link na descrição se quiser ver quais foram os resultados, mas
00:01:41veremos se o GStack pode fazer melhor do que aquilo.
00:01:44Primeiro, preciso iniciar no modo plano, usar a skill "plan CEO review" e dar ao GStack
00:01:49algumas informações sobre a funcionalidade.
00:01:51Vou dizer: adicione um recurso que tire um print de um tweet a partir da URL fornecida
00:01:56pelo usuário.
00:01:57Também quero que o usuário personalize e baixe a imagem, e quero que o Claude respeite o
00:02:02layout e os estilos existentes.
00:02:03Após dar o enter, o GStack verifica primeiro se há atualizações para essa skill e depois
00:02:08verifica o log do git antes de prosseguir.
00:02:10Este modo repensa o problema sob a perspectiva de um fundador/CEO e tenta pensar
00:02:16na melhor versão possível do que estamos tentando construir, desafiando premissas
00:02:20sobre o escopo e o valor.
00:02:21Depois de fazer isso, ele nos permite escolher o quanto queremos desafiar o
00:02:26escopo original.
00:02:27Aqui, vou escolher a expansão de escopo porque ela tem a maior quantidade de recursos.
00:02:30Em seguida, ele nos deixa escolher uma decisão arquitetural crítica.
00:02:33Vou escolher a recomendada, já que é a mais fácil.
00:02:36E então ele faz mais algumas perguntas, nas quais, novamente, vou seguir a
00:02:39abordagem recomendada.
00:02:40Agora que terminou, ele gerou um mega plano mostrando o modo de escopo selecionado
00:02:44e tudo o que ele vai fazer dentro desse escopo.
00:02:47Ele também escreveu algumas coisas que não estão no escopo desta funcionalidade.
00:02:50E aqui embaixo temos o plano de implementação, que tem um diagrama de arquitetura, decisões
00:02:55chave e diferentes etapas.
00:02:57Este é um plano incrivelmente detalhado, semelhante a algo que eu obteria do Superpowers se
00:03:01seguisse o mesmo caminho.
00:03:02Note que também há uma skill "plan engineering review" no GStack, que transforma o Claude em um
00:03:07gerente de engenharia ou tech lead para criar diagramas arquiteturais, definir a
00:03:12stack tecnológica, definir casos de borda e assim por diante.
00:03:15Mas parece que a skill "plan CEO review" já se adiantou e fez um pouco disso.
00:03:20Então, vamos pular para a implementação.
00:03:22Agora que terminou, podemos rodar o comando /review para revisar casos de borda ausentes,
00:03:27encontrar bugs que passariam pelo CI e basicamente capturar problemas antes de chegarem à produção.
00:03:32Novamente, ele verifica novas atualizações no script e verifica o diff.
00:03:36E agora está verificando a conclusão da tarefa antes de nos dar um resumo dizendo que
00:03:40nenhum problema foi encontrado.
00:03:41Agora podemos rodar o comando /ship, que sincroniza com a branch principal, executa testes
00:03:46e resolve quaisquer revisões do Greptile, se existirem.
00:03:49Aqui podemos ver que ele criou um pull request sem que eu sequer pedisse.
00:03:54Nesta fase, podemos rodar o comando /qa, que testará apenas as alterações que
00:03:58fizemos com base no diff.
00:03:59Aqui vemos que ele iniciou o servidor localmente e está navegando pelo site para testar
00:04:05os recursos que acabaram de ser implementados usando capturas de tela e muito mais.
00:04:09Ele encontrou alguns erros 500 nos prints e achou um bug no JSON parse, que
00:04:15parece já ter corrigido.
00:04:16Aqui está.
00:04:17Ele verificou e enviou a correção.
00:04:20E agora escreveu um relatório final com os problemas que resolveu.
00:04:24Isso é muito legal.
00:04:25Tudo bem.
00:04:26Agora que terminou,
00:04:27vamos testar o recurso.
00:04:28Agora temos uma página de screenshot.
00:04:30Vou pegar um tweet do Garry Tan.
00:04:32Este aqui, e vou colá-lo aqui.
00:04:34Não é o tweet mais empolgante, mas é só um teste para ver se funciona.
00:04:37E uau, ok, isso é super impressionante.
00:04:40Temos o tweet aqui.
00:04:42Podemos escolher entre luz e ele está capturando novamente.
00:04:44Ah, uau.
00:04:45Ok.
00:04:46Temos modo claro e escuro.
00:04:47Vamos ver se ele fez o cache disso.
00:04:49Fez, muito legal.
00:04:51Posso esconder as ações e aqui está.
00:04:53Posso mostrar e esconder as imagens e mudar o fundo.
00:04:58Isso é muito bacana.
00:04:59Temos LinkedIn, Twitter, blog, gradiente roxo, e podemos até personalizar
00:05:03ou mudar o ângulo do gradiente.
00:05:07Uau.
00:05:08Está super completo e podemos mudar a proporção.
00:05:11Temos 9 por 16, 16 por 9, 1 por 1 e assim por diante.
00:05:16Vamos agora baixar a imagem de fato.
00:05:18E aqui está.
00:05:19Se eu clicar nisso agora, vocês viram todas as minhas abas.
00:05:22Temos a imagem aqui.
00:05:23Vou abrir no Preview.
00:05:24E é isso.
00:05:25Esta é a imagem que acabei de tirar com o recurso que construí com o GStack, o que é
00:05:29incrivelmente impressionante, mas há mais que podemos fazer porque, voltando ao PR, vemos que
00:05:34o Greptile tem um resumo: encontrou exaustão de recursos no servidor, race condition,
00:05:40falta de expiração de cache, e assim por diante.
00:05:42E em vez de eu pedir ao Claude para olhar os problemas e resolvê-los, vamos apenas
00:05:47rodar o comando /review.
00:05:49Ele encontrou todos os comentários.
00:05:50Deu-me algumas opções aqui embaixo sobre como corrigi-los, as quais vou revisar.
00:05:53E agora ele corrigiu todos os problemas.
00:05:55Bem, exceto por um falso positivo, e enviou o código; o Greptile parece satisfeito.
00:06:00Como alguém que usa o Superpowers regularmente, já vejo o benefício do GStack, mesmo
00:06:05que alguns aspectos dele sejam bem complexos.
00:06:08Mas e o comentário do Garry no Twitter dizendo que "Markdown é o novo código"?
00:06:13Bom, eu meio que entendo o ponto dele.
00:06:15Não acho que ele esteja dizendo que alguém com diploma de Ciência da Computação perdeu seu tempo só
00:06:20porque você pode escrever Markdown e ele escreverá o código.
00:06:22Acho que tem mais a ver com as instruções, pois os novos modelos estão cada vez melhores em
00:06:27obedecer instruções em Markdown; antigamente eu precisava de um hook no Claude Code
00:06:32só para garantir que ele usasse o Bun para instalar em vez do NPM.
00:06:36Mas agora posso colocar no claude.md e, com um bom modelo como o Opus, ele tende a obedecer de 90
00:06:42a 95% das vezes.
00:06:44Então, acho que o que ele quer dizer é que, se você tiver um arquivo Markdown detalhado e bem estruturado,
00:06:49o modelo pode criar um bom software baseado nessas instruções.
00:06:55Mas isso não quer dizer que o GStack seja apenas um bando de instruções em Markdown.
00:06:59Cada skill tem seu próprio diretório, incluindo a capacidade de atualizar o GStack.
00:07:03E se focarmos na skill "browse", vemos que há um arquivo de template e o
00:07:08arquivo da skill propriamente dito.
00:07:09E isso não tem nada a ver com templates de Go, independentemente do que diz a página no GitHub.
00:07:14A forma como isso funciona é que, se formos em scripts e depois em genskill, o arquivo TypeScript
00:07:20lerá os arquivos de template e substituirá quaisquer placeholders dentro deles por Markdown real.
00:07:26Mas não vou focar em cada skill individualmente porque são bem detalhadas.
00:07:30O que vou destacar é que a skill "browse" tem mais do que apenas um arquivo skill.md,
00:07:35pois temos um diretório de teste e também o diretório de origem (src), que contém a
00:07:40implementação real para o gerenciamento do navegador e assim por diante.
00:07:42Então, já podemos ver que os comandos aqui são bastante elaborados.
00:07:46Mas se dermos uma olhada no changelog, ele mostra recursos muito interessantes, como
00:07:49observabilidade de ponta a ponta, salvamento incremental de evals, etc., usados para desenvolver
00:07:55o app.
00:07:56Ele compartilha revisões em formato de to-do.
00:07:58Suporta captura de elementos e recorte de região, sem mencionar todas as integrações que tem
00:08:03com o Greptile e o fato de ter sido construído com o Conductor em mente.
00:08:07Então, a pergunta de um milhão de dólares é: eu pessoalmente usarei o GStack?
00:08:11E eu diria que, na verdade, vou testá-lo por 30 dias.
00:08:15Vou deletar o plugin Superpowers e tornar o GStack minha ferramenta principal de código para preparar
00:08:21funcionalidades e corrigir bugs para ver como ele se sai.
00:08:23Quem sabe?
00:08:24Talvez eu acabe clonando a próxima ferramenta open source da Vercel e comece outra treta no Twitter.

Key Takeaway

O GStack potencializa o Claude Code ao transformar o modelo de IA em um engenheiro e gestor de elite, automatizando processos complexos de arquitetura, codificação e controle de qualidade.

Highlights

Apresentação do GStack, o kit de ferramentas personalizado do CEO da Y Combinator, Garry Tan, para o Claude Code.

Capacidade de realizar quase 100 Pull Requests em apenas sete dias utilizando fluxos de trabalho especializados.

Integração de recursos avançados como navegação headless com Playwright, QA ciente de diffs e integração com Greptile.

Funcionalidades de planejamento estratégico como 'plan CEO review' e 'plan engineering review' para arquitetura e escopo.

Automatização do ciclo de desenvolvimento, desde a criação de funcionalidades complexas até o deploy com o comando '/ship'.

Discussão sobre a visão de Garry Tan de que 'Markdown é o novo código' e como instruções bem estruturadas guiam IAs.

Demonstração prática de criação de um recurso de captura e personalização de tweets em uma aplicação React Vite.

Timeline

Introdução ao GStack e Garry Tan

O vídeo começa apresentando o GStack, um conjunto de ferramentas criado por Garry Tan, CEO da Y Combinator, para otimizar o uso do Claude Code. O narrador destaca o impressionante histórico de Tan em processar quase cem PRs em uma semana com nove fluxos de trabalho especializados. São detalhados os pré-requisitos técnicos para a instalação, como o Claude Code e o Bun, além da configuração do arquivo claude.md. A integração com o Playwright para navegação headless também é mencionada como um pilar fundamental da ferramenta. Este contexto inicial estabelece a autoridade de Tan e a robustez técnica necessária para rodar o kit.

Planejamento e Visão de CEO

Nesta seção, o narrador demonstra o uso da skill 'plan CEO review' para adicionar uma funcionalidade de captura de tweets em uma aplicação React. O GStack analisa o problema sob a perspectiva de um fundador, desafiando premissas de escopo e valor de negócio antes de codificar. O sistema oferece opções de expansão de escopo e decisões arquiteturais críticas, gerando um plano detalhado com diagramas e etapas de implementação. É mencionada também a skill 'plan engineering review', que atua como um tech lead para definir a stack tecnológica e casos de borda. Essa etapa demonstra como a ferramenta integra pensamento estratégico ao desenvolvimento de software tradicional.

Implementação e Garantia de Qualidade (QA)

Após o planejamento, o vídeo foca na execução e nos comandos de revisão como o '/review' e o '/qa'. O comando de revisão identifica bugs que poderiam passar pelo CI tradicional, verificando logs do git e diffs de código em tempo real. Durante o processo de QA, o GStack inicia um servidor local e utiliza o Playwright para navegar no site e testar as novas funcionalidades visualmente. Um bug de JSON parse e erros 500 em capturas de tela são detectados e corrigidos automaticamente pela IA. Esta automação de testes ponta a ponta ilustra a eficiência do GStack em manter a estabilidade da aplicação sem intervenção humana constante.

Demonstração Prática e Personalização

O narrador testa a funcionalidade criada: um gerador de imagens de tweets altamente personalizável com diversos modos e gradientes. A ferramenta permitiu alternar entre modos claro e escuro, mudar proporções de tela e ocultar elementos como imagens ou botões de ação. Surpreendentemente, o GStack integrou o Greptile para identificar problemas complexos como race conditions e exaustão de recursos no servidor. O comando '/review' é utilizado novamente para aplicar as correções sugeridas pelo Greptile de forma quase instantânea. O resultado final é um produto polido que vai muito além de um simples script básico de captura de tela.

Análise Técnica e Conclusão

Na parte final, o vídeo aborda a polêmica afirmação de Garry Tan de que 'Markdown é o novo código', explicando que isso se refere à eficácia das instruções estruturadas. O narrador disseca a estrutura interna das skills do GStack, revelando que elas utilizam TypeScript e templates para gerar arquivos Markdown dinâmicos. São mencionados recursos avançados de observabilidade e suporte para ferramentas como o Conductor no desenvolvimento do GStack. O autor conclui anunciando um desafio pessoal de 30 dias para utilizar o GStack como sua ferramenta principal de codificação. O encerramento reforça que, embora complexo, o kit oferece uma vantagem competitiva significativa para desenvolvedores modernos.

Community Posts

View all posts