Инструментарий от CEO Y Combinator, который сделает Claude Code невероятным

BBetter Stack
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00Генеральный директор YCombinator создал собственный инструментарий для Claude Code под названием GStack — его секрет
00:00:06того, как закрыть почти сотню PR за семь дней. Он включает девять специализированных рабочих процессов,
00:00:13режим работы без графического интерфейса через Playwright, интеграцию с Greptile, QA с учетом диффов и многое
00:00:18многое другое.
00:00:19Но недавний твит Гарри о будущем программирования не на шутку разозлил
00:00:24многих разработчиков.
00:00:25Так что же это значит для будущего GStack?
00:00:28Подписывайтесь, и давайте выясним.
00:00:33Гарри Тан занимает пост гендиректора YCombinator с 2023 года, а до этого в 2011 году он стал сооснователем
00:00:39венчурной фирмы.
00:00:42Так что у него колоссальный опыт в просмотре питчей и понимании того,
00:00:46что делает технологию уникальной.
00:00:49И все эти знания он вложил в свой набор инструментов для Claude Code, что заметно
00:00:53по названиям многих его рабочих процессов.
00:00:57На самом деле, давайте испытаем GStack в деле.
00:00:59Для работы GStack вам понадобятся установленные Claude Code и Bun. Но как только
00:01:03вы правильно настроите его в Claude Code с помощью этого текста или просто
00:01:08скачав навыки, эта информация должна появиться в вашем файле CLAUDE.md.
00:01:12Мой был пуст.
00:01:13Поэтому здесь только это, но если у вас там есть текст, то этот фрагмент просто
00:01:17добавится к нему.
00:01:18Он также помещает все нужные навыки в директорию skills, если вы захотите поделиться ими с
00:01:21коллегами, и устанавливает Playwright с соответствующим браузером.
00:01:25Сейчас я использую GStack, чтобы добавить функцию в это React Vite приложение, чтобы
00:01:30пользователь мог скачать изображение твита по конкретной ссылке.
00:01:34Возможно, вы видели, как я добавлял эту функцию в предыдущем видео.
00:01:37Я оставлю ссылку на него в описании, если хотите сравнить результаты,
00:01:41но посмотрим, справится ли GStack лучше.
00:01:44Сначала я перейду в режим планирования, затем использую навык "plan CEO review" и дам GStack
00:01:49информацию о функции.
00:01:51Я напишу: «Добавь функцию, которая делает скриншот твита по URL,
00:01:56предоставленному пользователем».
00:01:57Также я хочу, чтобы пользователь мог настраивать и скачивать изображение, а Claude соблюдал
00:02:02существующую верстку и стили.
00:02:03После нажатия Enter GStack сначала проверяет наличие обновлений для этого навыка,
00:02:08затем изучает git log перед продолжением.
00:02:10Этот режим переосмысливает проблему с позиции основателя/CEO и пытается продумать
00:02:16лучшую версию того, что мы строим, подвергая сомнению
00:02:20исходные рамки и ценность проекта.
00:02:21Как только это сделано, он предлагает нам выбрать, насколько сильно мы хотим изменить
00:02:26первоначальный объем работ.
00:02:27Здесь я выберу расширение рамок, так как там больше всего функций.
00:02:30Затем он предлагает выбрать критическое архитектурное решение.
00:02:33Я выберу рекомендованное, так как оно самое простое.
00:02:36Потом он задает еще пару вопросов, и я снова выберу
00:02:39рекомендованный подход.
00:02:40Теперь, когда процесс завершен, он выдал мега-план, показывающий выбранный режим
00:02:44и все, что будет реализовано в этих рамках.
00:02:47Он также перечислил то, что НЕ входит в задачи для этой функции.
00:02:50Ниже мы видим план реализации, который содержит архитектурную диаграмму,
00:02:55ключевые решения и конкретные шаги.
00:02:57Это невероятно детальный план, похожий на то, что я получил бы в Superpowers,
00:03:01если бы пошел тем же путем.
00:03:02Заметьте, в GStack также есть навык "plan engineering review", который превращает Claude
00:03:07в технического директора или лида для создания схем, выбора
00:03:12техстека, определения крайних случаев и так далее.
00:03:15Но похоже, что режим CEO уже взял на себя часть этой работы.
00:03:20Поэтому переходим к реализации.
00:03:22Теперь, когда все готово, мы можем запустить команду /review, чтобы проверить пропущенные кейсы,
00:03:27найти баги, которые прошли бы мимо CI, и отловить проблемы до того, как они попадут в прод.
00:03:32Опять же, идет проверка обновлений скрипта и анализ диффа.
00:03:36Сейчас он проверяет полноту выполнения задачи и выдает резюме,
00:03:40сообщая, что проблем не обнаружено.
00:03:41Теперь запускаем команду /ship, которая синхронизируется с основной веткой, гоняет тесты
00:03:46и закрывает ревью в Greptile, если они есть.
00:03:49Тут видно, что он сам создал пул-реквест, хотя я его об этом не просил.
00:03:54На этом этапе мы можем запустить команду /qa, которая протестирует только
00:03:58внесенные нами изменения на основе диффа.
00:03:59Здесь видно, что он запустил локальный сервер и переходит на сайт, чтобы протестировать
00:04:05только что внедренные функции, используя скриншоты и прочее.
00:04:09Он обнаружил 500-е ошибки по скриншотам и нашел баг с JSON.parse,
00:04:15который, похоже, уже исправил.
00:04:16Вот так.
00:04:17Он проверил и запушил исправление.
00:04:20И теперь он составил итоговый отчет с решенными проблемами.
00:04:24Это очень круто.
00:04:25Ладно.
00:04:26Все готово.
00:04:27Давайте попробуем функцию в деле.
00:04:28Теперь у нас есть страница для скриншотов.
00:04:30Возьмем какой-нибудь твит от Тана.
00:04:32Вот этот, и вставим его сюда.
00:04:34Твит не самый захватывающий, но это просто тест работы.
00:04:37И... ого, это впечатляет.
00:04:40Твит подгрузился.
00:04:42Мы можем переключаться между темами, и он снова делает захват.
00:04:44Ого.
00:04:45Понятно.
00:04:46Значит, у нас есть светлая и темная темы.
00:04:47Посмотрим, кэширует ли он это.
00:04:49Да, кэширует. Очень круто.
00:04:51Я могу скрыть кнопки действий, и вот.
00:04:53Можно показывать/скрывать изображения и менять фон.
00:04:58Это очень здорово.
00:04:59Есть стили под LinkedIn, Twitter, блог, фиолетовый градиент, и мы даже можем
00:05:03настроить его или изменить угол градиента.
00:05:07Вау.
00:05:08Это полноценный инструмент. Можно менять соотношение сторон.
00:05:119:16, 16:9, 1:1 и так далее.
00:05:16Давайте теперь скачаем изображение.
00:05:18Готово.
00:05:19Если я сейчас нажму сюда... вы увидели все мои вкладки.
00:05:22Вот картинка.
00:05:23Открою её в превью.
00:05:24Вот она.
00:05:25Это изображение я только что получил с помощью функции, созданной через GStack, что
00:05:29безумно круто. Но это еще не всё, потому что если вернуться к PR,
00:05:34мы увидим отчет Greptile: он нашел потенциальную утечку ресурсов на сервере, состояние гонки,
00:05:40отсутствие срока действия кэша и прочее.
00:05:42И вместо того чтобы просить Claude изучить проблемы и решить их, я просто
00:05:47запускаю команду /review.
00:05:49Он нашел все комментарии.
00:05:50Предложил варианты их решения ниже, которые я сейчас просмотрю.
00:05:53И теперь он исправил все проблемы.
00:05:55Ну, за исключением одного ложного срабатывания, и запушил код. Greptile доволен.
00:06:00Как человек, который регулярно использует Superpowers, я уже вижу пользу от GStack,
00:06:05хотя некоторые его аспекты довольно сложны.
00:06:08Но что насчет комментария Гарри в Twitter о том, что Markdown — это новый код?
00:06:13Что ж, я отчасти понимаю, о чем он.
00:06:15Не думаю, что он считает диплом по Computer Science пустой тратой времени
00:06:20только потому, что можно написать Markdown, и он сгенерирует код.
00:06:22Я думаю, дело скорее в инструкциях, потому что новые модели все лучше
00:06:27следуют Markdown-инструкциям. Раньше мне приходилось прописывать
00:06:32отдельный хук в Claude Code, чтобы он использовал Bun для установки вместо NPM.
00:06:36Но теперь я могу прописать это в CLAUDE.md, и хорошая модель вроде Opus
00:06:42слушается в 90-95% случаев.
00:06:44Так что, полагаю, он имеет в виду следующее: если у вас есть достаточно детальный и
00:06:49структурированный Markdown-файл, модель может создать качественный софт на его основе.
00:06:55Но это не значит, что GStack — это просто куча инструкций на Markdown.
00:06:59У каждого навыка своя директория, есть даже возможность обновления самого GStack.
00:07:03Если взглянуть на навык browse, там есть файл шаблона и сам
00:07:08файл навыка.
00:07:09И это никак не связано с шаблонами Go, несмотря на то, что написано на GitHub.
00:07:14Работает это так: если зайти в скрипты, а затем в genskill, TypeScript-файл
00:07:20прочитает шаблоны и заменит в них все плейсхолдеры на реальный Markdown.
00:07:26Я не буду подробно разбирать каждый навык в отдельности, они довольно сложные.
00:07:30Но отмечу, что у навыка browse есть не только MD-файл,
00:07:35потому что здесь есть папка с тестами, а также исходники (source),
00:07:40содержащие саму реализацию управления браузером и прочее.
00:07:42Так что уже видно, что команды здесь довольно продвинутые.
00:07:46А если заглянуть в чейнджлог, там есть очень интересные фичи, такие как
00:07:49сквозная наблюдаемость (E2E observability), инкрементальные сохранения эвалов и прочее,
00:07:55что используется для разработки приложения.
00:07:56Он делится результатами ревью в формате списка задач.
00:07:58Поддерживает скриншоты элементов и обрезку областей, не говоря уже об интеграции
00:08:03с Greptile и том факте, что он строился с оглядкой на Conductor.
00:08:07Итак, вопрос на миллион: буду ли я сам использовать GStack?
00:08:11Я бы сказал, что попробую его в течение 30 дней.
00:08:15Удалю плагин Superpowers и сделаю GStack своим основным инструментом
00:08:21для разработки фич и исправления багов, а там посмотрим.
00:08:23Кто знает?
00:08:24Может, я просто клонирую следующий опенсорсный инструмент от Vercel и начну новый холивар в Твиттере.

Key Takeaway

GStack превращает Claude Code в автономного ИИ-разработчика, способного планировать, реализовывать, тестировать и исправлять сложные функции с минимальным участием человека.

Highlights

GStack — это расширенный набор инструментов для Claude Code, созданный генеральным директором Y Combinator Гарри Таном.

Инструментарий включает 9 специализированных рабочих процессов, таких как «режим CEO» и «инженерное ревью».

GStack интегрирует Playwright для автоматизированного тестирования через браузер и Greptile для глубокого анализа кода.

Возможности автоматизации позволяют закрывать до 100 пул-реквестов за неделю благодаря автономным циклам исправления багов.

Концепция «Markdown — это новый код» подчеркивает растущую важность структурированных инструкций для современных LLM.

Система поддерживает сквозную наблюдаемость (E2E) и инкрементальные сохранения для профессиональной разработки.

Timeline

Введение в GStack от CEO Y Combinator

Видео начинается с представления GStack — секретного оружия Гарри Тана, которое позволило ему закрыть почти 100 PR всего за семь дней. Этот инструментарий расширяет стандартные возможности Claude Code с помощью девяти специализированных рабочих процессов и глубокой интеграции с внешними сервисами. Автор упоминает, что Тан использует свой огромный опыт оценки стартапов для создания уникальных инструментов автоматизации. Упоминаются такие функции, как режим работы без графического интерфейса через Playwright и QA на основе диффов. Секция задает контекст того, как профессиональный опыт в венчурном капитале может быть перенесен в программную инженерию.

Настройка и первый запуск инструментария

В этом разделе подробно описывается процесс установки и первичной конфигурации GStack. Для корректной работы системы пользователю необходимы установленные Claude Code и среда выполнения Bun. Все конфигурационные данные и навыки автоматически прописываются в файл CLAUDE.md, который служит основным источником инструкций для модели. Процесс установки также включает развертывание Playwright с необходимыми браузерами для последующего тестирования интерфейса. Автор демонстрирует начало работы над реальным проектом на React и Vite, планируя добавить функцию загрузки скриншотов твитов.

Рабочие процессы: Планирование в режиме CEO

Автор демонстрирует использование команды «plan CEO review» для разработки новой функциональности приложения. В этом режиме ИИ анализирует задачу с точки зрения основателя бизнеса, подвергая сомнению исходные рамки проекта и предлагая улучшения. Система предлагает пользователю выбрать масштаб изменений и архитектурный подход, после чего генерирует детальный мега-план с диаграммами. Этот этап критически важен, так как он определяет, что именно будет реализовано, а что останется за рамками текущей итерации. Также упоминается режим «engineering review», который фокусируется на технических деталях, таких как выбор стека и обработка крайних случаев.

Реализация, QA и автоматическое исправление ошибок

После этапа планирования наступает фаза активной реализации и тестирования с помощью команд /review, /ship и /qa. Команда /review находит потенциальные баги и несоответствия до того, как код попадет в производственную среду. Особое внимание уделяется функции /qa, которая запускает локальный сервер и использует Playwright для визуального тестирования интерфейса. В процессе теста ИИ самостоятельно обнаруживает ошибку с JSON.parse и 500-е ошибки, после чего автоматически их исправляет и пушит изменения. Этот замкнутый цикл тестирования и исправления демонстрирует высокую степень автономности GStack.

Демонстрация готовой функции и интеграция с Greptile

Автор показывает результат работы: полнофункциональный инструмент для создания красивых скриншотов твитов с поддержкой тем, градиентов и различных соотношений сторон. После загрузки кода в репозиторий вступает в дело интеграция с Greptile, которая проводит глубокий аудит безопасности и производительности. Greptile находит утечку ресурсов и состояние гонки, которые ИИ-ассистент мгновенно обрабатывает через повторный вызов команды /review. Большинство замечаний исправляются автоматически, за исключением одного ложного срабатывания, которое было корректно идентифицировано. Данный сегмент подчеркивает синергию между генеративным ИИ и инструментами статического анализа.

Философия Markdown и техническое устройство GStack

В заключительной части автор обсуждает громкое заявление Гарри Тана о том, что «Markdown — это новый код». Анализируется техническая реализация GStack, где шаблоны Markdown динамически заполняются данными через TypeScript-скрипты. Автор объясняет, что успех модели зависит от качества структурированных инструкций, которые теперь могут заменить сложные кастомные хуки. Рассматриваются продвинутые функции инструментария, такие как E2E-наблюдаемость и скриншоты элементов для тестирования. Видео завершается решением автора полностью перейти на GStack в течение 30 дней, чтобы оценить его эффективность в реальных задачах.

Community Posts

View all posts