Инструментарий от CEO Y Combinator, который сделает Claude Code невероятным

Русскийالعربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Português 中文

Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00Генеральный директор YCombinator создал собственный инструментарий для Claude Code под названием GStack — его секрет

00:00:06того, как закрыть почти сотню PR за семь дней. Он включает девять специализированных рабочих процессов,

00:00:13режим работы без графического интерфейса через Playwright, интеграцию с Greptile, QA с учетом диффов и многое

00:00:18многое другое.

00:00:19Но недавний твит Гарри о будущем программирования не на шутку разозлил

00:00:24многих разработчиков.

00:00:25Так что же это значит для будущего GStack?

00:00:28Подписывайтесь, и давайте выясним.

00:00:33Гарри Тан занимает пост гендиректора YCombinator с 2023 года, а до этого в 2011 году он стал сооснователем

00:00:39венчурной фирмы.

00:00:42Так что у него колоссальный опыт в просмотре питчей и понимании того,

00:00:46что делает технологию уникальной.

00:00:49И все эти знания он вложил в свой набор инструментов для Claude Code, что заметно

00:00:53по названиям многих его рабочих процессов.

00:00:57На самом деле, давайте испытаем GStack в деле.

00:00:59Для работы GStack вам понадобятся установленные Claude Code и Bun. Но как только

00:01:03вы правильно настроите его в Claude Code с помощью этого текста или просто

00:01:08скачав навыки, эта информация должна появиться в вашем файле CLAUDE.md.

00:01:12Мой был пуст.

00:01:13Поэтому здесь только это, но если у вас там есть текст, то этот фрагмент просто

00:01:17добавится к нему.

00:01:18Он также помещает все нужные навыки в директорию skills, если вы захотите поделиться ими с

00:01:21коллегами, и устанавливает Playwright с соответствующим браузером.

00:01:25Сейчас я использую GStack, чтобы добавить функцию в это React Vite приложение, чтобы

00:01:30пользователь мог скачать изображение твита по конкретной ссылке.

00:01:34Возможно, вы видели, как я добавлял эту функцию в предыдущем видео.

00:01:37Я оставлю ссылку на него в описании, если хотите сравнить результаты,

00:01:41но посмотрим, справится ли GStack лучше.

00:01:44Сначала я перейду в режим планирования, затем использую навык "plan CEO review" и дам GStack

00:01:49информацию о функции.

00:01:51Я напишу: «Добавь функцию, которая делает скриншот твита по URL,

00:01:56предоставленному пользователем».

00:01:57Также я хочу, чтобы пользователь мог настраивать и скачивать изображение, а Claude соблюдал

00:02:02существующую верстку и стили.

00:02:03После нажатия Enter GStack сначала проверяет наличие обновлений для этого навыка,

00:02:08затем изучает git log перед продолжением.

00:02:10Этот режим переосмысливает проблему с позиции основателя/CEO и пытается продумать

00:02:16лучшую версию того, что мы строим, подвергая сомнению

00:02:20исходные рамки и ценность проекта.

00:02:21Как только это сделано, он предлагает нам выбрать, насколько сильно мы хотим изменить

00:02:26первоначальный объем работ.

00:02:27Здесь я выберу расширение рамок, так как там больше всего функций.

00:02:30Затем он предлагает выбрать критическое архитектурное решение.

00:02:33Я выберу рекомендованное, так как оно самое простое.

00:02:36Потом он задает еще пару вопросов, и я снова выберу

00:02:39рекомендованный подход.

00:02:40Теперь, когда процесс завершен, он выдал мега-план, показывающий выбранный режим

00:02:44и все, что будет реализовано в этих рамках.

00:02:47Он также перечислил то, что НЕ входит в задачи для этой функции.

00:02:50Ниже мы видим план реализации, который содержит архитектурную диаграмму,

00:02:55ключевые решения и конкретные шаги.

00:02:57Это невероятно детальный план, похожий на то, что я получил бы в Superpowers,

00:03:01если бы пошел тем же путем.

00:03:02Заметьте, в GStack также есть навык "plan engineering review", который превращает Claude

00:03:07в технического директора или лида для создания схем, выбора

00:03:12техстека, определения крайних случаев и так далее.

00:03:15Но похоже, что режим CEO уже взял на себя часть этой работы.

00:03:20Поэтому переходим к реализации.

00:03:22Теперь, когда все готово, мы можем запустить команду /review, чтобы проверить пропущенные кейсы,

00:03:27найти баги, которые прошли бы мимо CI, и отловить проблемы до того, как они попадут в прод.

00:03:32Опять же, идет проверка обновлений скрипта и анализ диффа.

00:03:36Сейчас он проверяет полноту выполнения задачи и выдает резюме,

00:03:40сообщая, что проблем не обнаружено.

00:03:41Теперь запускаем команду /ship, которая синхронизируется с основной веткой, гоняет тесты

00:03:46и закрывает ревью в Greptile, если они есть.

00:03:49Тут видно, что он сам создал пул-реквест, хотя я его об этом не просил.

00:03:54На этом этапе мы можем запустить команду /qa, которая протестирует только

00:03:58внесенные нами изменения на основе диффа.

00:03:59Здесь видно, что он запустил локальный сервер и переходит на сайт, чтобы протестировать

00:04:05только что внедренные функции, используя скриншоты и прочее.

00:04:09Он обнаружил 500-е ошибки по скриншотам и нашел баг с JSON.parse,

00:04:15который, похоже, уже исправил.

00:04:16Вот так.

00:04:17Он проверил и запушил исправление.

00:04:20И теперь он составил итоговый отчет с решенными проблемами.

00:04:24Это очень круто.

00:04:25Ладно.

00:04:26Все готово.

00:04:27Давайте попробуем функцию в деле.

00:04:28Теперь у нас есть страница для скриншотов.

00:04:30Возьмем какой-нибудь твит от Тана.

00:04:32Вот этот, и вставим его сюда.

00:04:34Твит не самый захватывающий, но это просто тест работы.

00:04:37И... ого, это впечатляет.

00:04:40Твит подгрузился.

00:04:42Мы можем переключаться между темами, и он снова делает захват.

00:04:44Ого.

00:04:45Понятно.

00:04:46Значит, у нас есть светлая и темная темы.

00:04:47Посмотрим, кэширует ли он это.

00:04:49Да, кэширует. Очень круто.

00:04:51Я могу скрыть кнопки действий, и вот.

00:04:53Можно показывать/скрывать изображения и менять фон.

00:04:58Это очень здорово.

00:04:59Есть стили под LinkedIn, Twitter, блог, фиолетовый градиент, и мы даже можем

00:05:03настроить его или изменить угол градиента.

00:05:07Вау.

00:05:08Это полноценный инструмент. Можно менять соотношение сторон.

00:05:119:16, 16:9, 1:1 и так далее.

00:05:16Давайте теперь скачаем изображение.

00:05:18Готово.

00:05:19Если я сейчас нажму сюда... вы увидели все мои вкладки.

00:05:22Вот картинка.

00:05:23Открою её в превью.

00:05:24Вот она.

00:05:25Это изображение я только что получил с помощью функции, созданной через GStack, что

00:05:29безумно круто. Но это еще не всё, потому что если вернуться к PR,

00:05:34мы увидим отчет Greptile: он нашел потенциальную утечку ресурсов на сервере, состояние гонки,

00:05:40отсутствие срока действия кэша и прочее.

00:05:42И вместо того чтобы просить Claude изучить проблемы и решить их, я просто

00:05:47запускаю команду /review.

00:05:49Он нашел все комментарии.

00:05:50Предложил варианты их решения ниже, которые я сейчас просмотрю.

00:05:53И теперь он исправил все проблемы.

00:05:55Ну, за исключением одного ложного срабатывания, и запушил код. Greptile доволен.

00:06:00Как человек, который регулярно использует Superpowers, я уже вижу пользу от GStack,

00:06:05хотя некоторые его аспекты довольно сложны.

00:06:08Но что насчет комментария Гарри в Twitter о том, что Markdown — это новый код?

00:06:13Что ж, я отчасти понимаю, о чем он.

00:06:15Не думаю, что он считает диплом по Computer Science пустой тратой времени

00:06:20только потому, что можно написать Markdown, и он сгенерирует код.

00:06:22Я думаю, дело скорее в инструкциях, потому что новые модели все лучше

00:06:27следуют Markdown-инструкциям. Раньше мне приходилось прописывать

00:06:32отдельный хук в Claude Code, чтобы он использовал Bun для установки вместо NPM.

00:06:36Но теперь я могу прописать это в CLAUDE.md, и хорошая модель вроде Opus

00:06:42слушается в 90-95% случаев.

00:06:44Так что, полагаю, он имеет в виду следующее: если у вас есть достаточно детальный и

00:06:49структурированный Markdown-файл, модель может создать качественный софт на его основе.

00:06:55Но это не значит, что GStack — это просто куча инструкций на Markdown.

00:06:59У каждого навыка своя директория, есть даже возможность обновления самого GStack.

00:07:03Если взглянуть на навык browse, там есть файл шаблона и сам

00:07:08файл навыка.

00:07:09И это никак не связано с шаблонами Go, несмотря на то, что написано на GitHub.

00:07:14Работает это так: если зайти в скрипты, а затем в genskill, TypeScript-файл

00:07:20прочитает шаблоны и заменит в них все плейсхолдеры на реальный Markdown.

00:07:26Я не буду подробно разбирать каждый навык в отдельности, они довольно сложные.

00:07:30Но отмечу, что у навыка browse есть не только MD-файл,

00:07:35потому что здесь есть папка с тестами, а также исходники (source),

00:07:40содержащие саму реализацию управления браузером и прочее.

00:07:42Так что уже видно, что команды здесь довольно продвинутые.

00:07:46А если заглянуть в чейнджлог, там есть очень интересные фичи, такие как

00:07:49сквозная наблюдаемость (E2E observability), инкрементальные сохранения эвалов и прочее,

00:07:55что используется для разработки приложения.

00:07:56Он делится результатами ревью в формате списка задач.

00:07:58Поддерживает скриншоты элементов и обрезку областей, не говоря уже об интеграции

00:08:03с Greptile и том факте, что он строился с оглядкой на Conductor.

00:08:07Итак, вопрос на миллион: буду ли я сам использовать GStack?

00:08:11Я бы сказал, что попробую его в течение 30 дней.

00:08:15Удалю плагин Superpowers и сделаю GStack своим основным инструментом

00:08:21для разработки фич и исправления багов, а там посмотрим.

00:08:23Кто знает?

00:08:24Может, я просто клонирую следующий опенсорсный инструмент от Vercel и начну новый холивар в Твиттере.

Key Takeaway

GStack превращает Claude Code в автономного ИИ-разработчика, способного планировать, реализовывать, тестировать и исправлять сложные функции с минимальным участием человека.

Highlights

GStack — это расширенный набор инструментов для Claude Code, созданный генеральным директором Y Combinator Гарри Таном.

Инструментарий включает 9 специализированных рабочих процессов, таких как «режим CEO» и «инженерное ревью».

GStack интегрирует Playwright для автоматизированного тестирования через браузер и Greptile для глубокого анализа кода.

Возможности автоматизации позволяют закрывать до 100 пул-реквестов за неделю благодаря автономным циклам исправления багов.

Концепция «Markdown — это новый код» подчеркивает растущую важность структурированных инструкций для современных LLM.

Система поддерживает сквозную наблюдаемость (E2E) и инкрементальные сохранения для профессиональной разработки.

Timeline

Введение в GStack от CEO Y Combinator

Видео начинается с представления GStack — секретного оружия Гарри Тана, которое позволило ему закрыть почти 100 PR всего за семь дней. Этот инструментарий расширяет стандартные возможности Claude Code с помощью девяти специализированных рабочих процессов и глубокой интеграции с внешними сервисами. Автор упоминает, что Тан использует свой огромный опыт оценки стартапов для создания уникальных инструментов автоматизации. Упоминаются такие функции, как режим работы без графического интерфейса через Playwright и QA на основе диффов. Секция задает контекст того, как профессиональный опыт в венчурном капитале может быть перенесен в программную инженерию.

Настройка и первый запуск инструментария

В этом разделе подробно описывается процесс установки и первичной конфигурации GStack. Для корректной работы системы пользователю необходимы установленные Claude Code и среда выполнения Bun. Все конфигурационные данные и навыки автоматически прописываются в файл CLAUDE.md, который служит основным источником инструкций для модели. Процесс установки также включает развертывание Playwright с необходимыми браузерами для последующего тестирования интерфейса. Автор демонстрирует начало работы над реальным проектом на React и Vite, планируя добавить функцию загрузки скриншотов твитов.

Рабочие процессы: Планирование в режиме CEO

Автор демонстрирует использование команды «plan CEO review» для разработки новой функциональности приложения. В этом режиме ИИ анализирует задачу с точки зрения основателя бизнеса, подвергая сомнению исходные рамки проекта и предлагая улучшения. Система предлагает пользователю выбрать масштаб изменений и архитектурный подход, после чего генерирует детальный мега-план с диаграммами. Этот этап критически важен, так как он определяет, что именно будет реализовано, а что останется за рамками текущей итерации. Также упоминается режим «engineering review», который фокусируется на технических деталях, таких как выбор стека и обработка крайних случаев.

Реализация, QA и автоматическое исправление ошибок

После этапа планирования наступает фаза активной реализации и тестирования с помощью команд /review, /ship и /qa. Команда /review находит потенциальные баги и несоответствия до того, как код попадет в производственную среду. Особое внимание уделяется функции /qa, которая запускает локальный сервер и использует Playwright для визуального тестирования интерфейса. В процессе теста ИИ самостоятельно обнаруживает ошибку с JSON.parse и 500-е ошибки, после чего автоматически их исправляет и пушит изменения. Этот замкнутый цикл тестирования и исправления демонстрирует высокую степень автономности GStack.

Демонстрация готовой функции и интеграция с Greptile

Автор показывает результат работы: полнофункциональный инструмент для создания красивых скриншотов твитов с поддержкой тем, градиентов и различных соотношений сторон. После загрузки кода в репозиторий вступает в дело интеграция с Greptile, которая проводит глубокий аудит безопасности и производительности. Greptile находит утечку ресурсов и состояние гонки, которые ИИ-ассистент мгновенно обрабатывает через повторный вызов команды /review. Большинство замечаний исправляются автоматически, за исключением одного ложного срабатывания, которое было корректно идентифицировано. Данный сегмент подчеркивает синергию между генеративным ИИ и инструментами статического анализа.

Философия Markdown и техническое устройство GStack

В заключительной части автор обсуждает громкое заявление Гарри Тана о том, что «Markdown — это новый код». Анализируется техническая реализация GStack, где шаблоны Markdown динамически заполняются данными через TypeScript-скрипты. Автор объясняет, что успех модели зависит от качества структурированных инструкций, которые теперь могут заменить сложные кастомные хуки. Рассматриваются продвинутые функции инструментария, такие как E2E-наблюдаемость и скриншоты элементов для тестирования. Видео завершается решением автора полностью перейти на GStack в течение 30 дней, чтобы оценить его эффективность в реальных задачах.

Community Posts

Claude Code и GStack: Стратегия реальной инфраструктуры для обработки 100 PR в неделю соло-разработчиком

makedream2026年3月18日5210

Write about this video