План по созданию полноценной операционной системы на базе Claude

AAI LABS
Computing/SoftwareInternet Technology

Transcript

00:00:00Представьте, что вы средневековый король. У вас есть целое королевство, которым нужно управлять, но вы бы предпочли делать
00:00:04абсолютно ничего, пока другие делают это за вас. Проблема в том, что вы не можете, потому что ваш персонал привык,
00:00:10что его кормят с ложечки. Вместо этого вам нужна система, которая управляет всем королевством самостоятельно,
00:00:15и именно этим стал Claude Code. С тех пор как Anthropic выпускает
00:00:19обновления, он перестал быть просто агентом по написанию кода и превратился в полноценную операционную систему,
00:00:25которая координирует всё на вашем компьютере. Но именно динамические рабочие процессы связывают всё это воедино.
00:00:30Так что прежде чем наш король отдаст свое королевство агенту, давайте посмотрим, как эта штука работает на самом деле.
00:00:35С тех пор как Anthropic начала предлагать новые способы траты токенов, что на самом деле является лишь их
00:00:40предлогом заработать побольше денег на Claude Code, он стал чем-то гораздо большим, чем просто агент по написанию кода. Это
00:00:44по сути полноценная операционная система. Подобно тому, как операционная система формирует основу для любой
00:00:50задачи и координирует работу на вашем компьютере, Claude Code теперь играет ту же роль. Он координирует
00:00:55и управляет всем, что вы делаете. Но прежде чем мы погрузимся в то, как динамические рабочие процессы завершают эту
00:01:00систему, вам нужно узнать о других компонентах. Единственная разница между
00:01:04компьютерной операционной системой и операционной системой Claude Code заключается в том, что вам не нужно так
00:01:08сильно напрягаться с настройкой, если только вы не используете Arch. И нет, вам не придется устанавливать
00:01:12кучу драйверов только для того, чтобы заработал микрофон, чтобы вы могли использовать голосовые подсказки, как бог вайба.
00:01:17И точно так же, как настоящая ОС, она состоит из нескольких частей. Каждая из них настолько важна, что
00:01:22система без нее неполноценна. В ОС ядро — это самый важный уровень, который формирует основу и
00:01:28управляет всеми операциями. Эквивалентом в Claude Code является файл Claude.md и ваши контекстные файлы.
00:01:33Мы уже делали подробное видео о том, как структурировать файл Claude.md, чтобы ваш агент
00:01:39работал максимально эффективно. Это важно здесь, потому что ядро — это движущая программа вашего агента.
00:01:44Если оно настроено неправильно, агент не сможет понять, чего на самом деле хочет ваш проект. И остальные
00:01:48части разваливаются вместе с ним. Примерно так же, как вся ваша жизнь разваливается, когда вы женитесь. Затем
00:01:53идут драйверы — части, которые позволяют системе взаимодействовать с внешними устройствами. Эквивалентом в
00:01:58Claude Code является MCP. Поэтому всякий раз, когда Claude нужен внешний инструмент, он обращается к нему через MCP и вызывает
00:02:04этот инструмент для выполнения работы. После этого идут повседневные программы, которые в Claude Code являются навыками и
00:02:09другими командами. Они содержат структурированные инструкции для повторяющихся задач, и вы можете вызывать их всякий раз,
00:02:14когда они вам нужны. Каждой ОС также нужен планировщик или cron-задача, которая выполняет определенное задание в запланированное время.
00:02:20Таким же образом Claude Code недавно добавил циклы и процедуры. По сути, это его cron-задачи,
00:02:25и они избавляют вас от необходимости следить за ним во время выполнения задачи. Они автоматизируют рутинную работу,
00:02:29которую вы иначе делали бы вручную. Поэтому даже если ваша система отключится, задачи будут продолжать выполняться сами по себе. Так что вы можете
00:02:34спокойно спать, зная, что ваше B2B SaaS-приложение, которым буквально никто не пользуется, находится под присмотром.
00:02:40И последнее, самое важное — это элемент, который связывает их все в
00:02:45полноценную операционную систему. Этот элемент — динамический рабочий процесс, новая функция, появившаяся в Opus
00:02:504.8. Вы, возможно, уже знаете, что у Claude Code есть динамические рабочие процессы. По сути, это еще одна попытка
00:02:55Anthropic упростить долго выполняющиеся задачи. Они работают как повторяющиеся инструкции, которые создают несколько
00:03:01агентов для выполнения задачи, для которой они были предназначены. Итак, чем это отличается от других архитектур, которые
00:03:06у вас уже есть? Чтобы сравнить их, первая и самая простая — это навыки. Навыки — это повторяющиеся инструкции для
00:03:11задач, требующих направляющих шагов. Но навык создается одним агентом, и этот же агент читает из него инструкции.
00:03:17Это просто направляет агента выполнять задачу, которую он уже знает, лучшим способом и не помогает с
00:03:22долго выполняющимися задачами. Это просто один агент, выполняющий всё дело. Затем идет команда “цель” (goal). Она
00:03:27итерирует к заранее определенной конечной цели, и агент выполняет цикл до тех пор, пока не будет достигнуто конечное условие. Это была
00:03:32исключительная попытка сделать долго выполняющиеся задачи лучше. Мы активно используем ее в наших собственных рабочих процессах
00:03:38с момента выпуска. И цель, и рабочий процесс могут координировать несколько агентов, но они разные.
00:03:43Ключевое различие между ними — детерминизм. Команда “цель” недетерминирована, что означает, что система решает,
00:03:48что делать дальше. Рабочий процесс детерминирован, и код точно решает, что произойдет. Вы создаете свой
00:03:54первый рабочий процесс, просто используя ключевое слово “workflow” (рабочий процесс). Из этого слова в вашей подсказке Claude определяет
00:03:59динамический рабочий процесс, необходимый для задачи, но это слово, которое мы используем постоянно в подсказках, поэтому вы можете
00:04:04подумать, что он будет срабатывать каждый раз. Однако это не так, если только подсказка на самом деле не выражает намерение
00:04:09создать его. Вот чем рабочие процессы на самом деле отличаются. Вместо обычного Markdown, который
00:04:14используется не обычный markdown, как у других, а создается код на JavaScript. Он находится в директории workflow внутри папки .Claude,
00:04:19и использует весь этот скрипт для управления всем процессом. Так что вместо того, чтобы ваш план находился в
00:04:23контекстном окне, этот план записывается в виде кода, определяющего, как под-агенты будут работать шаг за
00:04:28шагом. Он определяет строгие схемы, которые, по сути, являются формами для под-агентов, чтобы они выдавали
00:04:33результат в строгом формате. Каждый агент вызывается с подсказкой и формой, которую он должен заполнить. Он продолжает
00:04:39работать, пока результат не совпадет с этой схемой, а затем возвращает свои выводы. Вы вызываете их с помощью слеш-
00:04:44команды с именем рабочего процесса, затем можете передать ему план, который хотите протестировать под нагрузкой. Он работает в
00:04:49фоне, так что вы можете продолжать свою работу, дать ему другую подсказку, чтобы ваш менеджер проекта
00:04:53наконец-то почувствовал гордость за вашу ИИ-продуктивность. Чтобы проверить прогресс, вы просто запускаете команду
00:04:58“workflow”. Там вы можете увидеть каждый этап каждого рабочего процесса и все модели, которые вызвал каждый агент,
00:05:03и увидеть, сколько токенов потратила каждая задача. И если ваш сеанс закончится, пока рабочий процесс выполняется,
00:05:08вам не нужно беспокоиться о потере прогресса. Он сохраняется после того, как вы запустите команду “resume” (возобновить). Каждый рабочий процесс
00:05:14сохраняет свой собственный ID. И когда вы возобновляете, он извлекает всю кэшированную работу агента из памяти и продолжает
00:05:19с того места, где остановился. В отличие от моей бабушки, он не забывает оплатить счет за ИИ Claude и на самом деле
00:05:24помнит, что ему нужно сделать. Одна вещь, которую следует отметить перед использованием рабочего процесса. Поскольку это в режиме
00:05:29предварительного просмотра (research preview), динамические рабочие процессы потребляют гораздо больше токенов, чем типичный сеанс Claude Code. Это потому, что
00:05:35они используют несколько под-агентов под капотом, и каждый из них работает в своем отдельном контекстном окне. Вам нужно
00:05:40тщательно обдумать, когда они вам действительно нужны, иначе вы исчерпаете свой тарифный план в 200 долларов за несколько
00:05:45часов. Есть несколько ключевых метрик, которые подскажут, является ли рабочий процесс лучшим вариантом. Первый
00:05:50заключается в том, что задачу можно разделить на независимые единицы. Если агенты зависят от работы друг друга,
00:05:55они в конечном итоге просто ждут, и нет смысла создавать рабочий процесс, потому что вы теряете весь
00:06:00параллелизм. Именно поэтому, если задачи менее зависимы друг от друга, вы получаете лучший параллелизм и
00:06:05более быстрые результаты. Чему ваш стартап должен научиться, поскольку он все еще зависит от денег ваших родителей,
00:06:10чтобы выжить. Следующая причина использовать динамические рабочие процессы — если задаче требуется больше одного контекстного
00:06:15окна для выполнения, и её нужно разделить на части. Рабочие процессы используют несколько под-агентов, каждый со своим
00:06:21собственным контекстным окном, поэтому задача должна быть достаточно большой, чтобы действительно нуждаться в этих отдельных окнах. Иначе,
00:06:26вы будете просто тратить время и токены. Каждый под-агент работает в своем свежем контексте и возвращает
00:06:31только результат. Остальная часть его рассуждений остается в файле кода и никогда не попадает в основное контекстное окно,
00:06:36если только вам это не нужно. Следующая причина в том, что задачу стоит проверить. Используйте рабочий процесс, когда неправильный ответ
00:06:41достаточно дорог, чтобы требовать перекрестной проверки перед тем, как двигаться дальше. Это включает в себя такие вещи, как
00:06:46вопросы безопасности, претензии к ошибкам и миграции. Но эта проверка стоит дополнительных агентов, которые сжигают
00:06:52токены и время. Поэтому убедитесь, что задача действительно того стоит, и вы не просто создаете пять агентов
00:06:57потому, что недавно услышали от ИИ-техно-генерального директора, что больше токенов равно больше денег. Последняя причина в том, что
00:07:03ваша задача детерминирована. Рабочий процесс использует код для вызова агентов в фиксированной структуре. Так что если задача
00:07:09детерминирована, действуйте. Если задача недетерминирована и требует от агента оценки того, что
00:07:14будет следующей задачей во время выполнения, рабочие процессы не для этого. Итак, когда вы выбираете между “workflow” и
00:07:20“goal”, подумайте о форме задачи. Задача может быть широкой или глубокой. Широкая означает, что её можно разбить на множество
00:07:25подзадач, которые могут выполняться одновременно. Глубокая означает одну задачу за раз, шаг за шагом продвигаясь глубже в неё.
00:07:32Рабочий процесс широк, поэтому вместо того, чтобы идти глубже, он просто вызывает агентов и позволяет им итерировать. Для глубоких
00:07:37задач команда “goal” берет одну задачу за раз и не выполняет вещи параллельно так, как это делают рабочие процессы.
00:07:43Прибегайте к рабочему процессу только тогда, когда задача действительно подходит, чтобы вы не тратили токены.
00:07:48Claude Code уже поставляется со встроенным динамическим рабочим процессом под названием “Deep Research” (Глубокое исследование). Это, по сути,
00:07:53многоступенчатый исследовательский конвейер, который мы раньше создавали вручную с помощью нескольких контекстных файлов и Claude.md. Теперь
00:07:58это просто рабочий процесс, который вы можете вызвать из любого проекта. Это исследование является ключевой частью всей ОС, которую
00:08:04вы создаете. Оно гарантирует, что источники информации, лежащие в основе этой ОС, заслуживают доверия, чтобы ваша мама не могла скармливать вам
00:08:09фейковую информацию из своей бумерской группы в Facebook, а затем ругать вас, когда вы проверяете ее факты. Оно выполняется в пять
00:08:14частей, и каждая из них переходит в следующую. Сначала он ищет информацию, затем извлекает детали
00:08:19из найденных источников. После этого следует состязательная проверка для перекрестной проверки утверждений,
00:08:24и он синтезирует всё, что уцелело, в один финальный документ. Вы можете наблюдать за его работой из
00:08:29команды “workflows”, где каждый под-агент наследует свои инструменты от родителя, и это действительно очень интенсивно по
00:08:34токенам, так что он может сжечь весь ваш лимит в кратчайшие сроки. Этот запуск занял миллион токенов на
00:08:39небольшую тему. Помимо многоступенчатого исследования, вы можете создавать другие исследовательские рабочие процессы, которые становятся частью
00:08:45вашей исследовательской системы. Один из тех, что мы сделали для себя, исследует конкурентов, проверяет, как они работают,
00:08:49и находит их конкурентное преимущество. Это важная часть, если вы разработчик продукта. Вам
00:08:54нужно знать, как ваши конкуренты работают на рынке, чтобы вы могли создать что-то лучше.
00:08:59Этот разбит на четыре фазы, как и исследовательский рабочий процесс, и как только он завершается, он сообщает обратно
00:09:04результаты. Наш запуск использовал 679 000 токенов и 34 агента, и написал полный Markdown-отчет со своими выводами.
00:09:11Он также улучшает себя по мере работы. Когда он сталкивается с проблемой, он применяет исправление, поэтому в следующий раз, когда вы его запустите,
00:09:17он не столкнется с теми же проблемами, что и в первый раз. Отчет поставляется с четко определенными
00:09:21метриками сравнения и всеми его выводами, поэтому, когда вы создаете свой продукт, вы можете использовать его в качестве источника
00:09:26для анализа рынка перед запуском. Также, если вам нравится наш контент, подумайте о нажатии
00:09:30кнопки “хайп”, потому что это помогает нам создавать больше контента, подобного этому, и охватывать больше людей.
00:09:35Каждой операционной системе нужно её ядро, её драйверы и части, которые делают её полноценной. Вместе,
00:09:41они позволяют ей работать без вашего ввода. Одним из примеров такой системы является настройка “второго мозга”.
00:09:45Это определенно полезно, если ваш первый, как и наш, был полностью испорчен из-за того, что им не пользовались с тех пор,
00:09:50как наши устройства были благословлены LLM. Ядром этого второго мозга становится ваш Claude.MD,
00:09:55который содержит информацию о том, как навигировать по всей системе. Повседневные программы, повторяющиеся
00:10:01вещи — это ваши навыки. Они содержат инструкции для задач, которые вы выполняете снова и снова. Вот лучший
00:10:06способ настройки. Когда вы находитесь глубоко в долгом сеансе и понимаете, что это то, что вы будете делать часто,
00:10:11просто попросите Claude объединить знания из этого сеанса в навык. Память этой ОС — это все
00:10:16файлы, которые вы создаете и поддерживаете в своем хранилище. Они записывают то, что вы делаете и как вы это делаете. Это
00:10:21значит, что он знает о вас больше, чем вы сами, и они дают Claude контекст обо всем, над чем вы
00:10:25работаете. Нам часто нужно, чтобы второй мозг достигал внешних источников, поэтому мы настроили
00:10:29MCP Google Календаря и Notion. Таким образом, он может получать доступ к файлам проектов в Notion и синхронизировать данные,
00:10:35читать расписание в календаре и создавать и обновлять записи, чтобы он мог вписать немного времени на “потрогать траву”
00:10:41между вашим и без того занятым графиком. Мы задокументировали точные форматы, которым он должен следовать в файле Claude.MD,
00:10:46и самая важная часть — это создание рабочих процессов для вашей настройки. Они позволяют параллелить
00:10:51ваши повторяющиеся задачи и передавать их под-агентам. Утренний рабочий процесс, который мы создали, запускает под-агентов,
00:10:57чтобы собрать информацию из нескольких источников и вернуть краткую сводку для начала нашего дня. Как только всё это настроено,
00:11:02вы просто даете ему подсказку. Он загружает нужный навык и контекст, создает файлы в нужных местах
00:11:07и самостоятельно подключает информацию к соответствующим частям. Если вы пользуетесь вторым мозгом
00:11:12уже некоторое время, вам следует создать рабочий процесс аудита. Он проверяет битые ссылки, обнаруживает каждую проблему
00:11:17в настройке и сообщает о них. Оттуда вы можете запустить исправления и поддерживать свой второй мозг в отличном
00:11:22состоянии, но зная, какой вы человек, к следующей неделе вы также будете оплачивать его сеансы терапии.
00:11:27Подобно тому, как вы можете настроить целую операционную систему для некодирующих проектов, вы можете сделать то же самое для
00:11:32ваших проектов по программированию. Вы настраиваете свой claude.md в качестве ядра и помещаете всю информацию о проекте
00:11:37внутри него. Вы настраиваете агентов для вашего проекта, которые действуют как ваши повседневные программы.
00:11:42Вы также настраиваете хуки для разных случаев, например, форматирование файла после того, как агент заканчивает редактирование
00:11:46его, так что между тем чёртовым беспорядком, который вы называете своими отношениями и кодом, по крайней мере одна вещь
00:11:51организована. Вы создаете навыки для разных задач, например, добавление новой конечной точки. Таким образом, каждая конечная точка
00:11:56следует точно той схеме, которую вы хотите, и вы можете создавать рабочие процессы для таких вещей, как проверка изменений перед
00:12:01отправкой, миграция кодовой базы или базы данных и выполнение сквозных тестов для подтверждения того, что все приложение
00:12:07работает. Вместо того чтобы вы просыпались от звонка менеджера в 2 часа ночи из-за того, что ваш продакшн снова упал, контекстом
00:12:12для этой ОС становятся файлы в папке docs и сам код. Рабочие процессы исключительно
00:12:17полезны для миграции проектов. Вы можете создать один, который конвертирует весь ваш проект с одной библиотеки на
00:12:22другую, и позволить отдельным агентам обрабатывать конвертацию. Мы тестировали это раньше, и без
00:12:27рабочего процесса это занимало больше часа, но с рабочим процессом это заняло всего 21 минуту. Так что время, сэкономленное
00:12:32с помощью рабочих процессов, может пойти на более важные вещи, такие как прокрутка неуместных дипфейков Дарио.
00:12:37Вот как наша операционная система расширяется до сценариев использования программирования, поэтому, когда вы создаете проекты,
00:12:43вам не нужно обрабатывать всё вручную. Вы позволяете операционной системе делать это за вас. Если вы хотите
00:12:47основать следующую большую AI B2B SaaS компанию, но не знаете, с чего начать, вам стоит быть в AI Labs Pro.
00:12:53Там вы найдете рабочие процессы, использованные в этом видео, вместе со всеми другими ресурсами,
00:12:57руководствами и вкусностями, которые мы собрали. Вы также сможете встретить кучу единомышленников-нердов,
00:13:01включая нашу команду. Ссылка в описании, и вы можете проверить это.
00:13:05Это подводит нас к концу этого видео. Если вы хотите поддержать канал и помочь нам продолжать создавать
00:13:09такие видео, вы можете сделать это, используя кнопку “суперспасибо” внизу. Как всегда, спасибо за
00:13:14просмотр, и увидимся в следующем.

Key Takeaway

Превращение Claude Code в полноценную операционную систему через внедрение детерминированных динамических рабочих процессов на JavaScript позволяет автоматизировать сложные долгосрочные задачи с высокой эффективностью, сокращая время выполнения до 65% по сравнению с ручным управлением.

Highlights

  • Claude Code функционирует как полноценная операционная система, координирующая рабочие процессы, управление инструментами через MCP и автоматизацию повторяющихся задач.

  • Динамические рабочие процессы, доступные начиная с версии Opus 4.8, позволяют выполнять сложные задачи путем делегирования их нескольким под-агентам с независимыми контекстными окнами.

  • Миграция проекта с использованием рабочих процессов сократила время выполнения задачи с более чем 60 минут до 21 минуты.

  • Исследовательский рабочий процесс для анализа конкурентов выполнил работу, задействовав 34 агента и потребив 679 000 токенов, что привело к созданию детального отчета в формате Markdown.

  • Рабочие процессы детерминированы и используют JavaScript-код для управления последовательностью выполнения, в отличие от недетерминированной команды 'goal'.

  • Использование динамических рабочих процессов требует тщательного планирования, так как они потребляют значительно больше токенов по сравнению со стандартными сеансами Claude Code из-за использования нескольких под-агентов.

Timeline

Claude Code как операционная система

  • Claude Code эволюционировал из простого инструмента для написания кода в полноценную ОС для управления компьютерными задачами.
  • Архитектура системы включает ядро (файл Claude.md), драйверы (инструменты MCP), повседневные программы (навыки) и планировщик (циклы и процедуры).
  • Файл Claude.md является критическим компонентом, определяющим цели и эффективность работы агента.
  • Циклы и процедуры позволяют автоматизировать рутинные задачи, которые продолжают выполняться даже после завершения сеанса пользователя.

Claude Code координирует операции на компьютере, минимизируя потребность в ручном управлении. Файл Claude.md служит ядром, задающим контекст и правила работы. Интеграция внешних инструментов происходит через протокол MCP. Автоматизация повторяющихся действий осуществляется за счет навыков и процедур, работающих по принципу задач cron.

Механика динамических рабочих процессов

  • Динамические рабочие процессы в Opus 4.8 представляют собой детерминированные инструкции, написанные на JavaScript.
  • Рабочие процессы координируют нескольких под-агентов, каждый из которых работает в отдельном контекстном окне.
  • В отличие от навыков или команды 'goal', рабочие процессы выполняют задачи параллельно, строго следуя определенной структуре кода.
  • Прогресс выполнения рабочего процесса сохраняется, что позволяет возобновить его выполнение после перезапуска сеанса.

Рабочие процессы управляют сложными задачами, разбивая их на подзадачи, выполняемые специализированными агентами. Код для управления рабочим процессом размещается в директории .Claude/workflow. Строгие схемы гарантируют, что под-агенты возвращают результаты в заданном формате. Система поддерживает версионирование и кэширование, предотвращая потерю данных при прерывании сессии.

Применение и оптимизация рабочих процессов

  • Встроенный рабочий процесс 'Deep Research' автоматизирует многоступенчатый процесс поиска, состязательной проверки и синтеза информации.
  • Рабочие процессы наиболее эффективны при выполнении детерминированных задач, которые можно разделить на независимые части.
  • Применение рабочих процессов для миграции кодовой базы сократило время выполнения задачи с более чем часа до 21 минуты.
  • Второй мозг на базе Claude Code включает интеграцию с внешними сервисами, такими как Google Календарь и Notion через MCP.

Использование рабочих процессов требует оценки затрат токенов, так как параллельная работа нескольких под-агентов значительно увеличивает их расход. Ключевые сценарии использования включают сложную аналитику, исследовательскую деятельность и миграцию кодовой базы. Систему можно настроить как второй мозг, синхронизирующий данные между проектами, календарями и заметками для эффективного управления временем и задачами.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video