План по созданию полноценной операционной системы на базе Claude
AAI LABS
Computing/SoftwareInternet Technology
Transcript
00:00:00Представьте, что вы средневековый король. У вас есть целое королевство, которым нужно управлять, но вы бы предпочли делать
00:00:04абсолютно ничего, пока другие делают это за вас. Проблема в том, что вы не можете, потому что ваш персонал привык,
00:00:10что его кормят с ложечки. Вместо этого вам нужна система, которая управляет всем королевством самостоятельно,
00:00:15и именно этим стал Claude Code. С тех пор как Anthropic выпускает
00:00:19обновления, он перестал быть просто агентом по написанию кода и превратился в полноценную операционную систему,
00:00:25которая координирует всё на вашем компьютере. Но именно динамические рабочие процессы связывают всё это воедино.
00:00:30Так что прежде чем наш король отдаст свое королевство агенту, давайте посмотрим, как эта штука работает на самом деле.
00:00:35С тех пор как Anthropic начала предлагать новые способы траты токенов, что на самом деле является лишь их
00:00:40предлогом заработать побольше денег на Claude Code, он стал чем-то гораздо большим, чем просто агент по написанию кода. Это
00:00:44по сути полноценная операционная система. Подобно тому, как операционная система формирует основу для любой
00:00:50задачи и координирует работу на вашем компьютере, Claude Code теперь играет ту же роль. Он координирует
00:00:55и управляет всем, что вы делаете. Но прежде чем мы погрузимся в то, как динамические рабочие процессы завершают эту
00:01:00систему, вам нужно узнать о других компонентах. Единственная разница между
00:01:04компьютерной операционной системой и операционной системой Claude Code заключается в том, что вам не нужно так
00:01:08сильно напрягаться с настройкой, если только вы не используете Arch. И нет, вам не придется устанавливать
00:01:12кучу драйверов только для того, чтобы заработал микрофон, чтобы вы могли использовать голосовые подсказки, как бог вайба.
00:01:17И точно так же, как настоящая ОС, она состоит из нескольких частей. Каждая из них настолько важна, что
00:01:22система без нее неполноценна. В ОС ядро — это самый важный уровень, который формирует основу и
00:01:28управляет всеми операциями. Эквивалентом в Claude Code является файл Claude.md и ваши контекстные файлы.
00:01:33Мы уже делали подробное видео о том, как структурировать файл Claude.md, чтобы ваш агент
00:01:39работал максимально эффективно. Это важно здесь, потому что ядро — это движущая программа вашего агента.
00:01:44Если оно настроено неправильно, агент не сможет понять, чего на самом деле хочет ваш проект. И остальные
00:01:48части разваливаются вместе с ним. Примерно так же, как вся ваша жизнь разваливается, когда вы женитесь. Затем
00:01:53идут драйверы — части, которые позволяют системе взаимодействовать с внешними устройствами. Эквивалентом в
00:01:58Claude Code является MCP. Поэтому всякий раз, когда Claude нужен внешний инструмент, он обращается к нему через MCP и вызывает
00:02:04этот инструмент для выполнения работы. После этого идут повседневные программы, которые в Claude Code являются навыками и
00:02:09другими командами. Они содержат структурированные инструкции для повторяющихся задач, и вы можете вызывать их всякий раз,
00:02:14когда они вам нужны. Каждой ОС также нужен планировщик или cron-задача, которая выполняет определенное задание в запланированное время.
00:02:20Таким же образом Claude Code недавно добавил циклы и процедуры. По сути, это его cron-задачи,
00:02:25и они избавляют вас от необходимости следить за ним во время выполнения задачи. Они автоматизируют рутинную работу,
00:02:29которую вы иначе делали бы вручную. Поэтому даже если ваша система отключится, задачи будут продолжать выполняться сами по себе. Так что вы можете
00:02:34спокойно спать, зная, что ваше B2B SaaS-приложение, которым буквально никто не пользуется, находится под присмотром.
00:02:40И последнее, самое важное — это элемент, который связывает их все в
00:02:45полноценную операционную систему. Этот элемент — динамический рабочий процесс, новая функция, появившаяся в Opus
00:02:504.8. Вы, возможно, уже знаете, что у Claude Code есть динамические рабочие процессы. По сути, это еще одна попытка
00:02:55Anthropic упростить долго выполняющиеся задачи. Они работают как повторяющиеся инструкции, которые создают несколько
00:03:01агентов для выполнения задачи, для которой они были предназначены. Итак, чем это отличается от других архитектур, которые
00:03:06у вас уже есть? Чтобы сравнить их, первая и самая простая — это навыки. Навыки — это повторяющиеся инструкции для
00:03:11задач, требующих направляющих шагов. Но навык создается одним агентом, и этот же агент читает из него инструкции.
00:03:17Это просто направляет агента выполнять задачу, которую он уже знает, лучшим способом и не помогает с
00:03:22долго выполняющимися задачами. Это просто один агент, выполняющий всё дело. Затем идет команда “цель” (goal). Она
00:03:27итерирует к заранее определенной конечной цели, и агент выполняет цикл до тех пор, пока не будет достигнуто конечное условие. Это была
00:03:32исключительная попытка сделать долго выполняющиеся задачи лучше. Мы активно используем ее в наших собственных рабочих процессах
00:03:38с момента выпуска. И цель, и рабочий процесс могут координировать несколько агентов, но они разные.
00:03:43Ключевое различие между ними — детерминизм. Команда “цель” недетерминирована, что означает, что система решает,
00:03:48что делать дальше. Рабочий процесс детерминирован, и код точно решает, что произойдет. Вы создаете свой
00:03:54первый рабочий процесс, просто используя ключевое слово “workflow” (рабочий процесс). Из этого слова в вашей подсказке Claude определяет
00:03:59динамический рабочий процесс, необходимый для задачи, но это слово, которое мы используем постоянно в подсказках, поэтому вы можете
00:04:04подумать, что он будет срабатывать каждый раз. Однако это не так, если только подсказка на самом деле не выражает намерение
00:04:09создать его. Вот чем рабочие процессы на самом деле отличаются. Вместо обычного Markdown, который
00:04:14используется не обычный markdown, как у других, а создается код на JavaScript. Он находится в директории workflow внутри папки .Claude,
00:04:19и использует весь этот скрипт для управления всем процессом. Так что вместо того, чтобы ваш план находился в
00:04:23контекстном окне, этот план записывается в виде кода, определяющего, как под-агенты будут работать шаг за
00:04:28шагом. Он определяет строгие схемы, которые, по сути, являются формами для под-агентов, чтобы они выдавали
00:04:33результат в строгом формате. Каждый агент вызывается с подсказкой и формой, которую он должен заполнить. Он продолжает
00:04:39работать, пока результат не совпадет с этой схемой, а затем возвращает свои выводы. Вы вызываете их с помощью слеш-
00:04:44команды с именем рабочего процесса, затем можете передать ему план, который хотите протестировать под нагрузкой. Он работает в
00:04:49фоне, так что вы можете продолжать свою работу, дать ему другую подсказку, чтобы ваш менеджер проекта
00:04:53наконец-то почувствовал гордость за вашу ИИ-продуктивность. Чтобы проверить прогресс, вы просто запускаете команду
00:04:58“workflow”. Там вы можете увидеть каждый этап каждого рабочего процесса и все модели, которые вызвал каждый агент,
00:05:03и увидеть, сколько токенов потратила каждая задача. И если ваш сеанс закончится, пока рабочий процесс выполняется,
00:05:08вам не нужно беспокоиться о потере прогресса. Он сохраняется после того, как вы запустите команду “resume” (возобновить). Каждый рабочий процесс
00:05:14сохраняет свой собственный ID. И когда вы возобновляете, он извлекает всю кэшированную работу агента из памяти и продолжает
00:05:19с того места, где остановился. В отличие от моей бабушки, он не забывает оплатить счет за ИИ Claude и на самом деле
00:05:24помнит, что ему нужно сделать. Одна вещь, которую следует отметить перед использованием рабочего процесса. Поскольку это в режиме
00:05:29предварительного просмотра (research preview), динамические рабочие процессы потребляют гораздо больше токенов, чем типичный сеанс Claude Code. Это потому, что
00:05:35они используют несколько под-агентов под капотом, и каждый из них работает в своем отдельном контекстном окне. Вам нужно
00:05:40тщательно обдумать, когда они вам действительно нужны, иначе вы исчерпаете свой тарифный план в 200 долларов за несколько
00:05:45часов. Есть несколько ключевых метрик, которые подскажут, является ли рабочий процесс лучшим вариантом. Первый
00:05:50заключается в том, что задачу можно разделить на независимые единицы. Если агенты зависят от работы друг друга,
00:05:55они в конечном итоге просто ждут, и нет смысла создавать рабочий процесс, потому что вы теряете весь
00:06:00параллелизм. Именно поэтому, если задачи менее зависимы друг от друга, вы получаете лучший параллелизм и
00:06:05более быстрые результаты. Чему ваш стартап должен научиться, поскольку он все еще зависит от денег ваших родителей,
00:06:10чтобы выжить. Следующая причина использовать динамические рабочие процессы — если задаче требуется больше одного контекстного
00:06:15окна для выполнения, и её нужно разделить на части. Рабочие процессы используют несколько под-агентов, каждый со своим
00:06:21собственным контекстным окном, поэтому задача должна быть достаточно большой, чтобы действительно нуждаться в этих отдельных окнах. Иначе,
00:06:26вы будете просто тратить время и токены. Каждый под-агент работает в своем свежем контексте и возвращает
00:06:31только результат. Остальная часть его рассуждений остается в файле кода и никогда не попадает в основное контекстное окно,
00:06:36если только вам это не нужно. Следующая причина в том, что задачу стоит проверить. Используйте рабочий процесс, когда неправильный ответ
00:06:41достаточно дорог, чтобы требовать перекрестной проверки перед тем, как двигаться дальше. Это включает в себя такие вещи, как
00:06:46вопросы безопасности, претензии к ошибкам и миграции. Но эта проверка стоит дополнительных агентов, которые сжигают
00:06:52токены и время. Поэтому убедитесь, что задача действительно того стоит, и вы не просто создаете пять агентов
00:06:57потому, что недавно услышали от ИИ-техно-генерального директора, что больше токенов равно больше денег. Последняя причина в том, что
00:07:03ваша задача детерминирована. Рабочий процесс использует код для вызова агентов в фиксированной структуре. Так что если задача
00:07:09детерминирована, действуйте. Если задача недетерминирована и требует от агента оценки того, что
00:07:14будет следующей задачей во время выполнения, рабочие процессы не для этого. Итак, когда вы выбираете между “workflow” и
00:07:20“goal”, подумайте о форме задачи. Задача может быть широкой или глубокой. Широкая означает, что её можно разбить на множество
00:07:25подзадач, которые могут выполняться одновременно. Глубокая означает одну задачу за раз, шаг за шагом продвигаясь глубже в неё.
00:07:32Рабочий процесс широк, поэтому вместо того, чтобы идти глубже, он просто вызывает агентов и позволяет им итерировать. Для глубоких
00:07:37задач команда “goal” берет одну задачу за раз и не выполняет вещи параллельно так, как это делают рабочие процессы.
00:07:43Прибегайте к рабочему процессу только тогда, когда задача действительно подходит, чтобы вы не тратили токены.
00:07:48Claude Code уже поставляется со встроенным динамическим рабочим процессом под названием “Deep Research” (Глубокое исследование). Это, по сути,
00:07:53многоступенчатый исследовательский конвейер, который мы раньше создавали вручную с помощью нескольких контекстных файлов и Claude.md. Теперь
00:07:58это просто рабочий процесс, который вы можете вызвать из любого проекта. Это исследование является ключевой частью всей ОС, которую
00:08:04вы создаете. Оно гарантирует, что источники информации, лежащие в основе этой ОС, заслуживают доверия, чтобы ваша мама не могла скармливать вам
00:08:09фейковую информацию из своей бумерской группы в Facebook, а затем ругать вас, когда вы проверяете ее факты. Оно выполняется в пять
00:08:14частей, и каждая из них переходит в следующую. Сначала он ищет информацию, затем извлекает детали
00:08:19из найденных источников. После этого следует состязательная проверка для перекрестной проверки утверждений,
00:08:24и он синтезирует всё, что уцелело, в один финальный документ. Вы можете наблюдать за его работой из
00:08:29команды “workflows”, где каждый под-агент наследует свои инструменты от родителя, и это действительно очень интенсивно по
00:08:34токенам, так что он может сжечь весь ваш лимит в кратчайшие сроки. Этот запуск занял миллион токенов на
00:08:39небольшую тему. Помимо многоступенчатого исследования, вы можете создавать другие исследовательские рабочие процессы, которые становятся частью
00:08:45вашей исследовательской системы. Один из тех, что мы сделали для себя, исследует конкурентов, проверяет, как они работают,
00:08:49и находит их конкурентное преимущество. Это важная часть, если вы разработчик продукта. Вам
00:08:54нужно знать, как ваши конкуренты работают на рынке, чтобы вы могли создать что-то лучше.
00:08:59Этот разбит на четыре фазы, как и исследовательский рабочий процесс, и как только он завершается, он сообщает обратно
00:09:04результаты. Наш запуск использовал 679 000 токенов и 34 агента, и написал полный Markdown-отчет со своими выводами.
00:09:11Он также улучшает себя по мере работы. Когда он сталкивается с проблемой, он применяет исправление, поэтому в следующий раз, когда вы его запустите,
00:09:17он не столкнется с теми же проблемами, что и в первый раз. Отчет поставляется с четко определенными
00:09:21метриками сравнения и всеми его выводами, поэтому, когда вы создаете свой продукт, вы можете использовать его в качестве источника
00:09:26для анализа рынка перед запуском. Также, если вам нравится наш контент, подумайте о нажатии
00:09:30кнопки “хайп”, потому что это помогает нам создавать больше контента, подобного этому, и охватывать больше людей.
00:09:35Каждой операционной системе нужно её ядро, её драйверы и части, которые делают её полноценной. Вместе,
00:09:41они позволяют ей работать без вашего ввода. Одним из примеров такой системы является настройка “второго мозга”.
00:09:45Это определенно полезно, если ваш первый, как и наш, был полностью испорчен из-за того, что им не пользовались с тех пор,
00:09:50как наши устройства были благословлены LLM. Ядром этого второго мозга становится ваш Claude.MD,
00:09:55который содержит информацию о том, как навигировать по всей системе. Повседневные программы, повторяющиеся
00:10:01вещи — это ваши навыки. Они содержат инструкции для задач, которые вы выполняете снова и снова. Вот лучший
00:10:06способ настройки. Когда вы находитесь глубоко в долгом сеансе и понимаете, что это то, что вы будете делать часто,
00:10:11просто попросите Claude объединить знания из этого сеанса в навык. Память этой ОС — это все
00:10:16файлы, которые вы создаете и поддерживаете в своем хранилище. Они записывают то, что вы делаете и как вы это делаете. Это
00:10:21значит, что он знает о вас больше, чем вы сами, и они дают Claude контекст обо всем, над чем вы
00:10:25работаете. Нам часто нужно, чтобы второй мозг достигал внешних источников, поэтому мы настроили
00:10:29MCP Google Календаря и Notion. Таким образом, он может получать доступ к файлам проектов в Notion и синхронизировать данные,
00:10:35читать расписание в календаре и создавать и обновлять записи, чтобы он мог вписать немного времени на “потрогать траву”
00:10:41между вашим и без того занятым графиком. Мы задокументировали точные форматы, которым он должен следовать в файле Claude.MD,
00:10:46и самая важная часть — это создание рабочих процессов для вашей настройки. Они позволяют параллелить
00:10:51ваши повторяющиеся задачи и передавать их под-агентам. Утренний рабочий процесс, который мы создали, запускает под-агентов,
00:10:57чтобы собрать информацию из нескольких источников и вернуть краткую сводку для начала нашего дня. Как только всё это настроено,
00:11:02вы просто даете ему подсказку. Он загружает нужный навык и контекст, создает файлы в нужных местах
00:11:07и самостоятельно подключает информацию к соответствующим частям. Если вы пользуетесь вторым мозгом
00:11:12уже некоторое время, вам следует создать рабочий процесс аудита. Он проверяет битые ссылки, обнаруживает каждую проблему
00:11:17в настройке и сообщает о них. Оттуда вы можете запустить исправления и поддерживать свой второй мозг в отличном
00:11:22состоянии, но зная, какой вы человек, к следующей неделе вы также будете оплачивать его сеансы терапии.
00:11:27Подобно тому, как вы можете настроить целую операционную систему для некодирующих проектов, вы можете сделать то же самое для
00:11:32ваших проектов по программированию. Вы настраиваете свой claude.md в качестве ядра и помещаете всю информацию о проекте
00:11:37внутри него. Вы настраиваете агентов для вашего проекта, которые действуют как ваши повседневные программы.
00:11:42Вы также настраиваете хуки для разных случаев, например, форматирование файла после того, как агент заканчивает редактирование
00:11:46его, так что между тем чёртовым беспорядком, который вы называете своими отношениями и кодом, по крайней мере одна вещь
00:11:51организована. Вы создаете навыки для разных задач, например, добавление новой конечной точки. Таким образом, каждая конечная точка
00:11:56следует точно той схеме, которую вы хотите, и вы можете создавать рабочие процессы для таких вещей, как проверка изменений перед
00:12:01отправкой, миграция кодовой базы или базы данных и выполнение сквозных тестов для подтверждения того, что все приложение
00:12:07работает. Вместо того чтобы вы просыпались от звонка менеджера в 2 часа ночи из-за того, что ваш продакшн снова упал, контекстом
00:12:12для этой ОС становятся файлы в папке docs и сам код. Рабочие процессы исключительно
00:12:17полезны для миграции проектов. Вы можете создать один, который конвертирует весь ваш проект с одной библиотеки на
00:12:22другую, и позволить отдельным агентам обрабатывать конвертацию. Мы тестировали это раньше, и без
00:12:27рабочего процесса это занимало больше часа, но с рабочим процессом это заняло всего 21 минуту. Так что время, сэкономленное
00:12:32с помощью рабочих процессов, может пойти на более важные вещи, такие как прокрутка неуместных дипфейков Дарио.
00:12:37Вот как наша операционная система расширяется до сценариев использования программирования, поэтому, когда вы создаете проекты,
00:12:43вам не нужно обрабатывать всё вручную. Вы позволяете операционной системе делать это за вас. Если вы хотите
00:12:47основать следующую большую AI B2B SaaS компанию, но не знаете, с чего начать, вам стоит быть в AI Labs Pro.
00:12:53Там вы найдете рабочие процессы, использованные в этом видео, вместе со всеми другими ресурсами,
00:12:57руководствами и вкусностями, которые мы собрали. Вы также сможете встретить кучу единомышленников-нердов,
00:13:01включая нашу команду. Ссылка в описании, и вы можете проверить это.
00:13:05Это подводит нас к концу этого видео. Если вы хотите поддержать канал и помочь нам продолжать создавать
00:13:09такие видео, вы можете сделать это, используя кнопку “суперспасибо” внизу. Как всегда, спасибо за
00:13:14просмотр, и увидимся в следующем.
Community Posts
No posts yet. Be the first to write about this video!
Write about this video