ADLC: новый жизненный цикл ИИ-программирования в Claude Code
AAI LABS
Computing/SoftwareManagementInternet Technology
Transcript
00:00:00Вы, вероятно, уже не раз слышали, что разработка ПО изменилась,
00:00:03но простое внедрение новых инструментов затронуло лишь верхушку айсберга,
00:00:06потому что создаваемые сегодня системы ведут себя совсем не так, как старый софт.
00:00:10Следовательно, фреймворки, на которых строились компании, тоже должны были измениться,
00:00:14ведь если продолжать опираться на старые процессы, вы столкнетесь с проблемами, которые они не способны решить.
00:00:18И чтобы подстроиться под этот меняющийся ландшафт,
00:00:21в сообществе разработчиков появился новый фреймворк, созданный с прицелом на агентов.
00:00:25И к концу этого видео мы подробно разберем этот новый фреймворк жизненного цикла
00:00:29и объясним, почему вам нужно его внедрить.
00:00:31Многие годы разработка программного обеспечения велась по методологии SDLC.
00:00:35Жизненный цикл разработки ПО — это структурированный процесс, используемый десятилетиями,
00:00:39включающий такие этапы, как проектирование, разработка, тестирование, развертывание, поддержка и сопровождение.
00:00:45Основная идея здесь в том, что ПО должно разрабатываться с учётом бизнес-целей и требований пользователей,
00:00:51где результат каждого этапа становится входными данными для следующего.
00:00:54Но это работало только до тех пор, пока в сферу технологий не вошел ИИ.
00:00:57С тех пор как ИИ начал набирать обороты, первое, что он стал вытеснять — это написание кода.
00:01:02До ИИ разработка представляла собой систему многократного написания кода,
00:01:06зачастую рутинный процесс объединения фрагментов и логики из разных мест для создания системы, решающей задачу.
00:01:12По мере улучшения моделей и доминирования в индустрии таких инструментов, как Claude Code и Cursor,
00:01:18традиционный SDLC сам по себе перестал справляться.
00:01:20Он не может поддерживать себя сам и должен измениться, чтобы приносить реальную пользу.
00:01:24Именно поэтому был разработан Агентный жизненный цикл разработки, или ADLC.
00:01:28Он преодолевает разрыв между SDLC и текущим технологическим пространством.
00:01:32ADLC потребовался потому, что в системах, использующих SDLC,
00:01:36поведение системы было известно еще на этапе планирования, и существовали способы его проверить.
00:01:41Проще говоря, SDLC относится к программному обеспечению как к статичному объекту, а ADLC — как к живой системе.
00:01:47Поскольку ИИ-агенты непредсказуемы и развиваются сами, рассуждая и адаптируя задачи
00:01:53к среде, в которой находятся, их трудно оценивать по тем же метрикам, что и традиционный софт.
00:01:59Главная причина создания ADLC — это неделимость и недетерминированность ИИ-агента в продакшене.
00:02:05С ИИ-агентами происходит постоянное обучение и непрерывная разработка,
00:02:09и вы не можете заранее определить, как именно будет выглядеть результат работы агента.
00:02:12Когда вы работаете с ИИ, принимаемые решения зависят от промпта, контекста, моделей
00:02:16и всех внешних инструментов, которые вы подключили.
00:02:18Модели сами по себе все еще непредсказуемы, поэтому мы не можем со 100% точностью определить, что вернет промпт.
00:02:25Из-за этого метрики успеха здесь принципиально отличаются от тех, что используются в SDLC.
00:02:29ADLC включает 7 фаз, и каждая фаза так или иначе сопоставляется с конкретной фазой SDLC.
00:02:36Работаете ли вы над агентной системой или нет, первым шагом всегда остается планирование.
00:02:41Меняется лишь то, как именно вы это делаете.
00:02:43Для агентов нельзя планировать так же, как для неагентных систем,
00:02:46потому что, в отличие от традиционных систем, поток логики здесь устроен иначе.
00:02:51Поэтому первая фаза ADLC — подготовка и гипотеза —
00:02:54направлена на формирование обоснованного понимания проблемы перед выбором архитектуры или модели.
00:02:59Когда дело касается агентов, нужно понимать, как пользователи будут взаимодействовать с системой,
00:03:04и координировать действия со всеми заинтересованными сторонами, чтобы найти сбои в рабочих процессах
00:03:07и определить, где требуется повторяющийся ручной труд, ведь именно эту задачу и будет решать агент.
00:03:12Затем вы анализируете существующие рабочие процессы и регламенты, чтобы увидеть текущее положение дел,
00:03:16и как только картина прояснится, вы формируете проверяемые гипотезы о том, где агенты помогут или автоматизируют процесс.
00:03:22Если мы полностью пропустим эту фазу, то в итоге автоматизируем не те задачи,
00:03:26и вместо исправления проблемы можем сделать только хуже.
00:03:28Главное отличие от SDLC здесь заключается в поведении.
00:03:31В SDLC поведение предсказуемо, так как одни и те же входные данные всегда дают одинаковый результат.
00:03:37Но ADLC носит вероятностный характер из-за участия моделей,
00:03:40и одинаковые входные данные могут не привести к абсолютно идентичному результату.
00:03:43Помня об этом, первым шагом вам нужно включить режим планирования
00:03:47и использовать любого доступного агента, чтобы распланировать поведение разрабатываемого агента, а не его реализацию.
00:03:52Дайте ему указание не думать о коде, а вместо этого разметить весь рабочий процесс:
00:03:56как агенты взаимодействуют с пользователями, что может пойти не так, какие могут возникнуть накладные расходы
00:04:00и все остальные допущения о системе.
00:04:03Таким образом, процесс создания агента начнется с базовых допущений,
00:04:06которые станут лучшим ориентиром, чем мгновенный переход к планированию архитектуры.
00:04:10Сразу после первоначального планирования идет следующий уровень,
00:04:13где вы надлежащим образом определяете рамки и саму проблему.
00:04:16Это соответствует фазе анализа или технико-экономического обоснования в SDLC,
00:04:20где вы раньше анализировали бизнес-требования и целесообразность реализации.
00:04:25Эта фаза ADLC сводится к определению важных процессов и роли ИИ в их решении,
00:04:31обозначению ограничений и технических границ,
00:04:33а также к четкому определению бизнес- и технических KPI наперед, таких как время, стоимость, задержка и реализуемость.
00:04:39На этом этапе вы также определяете компромиссы, понимая, какие факторы приемлемы, а какие нет.
00:04:44Но самая важная часть этой фазы — правильное построение модели распределения ответственности между человеком и агентом,
00:04:49потому что это создает структуру подотчетности.
00:04:52Человек по-прежнему должен их проверять, так как мы не можем доверять агенту все решения.
00:04:56К концу этой фазы у вас будет надлежащая документация, где шаги рабочего процесса четко определены с ключевыми KPI,
00:05:02а модель ответственности человека и агента прописана максимально ясно.
00:05:05Это важно, потому что в случае любого сбоя нельзя винить исключительно модель.
00:05:09Ответственность в конечном итоге должна оставаться на людях.
00:05:12Раньше такое планирование человеческой ответственности не требовалось, поскольку ИИ не использовался.
00:05:17Оно определяет границы автономии агента, и если пропустить этот шаг,
00:05:21вы рискуете комплаенсом и подотчетностью в продакшене.
00:05:24Чтобы сделать это с агентами, вы снова используете режим планирования, поручая ему расписать процессы, задержки, системные проблемы,
00:05:30все функции, которые должны быть в архитектуре, и то, как могут выглядеть сбои.
00:05:34Когда все это четко сформулировано, агент понимает правильные рамки для итераций в процессе сборки.
00:05:39Когда рамки и высокоуровневые функции определены, пора переходить к фазе проектирования.
00:05:43На этом этапе мы определяем системную архитектуру для самого агента.
00:05:47Здесь вы решаете, какому паттерну будет следовать агент: ReAct, Plan-and-Act, мультиагентная структура или любой другой подход.
00:05:54Затем вы планируете поток данных из одной точки в другую, и это становится еще более критичным при участии нескольких агентов.
00:06:00Агент должен получать правильные данные, иначе он создаст проблемы вместо того, чтобы помогать.
00:06:05Вы также планируете структуру затрат, например, токеномику, функции редактирования контекста, сжатие,
00:06:10и оцениваете, какова будет стоимость развертывания этого агента в продакшене,
00:06:14и что произойдет, когда он начнет обрабатывать запросы множества пользователей.
00:06:17Именно на этом этапе вы выбираете, какие модели использовать, какой оркестрационный фреймворк взять,
00:06:23базу данных и все остальные технологии. Здесь же вы определяете, что будет считаться успехом
00:06:28еще до написания кода, чтобы вы могли создавать агента через TDD.
00:06:32До того как ваша система заработает в реальном времени, вы уже учли компромиссы в задержке, точности, галлюцинациях и подобных проблемах.
00:06:38На этой фазе также необходим режим планирования вашего агента.
00:06:41Вы даете ему промпты для составления комплексного проекта, охватывающего архитектуру агента, потоки данных, модель затрат
00:06:46и общую техническую структуру, чтобы вы переходили к следующему шагу с конкретным планом.
00:06:51После завершения первоначальных планов следующим шагом идет симуляция и подтверждение ценности.
00:06:55Здесь вы используете реальные данные для проверки допущений, сделанных на предыдущих этапах.
00:06:59Вы создаете прототипы, чтобы понять, стоит ли двигаться дальше в разработке этого агента.
00:07:04По сути, именно здесь вы решаете, нужно ли вообще разрабатывать агента, поскольку на этом этапе цена ошибки гораздо ниже.
00:07:10Поэтому основные действия здесь включают подготовку датасета или эталона (ground truth) для поведенческого тестирования,
00:07:15создание прототипов для проверки задокументированных ранее высокорисковых допущений,
00:07:19а также валидацию качества данных, уровня галлюцинаций, точности, качества ответов и бенчмарков.
00:07:25Вы также возвращаетесь к исходной гипотезе, чтобы определить, обеспечит ли она возврат инвестиций.
00:07:30Результатом работы становятся четко измеренные базовые показатели производительности и затрат,
00:07:33наряду с упомянутым ранее эталонным документом, который служит базой для регрессионного тестирования и тонкой настройки моделей.
00:07:40Эта фаза выступает в роли квалификационного барьера.
00:07:42Если ваши результаты позволяют пройти дальше, вы можете продолжать работу над агентом.
00:07:46Если нет — сборка считается неудачной, и обнаружить это на ранней стадии гораздо лучше,
00:07:50потому что если бы эта вещь попала в продакшен, ущерб был бы куда более серьезным.
00:07:54Для этого вы поручаете своему ИИ-агенту создать первый прототип, чтобы протестировать его на соответствие всем планам.
00:08:00Но перед тем как двигаться дальше, пара слов от нашего спонсора — Softr.
00:08:04Инструменты вайб-кодинга хороши для генерации интерфейса, но как только вам нужна реальная аутентификация,
00:08:08роли пользователей, разрешения или база данных, которая действительно масштабируется, все разваливается, и вы снова пишете код вручную.
00:08:14Softr — это конструктор ИИ-приложений, который справляется со всем этим по одному промпту.
00:08:18Вы описываете то, что вам нужно, простым языком, и ИИ-конструктор генерирует весь стек, базу данных, страницы, навигацию, логин и права доступа на основе ролей за один раз.
00:08:28Это не просто прототипы страниц, они действительно работают.
00:08:30Вы можете просмотреть приложение, проверить, что видит каждая роль пользователя, и когда вы нажимаете кнопку публикации, ваше приложение выходит в сеть с готовым хостингом, группами пользователей, безопасностью корпоративного уровня и контролем доступа.
00:08:40И вам не нужен разработчик для его поддержки.
00:08:42Все сделано визуально, так что вы можете сами обновлять рабочие процессы, управлять пользователями и добавлять функции.
00:08:47Настоящая стоимость софта заключается не в его создании, а в поддержке, и именно эту проблему решает Softr.
00:08:52Получите бесплатные ИИ-кредиты, перейдя по ссылке в описании, и приступайте к работе.
00:08:57На этом этап планирования завершается, и мы переходим к части, к которой многие прыгают сразу — к реализации.
00:09:03Предыдущие шаги очень важны, потому что если вы сделали их правильно, вы не столкнетесь с проблемами, которые большинство людей получают из-за пропуска этих фаз.
00:09:11Итак, именно сейчас вы фактически разрабатываете своего агента, строите базовую логику и оркеструете свой рабочий процесс разработки.
00:09:16И здесь вы видите одно из самых четких разделений между SDLC и ADLC.
00:09:20В SDLC логика живет в коде, конфигурации и сторонних зависимостях.
00:09:25В ADLC эта логика распределена по коду, промптам, моделям, инструментам и внешним сервисам.
00:09:30Таким образом, вы больше не управляете просто софтом, вы управляете всеми этими уровнями вместе, и любой из них может изменить поведение системы.
00:09:38Если вам нужно разрабатывать мультиагентные системы, один из способов оркестровки ваших рабочих процессов — это новый режим работы с агентами (agents view) в Claude Code.
00:09:44Используя agents view, вы можете делегировать задачи гораздо лучше, чем при обычном использовании Claude.
00:09:49Потому что вместо управления разными сессиями Claude Code вы управляете единым оркестрационным слоем и даете промпты главному менеджеру агентов для координации всех агентов через него.
00:09:57На этом этапе вы интегрируете такие инструменты, как MCP и API.
00:10:01Например, если вы строите личного ассистента, вы знаете, что ему понадобятся такие вещи, как Google Calendar MCP, Gmail MCP и, возможно, Notion MCP.
00:10:09И самое важное здесь — это управление контекстом.
00:10:11Потому что как только вы создаете агента для продакшена, это становится одним из самых критических аспектов.
00:10:16Даже самые большие окна контекста, доступные сейчас, например, окна в 1 миллион токенов в Gemini и Opus, все еще требуют осторожного обращения.
00:10:24Вы должны убедиться, что агент сохраняет правильную память и избегает деградации (засорения) контекста.
00:10:28Потому что если он окажется перегружен избыточной информацией, его внимание рассеется, и результаты ухудшатся.
00:10:34На этом этапе вам также необходимо проводить тестирование со стороны разработчика, чтобы гарантировать согласованность поведения после каждого изменения путем ручной проверки соответствия агента требованиям.
00:10:44Разработка и валидация не разделены в агентных системах.
00:10:48Вы не можете двигаться дальше без постоянного тестирования, так как даже небольшое изменение может оказать огромное влияние на весь рабочий процесс.
00:10:54Поэтому вам нужна валидация уровня разработчика непосредственно в процессе создания агента бок о бок, вместо того чтобы полагаться только на отдельный этап тестирования позже.
00:11:01После того как вы закончили построение системы, тестирование становится следующей фазой.
00:11:05Как упоминалось ранее, тестирование должно быть непрерывным во время сборки, но когда система готова, вы тестируете ее в условиях, близких к продакшену, а не как отдельные компоненты.
00:11:14Это этап, на котором вы выполняете интеграционное тестирование.
00:11:16Вы также проводите пользовательское приемочное тестирование, где собираете отзывы от реальных пользователей и внедряете их обратно в систему.
00:11:24Вы тестируете систему по множеству факторов, таких как предвзятость, комплаенс, производительность и другие аспекты рисков, чтобы гарантировать безопасность релиза перед выходом.
00:11:32И именно здесь метрики успеха полностью меняются.
00:11:35В SDLC вы измеряли функциональную корректность тестами, которые просто проходили или проваливались.
00:11:40В ADLC вы измеряете распределение точности, уровень галлюцинаций и стоимость одного результата, потому что ни один из этих параметров нельзя свести к однозначному «успех» или «провал».
00:11:48Сама парадигма тестирования движется вместе с этим.
00:11:50В SDLC предопределенные тесты валидировали известные пути выполнения кода.
00:11:54В ADLC это превращается в непрерывную оценку рассуждений, безопасности и использования инструментов, потому что агент не проходит один и тот же путь дважды одинаково.
00:12:02Существует множество фреймворков оценки, таких как RAGAS и DEEPVAL, но главное, что подтверждает корректность — это соответствие ваших данных метрикам, определенным ранее.
00:12:12И есть несколько способов протестировать агентную систему, включая функциональное, нефункциональное, структурное и нагрузочное тестирование.
00:12:18Каждое из них должно проводиться тщательно, часто с использованием самих агентных систем, чтобы вовремя выявлять и устранять пограничные случаи до того, как они попадут в продакшен.
00:12:27Также, если вам нравится наш контент, поддержите нас лайком, ведь это помогает нам создавать больше подобных видео и охватывать больше людей.
00:12:34Когда ваша система готова, пришло время развернуть ее и сделать доступной для реального мира.
00:12:39Вы не просто развертываете ее напрямую и забываете, потому что с агентными системами связано гораздо больше нюансов.
00:12:44Для обычной системы развертывание обычно означает отправку в продакшен и мониторинг работоспособности системы.
00:12:49Для агентных систем все совсем иначе, и именно здесь меняется сам смысл развертывания.
00:12:54В SDLC развертывание было концом разработки и началом фазы стабильной эксплуатации, точкой перехода софта в режим устойчивой работы.
00:13:02В ADLC развертывание — это начало активного мониторинга и контроля, обусловленного обновлениями моделей, дрейфом контекста и изменениями среды, которые продолжают происходить.
00:13:11Так что, даже если разработка завершена, этот этап еще более критичен, потому что теперь вам нужно активно отслеживать поведенческие и системные метрики.
00:13:19Вам также нужны правила алертинга, которые постоянно следят за качеством, безопасностью и производительностью, чтобы выявлять проблемы до того, как они превратятся в масштабные сбои в продакшене.
00:13:28Развертывание — это, по сути, контролируемая активация с непрерывным наблюдением за тем, как реальные пользователи взаимодействуют с системой.
00:13:34Вместо того чтобы фокусироваться только на работоспособности инфраструктуры, вы сосредотачиваетесь на поведенческих факторах, чтобы ловить проблемы на ранних стадиях.
00:13:41На практике вы сначала открываете систему для ограниченной группы пользователей и позволяете им использовать ее в реальных условиях.
00:13:46Затем вы наблюдаете за тем, как агентная система реагирует с течением времени, прежде чем постепенно развернуть ее для всех остальных.
00:13:52После прохождения всех этапов реализация превращается в непрерывный цикл поддержки, постоянного обучения и роста.
00:13:58Это важный этап, поскольку он позволяет поддерживать точность агента и его соответствие реальным потребностям.
00:14:03В традиционных системах петли обратной связи относительно просты.
00:14:06Пользователь сообщает о баге, разработчик изучает его и исправляет.
00:14:10С агентными системами все иначе, так как они основаны на процессе непрерывного улучшения, который не прекращается ни на минуту.
00:14:16Цикл постоянно совершенствует модель, и все негативные сигналы поступают обратно, помогая улучшать поведение со временем.
00:14:22Обычно это делается через элементы интерфейса вроде кнопок «палец вверх» и «палец вниз», чтобы зафиксировать реакцию пользователя на ответ.
00:14:29Многие продакшен-системы уже используют похожие механизмы, такие как выбор между несколькими вариантами вывода или ранжирование ответов, как в ChatGPT или системах фидбека в Claude.
00:14:39Эти сигналы затем направляются обратно в агентную систему, позволяя ей учиться и итерировать для достижения лучшей производительности.
00:14:44Также происходит периодическое обновление источников данных и эмбеддингов, чтобы система оставалась актуальной и не страдала от устаревшей информации.
00:14:52Необходимо постоянно контролировать выравнивание (alignment), чтобы безопасность и гардрейлы оставались эффективными против любых типов промптов, включая такие риски, как промпт-инъекции.
00:15:00Ключевыми переменными здесь являются непрерывное управление затратами, отслеживание качества, бэклог улучшений продукта и обновление моделей, — все это нужно постоянно поддерживать для стабильности, безопасности и работоспособности системы.
00:15:11На этом наше видео подходит к концу.
00:15:13Если вы хотите поддержать канал и помочь нам продолжать делать подобные ролики, вы можете сделать это с помощью кнопки «Суперспасибо» ниже.
00:15:20Как обычно, спасибо за просмотр, и увидимся в следующем видео.
Community Posts
No posts yet. Be the first to write about this video!
Write about this video