Программный агент «PI» — это гораздо больше, чем просто очередной крутой ИИ-кодер!

MMaximilian Schwarzmüller
Computing/SoftwareSmall Business/StartupsStocksInternet Technology

Transcript

00:00:00Мне нужно рассказать об еще одном кодинг-агенте. И я знаю, знаю, я уже делал видео
00:00:07и курсы по Claude Code и Codex, потому что они оба потрясающие, и у вас также есть,
00:00:15конечно, Cursor и GitHub Copilot — по ним у меня тоже есть курс, ссылки найдете ниже. Но сегодня я
00:00:21хочу поговорить об агенте Pi, в том числе потому, что это гораздо больше, чем просто инструмент для кодинга.
00:00:31Опять же, все эти инструменты приведут вас к результату. Здесь нет правильного или неправильного выбора.
00:00:38И я прекрасно понимаю, что все это может напоминать войны фреймворков, те самые войны JavaScript-фреймворков 2019 года,
00:00:46когда каждую неделю выходил новый блестящий инструмент. И да, в какой-то степени всё так и есть,
00:00:53наверное. Но с другой стороны, как и тогда, если быть честными, не так уж важно,
00:01:00какой именно вы выберете. Это видео не спонсировано, и у меня нет курса по этому инструменту.
00:01:06Я просто искренне считаю, что кодинг-агент Pi — это инструмент, к которому вам стоит присмотреться.
00:01:13В отличие от Codex, Claude Code или Open Code, например, здесь нет
00:01:20привычной подписки. Тот же Open Code можно использовать без подписки, подключив
00:01:27другую подписку, например, от Codex, или с оплатой по факту использования. В случае с Pi
00:01:32у вас есть только вариант оплаты по факту или использование сторонней подписки. Например,
00:01:39я установил его в систему и использую со своей подпиской Codex, которую
00:01:45можно применять в приложении Codex или CLI, но здесь она тоже работает. Думаю, его также можно
00:01:50использовать с подпиской Anthropic (Claude Code), но вы, возможно, слышали, что им это
00:01:55не нравится, и, насколько я знаю, за это могут забанить аккаунт. Так что же такого особенного
00:02:00в этом Pi? Зачем использовать его вместо обычного Codex CLI? Есть пара причин. Во-первых,
00:02:08Pi — этот агент невероятно легкий и простой в хорошем смысле этого слова. У него минималистичный системный промпт,
00:02:20и он поставляется всего с несколькими инструментами. По сути, если ничего не изменилось,
00:02:28у него есть только чтение, запись, редактирование и инструмент bash. И bash, конечно же, самый мощный,
00:02:36потому что если у вас есть bash, у вас есть доступ ко всему: вы можете
00:02:44управлять всей своей системой, всей машиной через одну лишь командную строку,
00:02:50ведь оттуда можно вызывать любые другие инструменты. И как оказалось,
00:02:55как я уже упоминал в другом видео, CLI сейчас — это основное, что стоит
00:03:03предоставлять кодинг-агентам, потому что они отлично справляются с командной строкой, даже
00:03:10с той, которую раньше не видели. И разумеется, через CLI или сторонние утилиты
00:03:15ваши агенты могут делать на компьютере массу вещей. Они могут отправлять
00:03:21HTTP-запросы, запускать скрипты, парсить JSON-данные. Они могут делать всё что угодно.
00:03:29И в этом заключается философия Pi: быть минималистичным, но дать доступ
00:03:35к самому мощному инструменту — bash, чтобы он мог выполнять любые задачи. В сочетании с
00:03:41очень лаконичным встроенным системным промптом вы получаете агента, чье окно контекста
00:03:50не замусорено и который обладает гибкостью делать практически всё, что вам нужно.
00:03:57Их главная идея в том, что вместо перегрузки функциями «из коробки» вы получаете
00:04:04максимально расширяемого агента. Можно устанавливать так называемые расширения. Мы к этому еще вернемся.
00:04:10Вы можете использовать навыки агента (agent skills). Я говорю об официальном стандарте — это своего рода стандарт,
00:04:17хотя разные инструменты внедряют его по-разному. Но основная идея навыков в том,
00:04:24что у вас есть директории с навыками и MD-файлы, в которых содержатся промпты или дополнительный контекст.
00:04:31Они загружаются не сразу, а «лениво», то есть по запросу, в зависимости от того,
00:04:39какую задачу сейчас выполняет агент. Например, в моей текущей сессии Pi
00:04:46загружено несколько навыков: некоторые глобальные, с которыми я экспериментировал,
00:04:53и те, что реально полезны, например, навык исследования кода (code research). И если мы
00:04:59взглянем на него, то увидим, что это просто файл markdown с названием и описанием. Описание,
00:05:03конечно, критически важно для таких навыков, так как именно на его основе агент решает,
00:05:08нужно ли активировать навык. Он загружает остальную часть файла только если решит, что
00:05:16навык релевантен текущей задаче, исходя из названия и описания. И далее,
00:05:21это просто дополнительный контекст, промпт, где в данном случае для навыка исследования кода
00:05:26я объясняю агенту (будь то Pi или Codex, если он загрузит этот навык),
00:05:32как именно проводить исследование. Я указываю, что нужно использовать утилиту MC Porter
00:05:38Петера Штайнбергера для доступа к другим MCP-серверам, например, deep wiki MCP,
00:05:46который позволяет изучать GitHub-репозитории, и перечисляю другие инструменты
00:05:51для работы. И тут важный момент касательно MCP: у самого агента Pi
00:05:58нет встроенной поддержки MCP. Причина в том, что MCP имеют тенденцию сильно забивать
00:06:05окно контекста, так как ИИ нужно передать много информации о доступных инструментах
00:06:10и ресурсах, чтобы он о них знал. Команда или человек,
00:06:18стоящий за Pi, этого не хочет. Такова их позиция. И её разделяют многие,
00:06:23включая меня. Я знаю, что есть решения вроде MCP search, но тем не менее,
00:06:28здесь поддержки MCP нет. Но она и не нужна, если использовать что-то вроде MC Porter.
00:06:35Под «использованием» я имею в виду, что объясняю ИИ, как вызывать MC Porter на лету,
00:06:43когда ему нужно поработать с MCP, чтобы не загружать всё это заранее
00:06:49в окно контекста. Понимаете идею? Всё очень лаконично. И в этом
00:06:54вся суть кодинг-агента Pi. Но есть еще одна крутая вещь,
00:07:01о которой я упоминал — это расширяемость. И дело не только в навыках. В первую очередь это,
00:07:08как мне кажется, расширения. Идея в том, что в Pi есть нативная поддержка
00:07:16для расширения функционала, возможность «подключиться» к разным частям агента и этапам
00:07:22агентского цикла. Это позволяет настраивать работу агента под себя,
00:07:30добавляя любые возможности. При желании можно даже добавить ту же поддержку MCP.
00:07:36У меня самого настроено несколько расширений. Например, через расширение я добавил
00:07:41режим планирования. Его нет по умолчанию, но система настолько гибкая,
00:07:47что можно добавить модуль, который блокирует агенту использование инструментов записи или правки,
00:07:53пока он в режиме плана. Это расширение позволяет настроить горячую клавишу для переключения
00:08:00в этот режим. Оно позволяет обновить интерфейс терминала, чтобы показать пользователю, что активен план.
00:08:07Также можно добавить слэш-команды, например /plan, которая переключает режим и
00:08:14выводит индикатор. Теперь определенные инструменты заблокированы, пока я не выйду из режима.
00:08:20Вот такие вещи можно делать с помощью расширений. Также существует
00:08:24своего рода официальный маркетплейс расширений, потому что в Pi заложена идея,
00:08:31что вы можете упаковать свои расширения или навыки и поделиться ими. А другие люди,
00:08:36мы с вами, можем устанавливать эти пакеты, используя чужие наработки.
00:08:40Есть такие вещи, как субагенты, которых можно добавить через пакет расширения,
00:08:47или пакет веб-доступа — отличная штука, дающая агенту дополнительные инструменты
00:08:54для эффективного поиска в сети и извлечения контента сайтов. В общем, идея ясна: система
00:09:00невероятно расширяема. Вы получаете минимальное ядро, которое можно достраивать как угодно,
00:09:06добавляя любые навыки и расширения. И это само по себе очень интересно, потому что,
00:09:12конечно, в Claude Code, Codex и других инструментах вы получаете мощные готовые функции,
00:09:20но они менее гибкие. С Pi всё наоборот.
00:09:28Есть минимальная база, которую можно превратить во что угодно. Причем сделать это
00:09:33можно как глобально, так и для конкретного проекта, потому что все навыки и расширения
00:09:39устанавливаются в обоих режимах. Это делает инструмент универсальным. Вот почему стоит
00:09:46к нему присмотреться. Я использовал его последние недели параллельно с Claude Code и Codex,
00:09:51постоянно переключаясь, так как инструменты быстро развиваются, и мне очень нравится Pi. И вот
00:09:59самое интересное: вы не ограничены использованием Pi только для программирования.
00:10:08Да, он называется кодинг-агентом, и это его основное предназначение, для которого
00:10:15я его и использую. Но этим всё не ограничивается. Например, я установил пакет
00:10:21веб-доступа и подключил свой API-ключ Gemini, чтобы дать агенту Pi полный доступ
00:10:30к поиску информации через Gemini API. Благодаря этому я могу запустить агента вне
00:10:35какого-либо проекта, вне кодинга, и дать ему подобную задачу: «Проведи исследование
00:10:41акций Apple и Nvidia за последние семь дней, узнай их цены и проанализируй
00:10:46их динамику за неделю». И он пойдет это делать. Он сам найдет способ,
00:10:55как получить данные о ценах этих акций. Сделает поиск в сети, возможно, посетит
00:11:04страницы для инвесторов — увидим. Затем он, конечно, проведет расчеты, создав
00:11:12временный скрипт или что-то подобное. Посмотрим. Вот, например, он активировал навык веб-поиска,
00:11:18который я добавил и где прописал детали того, как именно искать информацию. И он пробует это сделать.
00:11:23Тут возникла проблема, так как у меня не установлен Python или исполняемый файл называется
00:11:29иначе (нужен python3), и он сам это понял. Затем он написал
00:11:34скрипт на Python для извлечения данных с сайта, создал временный файл,
00:11:40выполнил его и, похоже, получил цены акций. После этого он, скорее всего,
00:11:47напишет еще один небольшой скрипт для проведения вычислений и расчета
00:11:55изменения стоимости акций. Спустя некоторое время, проведя кучу исследований,
00:12:01включая анализ новостей, он завершает работу. И выдает мне данные за семь дней по Apple
00:12:08и Nvidia, показывая динамику их акций. Выводит сводку по результатам
00:12:14и делает текстовый анализ, суммируя итоги в виде своего рода
00:12:23отчета для руководства. И всё это сделал кодинг-агент Pi с теми расширениями
00:12:29и навыками, что я ему дал, и больше ничего. Никакого кода от меня, никаких указаний,
00:12:36какие сайты посещать. Он всё сделал сам. Безусловно, это можно было сделать
00:12:43и в Claude Code или Codex, ведь всё это — ИИ-агенты с набором инструментов для работы.
00:12:50И хотя они созданы в основном для кодинга, их, конечно, можно «эксплуатировать» и для
00:12:56других вещей. Ведь в конечном счете эта задача тоже включала посещение
00:13:01сайтов и написание скриптов, что очень похоже на проекты по программированию, где вы тоже
00:13:06хотите, чтобы он изучил документацию и написал код, верно? Так что он может многое.
00:13:11Причина, по которой Pi, на мой взгляд, чуть лучше подходит для таких задач, чем Codex или
00:13:17Claude, в том, что у него есть это минимальное ядро, которое можно превратить именно в тот инструмент, который вам нужен,
00:13:24даже в рамках одного проекта. То есть у вас может быть один проект с
00:13:29экспертом по исследованиям, другой — с экспертом по фондовому рынку, а третий
00:13:37с совершенно другим специалистом, например, по анализу системы и загрузки жесткого диска,
00:13:42ну или чего угодно еще. И это, вероятно, причина того, почему OpenClaw
00:13:50использует Pi внутри себя. Сейчас я на deep wiki в репозитории OpenClaw. Если вдруг
00:13:55не знаете, это отличный сайт для изучения GitHub-репозиториев. Он анализирует их и
00:14:00выдает документацию, созданную на лету на основе увиденного кода. Также там можно
00:14:05«пообщаться» с репозиторием. И я могу спросить: «Использует ли OpenClaw кодинг-агента Pi
00:14:12внутри? Если да, то как?». Он проанализирует код, который уже загружен, и ответит:
00:14:18«Да, OpenClaw использует Pi», и объяснит, как именно это реализовано. В общем,
00:14:24вот такой он — Pi. Мне просто захотелось поделиться этим. Опять же, не потому, что я
00:14:31на этом зарабатываю. У меня нет курса, ничего такого. Но это отличный инструмент, особенно
00:14:38если вы планируете или хотите поиграть с агентами для задач, не связанных с кодингом. Но,
00:14:44чтобы быть предельно ясным: для кодинга он тоже подходит, он справляется с обоими типами задач.
00:14:50Это очень универсальный агент. На его основе можно даже строить свои инструменты, как видно на примере OpenClaw.
00:14:56Всё это можно делать и с Codex, но минималистичное ядро здесь действительно впечатляет.
00:15:02Так что в дополнение к Codex или Claude Code (или вместо них) на Pi стоит взглянуть. И да,
00:15:09я получил массу удовольствия, работая с ним последние недели. И мне очень интересно,
00:15:14куда придет вся эта тема с агентами и что мы сможем делать с ними через год. Это
00:15:18немного пугает, должен признать, но в то же время крайне любопытно. Странная смесь чувств.

Key Takeaway

Pi — это высокоэффективный и расширяемый ИИ-агент с минималистичным ядром, который за счет доступа к Bash и гибкой системы навыков превосходит стандартные инструменты кодинга в вопросах кастомизации и универсальности.

Highlights

Pi — это минималистичный и легковесный ИИ-агент, ориентированный на расширяемость через «навыки» и расширения.

Основная мощь инструмента заключается в доступе к Bash-терминалу, что позволяет управлять всей системой.

Философия проекта — «чистое» окно контекста без лишнего мусора от встроенных функций или протокола MCP.

Поддержка MCP реализована косвенно через внешние утилиты (например, MC Porter) для экономии токенов.

Инструмент поддерживает кастомные режимы, такие как «режим планирования», блокирующий запись до подтверждения плана.

Pi универсален и может использоваться для задач, не связанных с кодингом, например, для финансового анализа акций.

Агент может служить базовым ядром для создания других сложных инструментов, как это сделано в проекте OpenClaw.

Timeline

Введение в мир кодинг-агентов и позиционирование Pi

Автор начинает обзор с упоминания популярных инструментов, таких как Claude Code, Codex, Cursor и GitHub Copilot, подчеркивая их значимость на рынке. Основное внимание уделяется новому агенту под названием Pi, который выделяется на фоне конкурентов своей уникальной архитектурой. Спикер сравнивает текущую ситуацию с «войнами JavaScript-фреймворков» 2019 года, когда новые инструменты появлялись еженедельно. Важно отметить, что это видео не является спонсируемым, и автор делится личным опытом использования. Основная мысль раздела заключается в том, что Pi предлагает нечто большее, чем просто написание кода.

Модель оплаты и технические особенности Pi

В этой части обсуждаются финансовые и технические аспекты использования агента, включая отсутствие стандартной подписки и возможность оплаты по факту использования (pay-as-you-go). Автор объясняет, как он интегрировал Pi со своей подпиской Codex, но предостерегает от использования с Anthropic из-за риска бана. Техническое преимущество Pi заключается в его «легкости» и минималистичном системном промпте, который не перегружает контекстное окно. Ключевым инструментом здесь является Bash, предоставляющий агенту практически неограниченный доступ к ресурсам операционной системы. Это позволяет агенту выполнять любые действия через командную строку, от HTTP-запросов до парсинга данных.

Система навыков (Agent Skills) и работа с MCP

Раздел посвящен расширяемости Pi через механизм «навыков», которые представляют собой Markdown-файлы с инструкциями и контекстом. Автор демонстрирует, как навыки загружаются «лениво», то есть только тогда, когда агент считает их релевантными текущей задаче. Особое внимание уделяется отказу разработчиков Pi от прямой поддержки Model Context Protocol (MCP) ради сохранения чистоты контекста. Вместо этого предлагается использовать утилиту MC Porter для вызова MCP-серверов на лету. Такой подход позволяет избежать замусоривания памяти ИИ описаниями сотен инструментов, которые могут не понадобиться. В качестве примера приводится навык исследования кода (code research), использующий внешние библиотеки для анализа репозиториев.

Расширения и кастомизация рабочего процесса

Спикер подробно останавливается на расширениях, которые позволяют изменять поведение агента на разных этапах его цикла работы. Он демонстрирует созданный им «режим планирования», который добавляет в терминал слэш-команду /plan и визуальный индикатор. В этом режиме агенту запрещено вносить изменения в файлы, пока пользователь не утвердит предложенный план действий. Существует также концепция маркетплейса, где пользователи могут делиться своими пакетами расширений, включая веб-доступ или субагентов. В отличие от более жестких структур Claude Code или Codex, Pi предлагает чистое ядро, которое можно настроить под конкретный проект или глобально. Гибкость системы позволяет превратить минимальный интерфейс в мощный специализированный инструмент.

Практический пример: Финансовый анализ вне кодинга

Автор доказывает универсальность Pi, используя его для задачи, совершенно не связанной с программированием — анализа акций Apple и Nvidia. Благодаря расширению веб-доступа и API Gemini, агент самостоятельно находит актуальные цены и новости за последние семь дней. В процессе выполнения Pi сталкивается с техническими проблемами (например, путаница с версиями Python), но успешно исправляет свои ошибки. Агент пишет временные скрипты для извлечения и обработки данных, после чего формирует структурированный отчет для руководства. Этот пример показывает, что возможности Pi выходят далеко за рамки написания кода, превращая его в полноценного автономного исследователя. Весь процесс прошел без участия человека, основываясь только на одной начальной инструкции.

Интеграция в сторонние проекты и заключение

В финальной части видео упоминается проект OpenClaw, который использует Pi в качестве внутреннего движка для анализа GitHub-репозиториев. Спикер подчеркивает, что такая интеграция доказывает надежность и эффективность архитектуры агента для построения новых сервисов. Он вновь напоминает, что не имеет финансовой выгоды от рекомендации, а лишь восхищен скоростью развития технологий. В конце автор делится своими смешанными чувствами — смесью страха и любопытства перед будущим ИИ-агентов. Он призывает зрителей попробовать Pi в деле, особенно если им нужны гибкие инструменты для нестандартных задач. Видео завершается оптимистичным прогнозом относительно того, какими мощными станут эти системы всего через год.

Community Posts

View all posts