Playwright CLI или MCP Server: Что ЛУЧШЕ для Claude Code?

BBetter Stack
컴퓨터/소프트웨어AI/미래기술

Transcript

00:00:00Playwright CLI — это новейший способ использования Playwright с вашим ИИ-агентом, позволяющий управлять
00:00:04локальным хранилищем и хранилищем сессий, делать снимки, управлять вкладками — по сути, использовать всю мощь
00:00:09движка Playwright прямо в вашем терминале.
00:00:12Но зачем кому-то использовать это вместо MCP-сервера Playwright?
00:00:17И вообще, почему появляется всё больше CLI-инструментов, которые раньше были MCP-серверами?
00:00:22Подписывайтесь, и давайте во всём этом разберемся.
00:00:24Начнем с тестирования Playwright CLI и MCP-сервера на одной простой задаче.
00:00:31Я попрошу ИИ протестировать инструмент, над которым я работал — загрузчик видео из
00:00:35Twitter.
00:00:36Я хочу, чтобы Playwright взял ссылку на этот твит, вставил её сюда, извлек
00:00:40видео, подождал 10 секунд перед созданием скриншота, а затем очистил локальное хранилище,
00:00:45чтобы следующий агент начал работу с чистого листа.
00:00:48Сначала попробуем Playwright CLI через Claude Code. Если он установлен, то
00:00:54этот навык (skill) должен быть доступен здесь.
00:00:56Заметьте, он занимает всего 68 токенов.
00:00:59Теперь я дам ему этот промпт, который явно указывает агенту использовать
00:01:03навык Playwright CLI, просто чтобы упростить задачу.
00:01:06Нажимаю Enter. Агент загружает навык, вставляет URL в текстовое поле, нажимает
00:01:11«Extract Video», а затем ждет 10 секунд.
00:01:13Теперь он сделал скриншот, очистил локальное хранилище и закрыл браузер.
00:01:17Всё готово. Агент сообщает, что скриншот сохранен здесь. Если мы взглянем на него,
00:01:21то увидим, что видео было успешно загружено.
00:01:24Весь процесс занял около 16% лимита токенов.
00:01:27Теперь проделаем то же самое, используя MCP-сервер.
00:01:29Мы можем использовать команду mcp, чтобы убедиться, что он установлен.
00:01:33Но перед тем как запустить задачу, давайте взглянем на контекст.
00:01:35Если прокрутить вверх, видно, что 15% контекста уже занято, потому что
00:01:41загружены все эти инструменты MCP, которые потребляют около 3,6 тысячи токенов.
00:01:46С учетом этого, используем тот же самый промпт.
00:01:50Заметьте, я использую инструменты MCP-сервера Playwright вместо навыка CLI.
00:01:55Агент обращается к MCP-серверу, который открывает новый браузер.
00:01:59Затем он вставляет ссылку в поле ввода.
00:02:01После этого нажимает кнопку.
00:02:02Я заметил, что MCP-сервер запрашивает гораздо больше разрешений, чем CLI, что вполне нормально.
00:02:08Но возникли проблемы со скриншотом. Возможно, потому что
00:02:12у меня уже есть файл с таким именем.
00:02:13Я попробовал еще раз с MCP-сервером Playwright, и хотя он использовал
00:02:17другое имя файла, попытки сделать скриншот несколько раз заканчивались ошибкой.
00:02:22Итак, процесс завершен.
00:02:23Агент смог сделать всё, кроме скриншота.
00:02:26Давайте теперь проверим контекст: использовано 35 тысяч токенов, то есть 18%.
00:02:32Это лишь чуть больше, чем у CLI, и основная часть пришлась на описание инструментов MCP.
00:02:37На самом деле есть способ выполнить те же задачи, используя еще меньше контекста,
00:02:43о чем я расскажу чуть позже в видео.
00:02:45Я понимаю, что это лишь один пример, и могут быть сценарии, где MCP-сервер
00:02:51тратит меньше токенов, чем Playwright CLI, в зависимости от задачи, хотя я в этом сомневаюсь.
00:02:56Вы можете подумать: «Ну, разница между 16% и 18% не так уж велика».
00:03:02Однако у CLI есть и другие преимущества перед MCP-сервером.
00:03:06По умолчанию MCP-сервер Playwright предоставляет не все доступные инструменты.
00:03:11Вам придется вручную подключать такие функции, как генерация PDF или трассировка,
00:03:16потому что они занимают слишком много места в контексте.
00:03:19У CLI таких ограничений нет.
00:03:22Все инструменты доступны сразу, «из коробки».
00:03:25Более того, CLI удобен не только для агентов, но и для людей. Для задач,
00:03:29которые вы выполняете постоянно, или для сквозного тестирования можно создать bash-скрипт,
00:03:34который сможет запустить как человек для проверки, так и ИИ-агент.
00:03:39Но это не значит, что MCP-сервер бесполезен. Если вы создаете цикл работы агента,
00:03:44который должен работать везде — в браузере, в десктопных или мобильных приложениях,
00:03:49а не только в терминале — тогда MCP-сервер идеален. Это стандартный протокол,
00:03:54через который агенты получают доступ к инструментам. А поскольку Playwright работает на JavaScript,
00:03:59этот код можно запускать в любой среде с поддержкой среды выполнения JS.
00:04:03Кроме того, MCP-сервер по умолчанию работает в режиме с графическим интерфейсом, а CLI — в фоновом (headless),
00:04:09так как он предназначен для скрытой работы внутри ИИ-агентов.
00:04:13Если же экономия токенов в MCP-сервере критична, вы можете настроить его,
00:04:17включая или отключая определенные инструменты.
00:04:20На самом деле, если ваша цель — минимальный расход токенов, то не стоит использовать
00:04:26даже Playwright CLI. Agent Browser от Steel использует Playwright под капотом, но имеет
00:04:32CLI на Rust. Он быстрее и спроектирован так, чтобы потреблять меньше токенов, чем Playwright,
00:04:38как вы видели в моем предыдущем примере.
00:04:39Посмотрите следующее видео, чтобы узнать всё об Agent Browser и вывести навыки
00:04:43ваших ИИ-агентов по работе в сети на новый уровень.

Key Takeaway

Для локальной разработки и работы с Claude Code Playwright CLI является более эффективным и экономичным инструментом, чем MCP-сервер, благодаря низкому потреблению токенов и простоте доступа к полному функционалу.

Highlights

Playwright CLI — это новый способ управления браузером через терминал, оптимизированный для ИИ-агентов.

CLI-версия потребляет значительно меньше токенов (68 против 3600 у MCP) для описания доступных навыков.

В отличие от MCP-сервера, CLI предоставляет все инструменты (PDF, трассировка) сразу «из коробки» без сложной настройки.

MCP-сервер остается предпочтительным для кроссплатформенных решений и работы в режиме с графическим интерфейсом.

Существуют еще более эффективные альтернативы, такие как Agent Browser от Steel на базе Rust, минимизирующие расход токенов.

Timeline

Введение в Playwright CLI и постановка задачи

Автор представляет Playwright CLI как инновационный метод взаимодействия ИИ-агентов с браузерным движком напрямую через терминал. Рассматриваются основные возможности инструмента, включая управление сессиями, создание снимков экрана и манипуляции с вкладками. Ставится главный вопрос видео: почему разработчики переходят от MCP-серверов к CLI-инструментам. В качестве практического примера выбрана задача по автоматизации тестирования загрузчика видео из Twitter. Этот сценарий включает ввод URL, ожидание загрузки и последующую очистку локального хранилища для обеспечения чистоты эксперимента.

Тестирование Playwright CLI в Claude Code

В этом разделе демонстрируется работа Claude Code с использованием навыка Playwright CLI на конкретном примере. Автор подчеркивает экстремальную эффективность: описание навыка занимает всего 68 токенов в контекстном окне. Агент успешно выполняет цепочку действий: переход по ссылке, нажатие кнопки извлечения видео и десятисекундную паузу. Весь процесс завершается созданием скриншота и полной очисткой данных, подтверждая корректность работы загрузчика. Итоговый расход лимита токенов для всей задачи составил около 16%, что является отличным показателем для сложной браузерной задачи.

Сравнение с MCP-сервером и технические сложности

Проводится аналогичный тест с использованием стандартного MCP-сервера Playwright для выявления различий в производительности. Сразу обнаруживается существенный недостаток: описание инструментов MCP занимает 3600 токенов, что составляет 15% контекста еще до начала работы. В процессе выполнения агент запрашивает избыточное количество разрешений и сталкивается с ошибками при попытке сохранить скриншот. Несмотря на успешное выполнение основных шагов, общая доля использованного контекста выросла до 18%. Это наглядно демонстрирует, что MCP-сервер создает большую нагрузку на память модели и менее стабилен в данной среде.

Преимущества CLI и сценарии использования MCP

Автор детально разбирает, почему разница в 2% контекста на самом деле критична при масштабировании задач. Главное преимущество CLI заключается в доступности всех функций, таких как генерация PDF, которые в MCP часто отключены для экономии места. CLI также удобен для создания bash-скриптов, которые могут одинаково эффективно запускаться как людьми, так и ИИ. Тем не менее, MCP-сервер признается идеальным для универсальных агентов, работающих вне терминала, например, в мобильных приложениях. Важным отличием является и режим работы: MCP по умолчанию использует графический интерфейс, в то время как CLI работает в скрытом (headless) режиме.

Альтернативы и финальные рекомендации

В заключительной части рассматриваются способы еще большей оптимизации расходов при работе с браузером. Упоминается возможность ручной настройки MCP-сервера путем отключения ненужных инструментов, хотя это усложняет поддержку. В качестве продвинутой альтернативы автор предлагает Agent Browser от Steel, который использует CLI на языке Rust. Этот инструмент спроектирован для еще более высокой скорости работы и минимального потребления токенов по сравнению с любыми решениями на базе JavaScript. Видео завершается призывом изучать специализированные инструменты для повышения эффективности ИИ-агентов в сети.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video