Инструменты MCP стали в 10 раз быстрее в Claude Code

Русскийالعربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Português 中文

Computing/SoftwareInternet Technology

Transcript

00:00:00Команда Closco только что устранила самую большую проблему MCP,

00:00:03добавив поиск инструментов — способ сократить контекст до 95% просто за счет поиска имени инструмента перед его использованием вместо предварительной загрузки всех доступных инструментов в контекст,

00:00:14что могло занимать десятки тысяч токенов еще до того,

00:00:17как вы напишете свой первый запрос.

00:00:18Но почему раньше это работало не так?

00:00:21И не украли ли они этот метод у Cloudflare?

00:00:24Нажмите «Подписаться» и давайте разберемся.

00:00:26MCP-серверы повсюду: есть для GitHub,

00:00:29Docker,

00:00:29Notion,

00:00:30даже для Better Stack,

00:00:32который,

00:00:32как я слышал,

00:00:33действительно хорош.

00:00:35И поскольку люди используют Claude Code и большие языковые модели для всего,

00:00:40кроме кода,

00:00:40похоже,

00:00:41что MCP никуда не денется в ближайшее время.

00:00:43Но у него есть проблемы: конфликты имен,

00:00:45инъекции команд и самая большая из всех — неэффективность токенов,

00:00:49потому что все инструменты с подключенного сервера обычно предварительно загружаются в контекстное окно модели,

00:00:55чтобы обеспечить ей полную видимость.

00:00:57То есть имена инструментов,

00:00:58описания инструментов,

00:00:59полная документация JSON-схемы,

00:01:01содержащая необязательные и обязательные параметры,

00:01:04их типы,

00:01:05любые ограничения — в общем,

00:01:06много данных.

00:01:07Команда Redis использовала 167 инструментов с четырех разных серверов,

00:01:12что заняло более 60 000 токенов еще до написания запроса.

00:01:15Почти половина контекстного окна Opus в 200 тысяч токенов,

00:01:18и это даже без учета навыков и плагинов.

00:01:21Так что если у вас много серверов,

00:01:23это может занять значительное количество токенов.

00:01:25Да,

00:01:26я знаю,

00:01:26что есть модели вроде Gemini с контекстным окном в миллион токенов,

00:01:30но модели,

00:01:31как правило,

00:01:31работают хуже,

00:01:32чем больше вещей вы добавляете в их контекст.

00:01:35Так как же лучше всего это исправить?

00:01:37Что ж,

00:01:37я видел два популярных подхода в Интернете: программный,

00:01:41который использовала Cloudflare,

00:01:43и поисковый,

00:01:43который применила команда Claude Code.

00:01:46О программном подходе я расскажу чуть позже,

00:01:49но сначала поговорим о процессе поиска,

00:01:52который работает так.

00:01:53Сначала Claude проверяет,

00:01:55занимают ли предварительно загруженные MCP-инструменты более 10% контекста.

00:01:59То есть 20 тысяч токенов,

00:02:01если контекстное окно составляет 200 тысяч токенов.

00:02:04Если нет,

00:02:05то никаких изменений не происходит,

00:02:07и модель использует MCP-инструменты как обычно.

00:02:10Но если да,

00:02:11то Claude динамически находит нужные инструменты,

00:02:15используя естественный язык,

00:02:17и загружает три-пять наиболее релевантных инструментов на основе запроса.

00:02:22Он полностью загрузит только эти инструменты в контекст,

00:02:25чтобы модель могла использовать их как обычно.

00:02:27На самом деле это была самая запрашиваемая функция на GitHub,

00:02:31и она работает аналогично AgentSkills,

00:02:33которая загружает в контекст только имена и описания навыков,

00:02:37а когда находит навык,

00:02:38который кажется релевантным или был упомянут в запросе,

00:02:42тогда загружает весь этот конкретный навык в контекстное окно.

00:02:46Постепенное раскрытие информации, если коротко.

00:02:47И Anthropic,

00:02:48и Cursor увидели большие преимущества от использования этого подхода для MCP-инструментов.

00:02:53А что насчет программного подхода?

00:02:55Он работает за счет того,

00:02:57что модели управляют инструментами через код вместо API-вызовов.

00:03:01Так что для этих трех инструментов,

00:03:03которые должны работать один за другим на основе предыдущего ответа,

00:03:06вместо отдельных API-вызовов инструментов Claude,

00:03:09в частности,

00:03:10может написать Python-скрипт для всей этой оркестрации,

00:03:13затем выполнить код и передать результат обратно модели.

00:03:16Cloudflare пошла еще дальше,

00:03:18заставляя модель писать TypeScript-определения для всех доступных инструментов,

00:03:23а затем запуская код в песочнице,

00:03:25которая обычно является воркером.

00:03:27Команда Claude Code на самом деле пробовала программный подход,

00:03:30но обнаружила,

00:03:31что поиск работает лучше,

00:03:33во что мне очень трудно поверить,

00:03:34учитывая,

00:03:35что Claude очень хорош в написании кода.

00:03:38Кроме того,

00:03:38агентный браузер CLI на безголовом Chromium,

00:03:41который выпустила Vercel,

00:03:42очень хорошо работает в Claude Code,

00:03:44и я уверен,

00:03:45что если бы можно было конвертировать все MCP-инструменты в CLI-команды с помощью чего-то вроде MCPorter,

00:03:51моделям было бы гораздо проще и эффективнее с точки зрения контекста выполнять конкретную CLI-команду для инструмента вместо загрузки всего в контекст,

00:03:59но это лишь моё мнение.

00:04:01В целом,

00:04:02я рад,

00:04:02что проблемы с MCP-серверами рассматриваются,

00:04:05и,

00:04:06возможно,

00:04:06это убедит меня установить больше одного сервера.

Key Takeaway

Anthropic решила главную проблему неэффективности токенов в MCP-серверах, внедрив поиск инструментов, который сокращает использование контекста до 95% путем динамической загрузки только релевантных инструментов вместо предварительной загрузки всех доступных.

Highlights

Anthropic внедрила поиск инструментов в Claude Code, сократив использование контекста на 95% по сравнению с предварительной загрузкой всех MCP-инструментов

Команда Redis использовала 167 инструментов с четырех серверов, что занимало более 60 000 токенов — почти половину контекстного окна Opus в 200 000 токенов

Claude динамически находит и загружает только 3-5 наиболее релевантных инструментов на основе запроса, когда MCP-инструменты занимают более 10% контекста

Существует два подхода к оптимизации MCP: поисковый (используемый Claude Code) и программный (используемый Cloudflare через TypeScript-определения)

Команда Claude Code тестировала программный подход, но обнаружила, что поиск работает эффективнее

Постепенное раскрытие информации применяется аналогично AgentSkills — сначала загружаются только имена и описания, затем полная документация релевантных инструментов

Timeline

Введение в проблему MCP и новое решение

Команда Claude Code устранила крупнейшую проблему MCP, внедрив поиск инструментов (tool search). Новый подход позволяет сократить использование контекста до 95% за счет поиска имени инструмента перед его использованием. Ранее все доступные инструменты предварительно загружались в контекст, что могло занимать десятки тысяч токенов еще до написания первого запроса. Видео обещает объяснить, почему старый метод был неэффективным и связано ли новое решение с подходом Cloudflare.

Распространенность MCP и основные проблемы

MCP-серверы существуют для множества платформ: GitHub, Docker, Notion, Better Stack и других, что делает MCP незаменимым инструментом. Однако технология имеет серьезные проблемы: конфликты имен, инъекции команд и критическую неэффективность токенов. Основная проблема заключается в том, что все инструменты с подключенного сервера предварительно загружаются в контекстное окно модели для обеспечения полной видимости. В контекст попадают имена инструментов, описания, полная документация JSON-схемы с обязательными и необязательными параметрами, их типами и ограничениями — огромный объем данных.

Конкретный пример проблемы с токенами

Команда Redis использовала 167 инструментов с четырех разных MCP-серверов, что заняло более 60 000 токенов еще до написания запроса. Это составляет почти половину контекстного окна Claude Opus в 200 000 токенов, и это без учета навыков и плагинов. При наличии множества серверов потребление токенов становится критическим. Хотя существуют модели с большими контекстными окнами (например, Gemini с миллионом токенов), модели обычно работают хуже при увеличении объема информации в контексте.

Поисковый подход Claude Code

Существует два популярных подхода к решению проблемы: программный (Cloudflare) и поисковый (Claude Code). В поисковом подходе Claude сначала проверяет, занимают ли MCP-инструменты более 10% контекста (например, 20 000 токенов из 200 000). Если нет, то инструменты используются как обычно без изменений. Если порог превышен, Claude динамически находит нужные инструменты с помощью естественного языка и загружает только 3-5 наиболее релевантных на основе запроса. Полностью загружаются в контекст только эти выбранные инструменты, что позволяет модели использовать их эффективно.

Связь с AgentSkills и результаты внедрения

Поиск инструментов был самой запрашиваемой функцией на GitHub и работает аналогично AgentSkills. В AgentSkills в контекст загружаются только имена и описания навыков, а когда обнаруживается релевантный навык или он упоминается в запросе, тогда загружается полная документация этого конкретного навыка. Это принцип постепенного раскрытия информации (progressive disclosure). Как Anthropic, так и Cursor увидели значительные преимущества от применения этого подхода к MCP-инструментам.

Программный подход и сравнение методов

Программный подход позволяет моделям управлять инструментами через код вместо API-вызовов. Вместо отдельных вызовов для трех инструментов, работающих последовательно, Claude может написать Python-скрипт для всей оркестрации, выполнить код и передать результат обратно. Cloudflare пошла дальше, заставляя модель писать TypeScript-определения для всех инструментов и запуская код в песочнице (обычно воркере). Команда Claude Code тестировала программный подход, но обнаружила, что поиск работает лучше, что удивительно, учитывая способности Claude в написании кода. Автор считает, что конвертация MCP-инструментов в CLI-команды (например, через MCPorter) могла бы быть еще эффективнее.

Заключение и перспективы

Автор выражает удовлетворение тем, что проблемы MCP-серверов активно решаются. Новые улучшения могут убедить пользователей устанавливать больше одного MCP-сервера, что ранее было нецелесообразно из-за проблем с контекстом. Внедрение поиска инструментов открывает новые возможности для масштабирования использования MCP-серверов без критических потерь производительности. Решение проблемы неэффективности токенов делает MCP более практичным инструментом для широкого применения.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video