00:00:00Команда Closco только что устранила самую большую проблему MCP,
00:00:03добавив поиск инструментов — способ сократить контекст до 95% просто за счет поиска имени инструмента перед его использованием вместо предварительной загрузки всех доступных инструментов в контекст,
00:00:14что могло занимать десятки тысяч токенов еще до того,
00:00:17как вы напишете свой первый запрос.
00:00:18Но почему раньше это работало не так?
00:00:21И не украли ли они этот метод у Cloudflare?
00:00:24Нажмите «Подписаться» и давайте разберемся.
00:00:26MCP-серверы повсюду: есть для GitHub,
00:00:29Docker,
00:00:29Notion,
00:00:30даже для Better Stack,
00:00:32который,
00:00:32как я слышал,
00:00:33действительно хорош.
00:00:35И поскольку люди используют Claude Code и большие языковые модели для всего,
00:00:40кроме кода,
00:00:40похоже,
00:00:41что MCP никуда не денется в ближайшее время.
00:00:43Но у него есть проблемы: конфликты имен,
00:00:45инъекции команд и самая большая из всех — неэффективность токенов,
00:00:49потому что все инструменты с подключенного сервера обычно предварительно загружаются в контекстное окно модели,
00:00:55чтобы обеспечить ей полную видимость.
00:00:57То есть имена инструментов,
00:00:58описания инструментов,
00:00:59полная документация JSON-схемы,
00:01:01содержащая необязательные и обязательные параметры,
00:01:04их типы,
00:01:05любые ограничения — в общем,
00:01:06много данных.
00:01:07Команда Redis использовала 167 инструментов с четырех разных серверов,
00:01:12что заняло более 60 000 токенов еще до написания запроса.
00:01:15Почти половина контекстного окна Opus в 200 тысяч токенов,
00:01:18и это даже без учета навыков и плагинов.
00:01:21Так что если у вас много серверов,
00:01:23это может занять значительное количество токенов.
00:01:25Да,
00:01:26я знаю,
00:01:26что есть модели вроде Gemini с контекстным окном в миллион токенов,
00:01:30но модели,
00:01:31как правило,
00:01:31работают хуже,
00:01:32чем больше вещей вы добавляете в их контекст.
00:01:35Так как же лучше всего это исправить?
00:01:37Что ж,
00:01:37я видел два популярных подхода в Интернете: программный,
00:01:41который использовала Cloudflare,
00:01:43и поисковый,
00:01:43который применила команда Claude Code.
00:01:46О программном подходе я расскажу чуть позже,
00:01:49но сначала поговорим о процессе поиска,
00:01:52который работает так.
00:01:53Сначала Claude проверяет,
00:01:55занимают ли предварительно загруженные MCP-инструменты более 10% контекста.
00:01:59То есть 20 тысяч токенов,
00:02:01если контекстное окно составляет 200 тысяч токенов.
00:02:04Если нет,
00:02:05то никаких изменений не происходит,
00:02:07и модель использует MCP-инструменты как обычно.
00:02:10Но если да,
00:02:11то Claude динамически находит нужные инструменты,
00:02:15используя естественный язык,
00:02:17и загружает три-пять наиболее релевантных инструментов на основе запроса.
00:02:22Он полностью загрузит только эти инструменты в контекст,
00:02:25чтобы модель могла использовать их как обычно.
00:02:27На самом деле это была самая запрашиваемая функция на GitHub,
00:02:31и она работает аналогично AgentSkills,
00:02:33которая загружает в контекст только имена и описания навыков,
00:02:37а когда находит навык,
00:02:38который кажется релевантным или был упомянут в запросе,
00:02:42тогда загружает весь этот конкретный навык в контекстное окно.
00:02:46Постепенное раскрытие информации, если коротко.
00:02:47И Anthropic,
00:02:48и Cursor увидели большие преимущества от использования этого подхода для MCP-инструментов.
00:02:53А что насчет программного подхода?
00:02:55Он работает за счет того,
00:02:57что модели управляют инструментами через код вместо API-вызовов.
00:03:01Так что для этих трех инструментов,
00:03:03которые должны работать один за другим на основе предыдущего ответа,
00:03:06вместо отдельных API-вызовов инструментов Claude,
00:03:09в частности,
00:03:10может написать Python-скрипт для всей этой оркестрации,
00:03:13затем выполнить код и передать результат обратно модели.
00:03:16Cloudflare пошла еще дальше,
00:03:18заставляя модель писать TypeScript-определения для всех доступных инструментов,
00:03:23а затем запуская код в песочнице,
00:03:25которая обычно является воркером.
00:03:27Команда Claude Code на самом деле пробовала программный подход,
00:03:30но обнаружила,
00:03:31что поиск работает лучше,
00:03:33во что мне очень трудно поверить,
00:03:34учитывая,
00:03:35что Claude очень хорош в написании кода.
00:03:38Кроме того,
00:03:38агентный браузер CLI на безголовом Chromium,
00:03:41который выпустила Vercel,
00:03:42очень хорошо работает в Claude Code,
00:03:44и я уверен,
00:03:45что если бы можно было конвертировать все MCP-инструменты в CLI-команды с помощью чего-то вроде MCPorter,
00:03:51моделям было бы гораздо проще и эффективнее с точки зрения контекста выполнять конкретную CLI-команду для инструмента вместо загрузки всего в контекст,
00:03:59но это лишь моё мнение.
00:04:01В целом,
00:04:02я рад,
00:04:02что проблемы с MCP-серверами рассматриваются,
00:04:05и,
00:04:06возможно,
00:04:06это убедит меня установить больше одного сервера.