00:00:00Можно ли на самом деле обучить модель быть эффективным менеджером?
00:00:02Компания Moonshot недавно выпустила Kimi 2.5, назвав её самой мощной open-source моделью на сегодняшний день.
00:00:08Это утверждение не совсем верно, так как она относится к категории open-weight, а не open-source.
00:00:11Разница есть, но сейчас речь не об этом.
00:00:13Kimi 2.5 заявляет о двух возможностях, которые действительно стоит проверить.
00:00:17Во-первых, утверждается, что она с нуля обучалась оркестровке групп агентов,
00:00:21способных запускать до 100 субагентов параллельно.
00:00:23Система обучения с подкреплением вознаграждает не только за правильные ответы,
00:00:27но и за то, насколько эффективно модель распределяет работу между агентами.
00:00:30Во-вторых, заявляется о наличии визуального агентного интеллекта,
00:00:33который якобы создает сложнейшую анимацию всего по одному промпту.
00:00:37Теперь уже не просто пользователи хвастаются быстрой сборкой — об этом заявляют сами создатели.
00:00:42Поэтому мы попросили одного из наших сотрудников протестировать оба аспекта.
00:00:44Кое-что из обещанного подтвердилось, а что-то — нет.
00:00:48Как я уже сказал, Kimi 2.5 позиционируется как open-source модель.
00:00:51На самом деле, это не так.
00:00:54Согласно определению Open Source Initiative,
00:00:57открытая модель подразумевает, что код, данные для обучения и методология должны быть публичными,
00:01:02чтобы любой желающий мог их изучить, изменить или распространить.
00:01:05В данном же случае это модель с открытыми весами (open-weight).
00:01:07Это значит, что доступны только финальные веса,
00:01:10а код обучения и наборы данных остаются закрытыми.
00:01:14Вы получаете только веса, чтобы дообучать, адаптировать или внедрять модель в свои проекты.
00:01:20Архитектура этой модели очень похожа на DeepSeek с использованием Mixture of Experts (смесь экспертов).
00:01:25Всего в ней 1 триллион параметров, но активны одновременно лишь 32 миллиарда.
00:01:30Значит ли это, что мы не используем модель на полную мощность?
00:01:33Она выдает точность триллионной модели,
00:01:36но требует гораздо меньше вычислительной мощности и затрат.
00:01:39Именно эта разница между общим числом параметров и активными
00:01:43делает её одной из самых быстрых open-weight моделей на рынке.
00:01:47Меньшее число активных параметров на запрос
00:01:52значительно ускоряет работу системы.
00:01:54И это главная причина, почему она настолько дешевле конкурентов.
00:01:57Разработчики говорят, что это нативная мультимодальная модель с передовыми возможностями в кодинге и зрении.
00:02:03Но так говорят создатели почти каждой новой модели.
00:02:08Нам пришлось всё проверить самостоятельно, и сейчас мы покажем результаты.
00:02:12Но прежде чем перейти к уникальным фишкам, пару слов о спонсоре.
00:02:16Opera Neon. Это первый агентный браузер от Opera,
00:02:19созданный специально для продвинутых пользователей, готовых заглянуть в будущее.
00:02:23В Neon вместо хаотичных вкладок используются «Задачи» — сфокусированные рабочие пространства,
00:02:27где ИИ может анализировать данные и действовать сразу в нескольких вкладках в одном контексте.
00:02:32Представьте, что вам нужна небольшая утилита для работы.
00:02:34Вместо того чтобы открывать IDE, просто воспользуйтесь Neon Make.
00:02:37Введите запрос типа «Создай таймер Помидор в стиле киберпанк»,
00:02:40и браузер запустит виртуальную машину, составит план,
00:02:43напишет код и мгновенно развернет приложение.
00:02:45Это колоссально экономит время: вы можете прототипировать идеи
00:02:50или автоматизировать сбор данных через Neon Do, не отвлекаясь от основного процесса.
00:02:53Это как если бы младший разработчик был встроен прямо в интерфейс.
00:02:56Я определенно буду использовать карточки Neon для автоматизации своих промптов.
00:02:59Подпишитесь на Opera Neon сегодня. Не просто наблюдайте за приходом эры агентов.
00:03:03Станьте её частью. Ссылка в описании.
00:03:05Модель Kimi способна управлять группой агентов, координируя задачи между ними.
00:03:10Вы можете возразить, что Claude делает то же самое, создавая субагентов под конкретную задачу.
00:03:15Но вот в чем отличие этой модели.
00:03:17Kimi 2.5 научилась самостоятельно управлять «роем» из 100 субагентов,
00:03:23выполняя параллельные рабочие процессы в рамках 1500 скоординированных шагов благодаря особому обучению.
00:03:29Напомню, обучение с подкреплением — это процесс, где модель получает награду,
00:03:33когда действует правильно, и штраф за отклонение от цели.
00:03:36Обычно модели вознаграждают только за итоговый результат.
00:03:39Но здесь модель поощряют еще и за то, насколько хорошо она умеет параллелить шаги
00:03:43и выступать в роли руководителя.
00:03:44Проще говоря, Kimi специально натренирована быть оркестратором.
00:03:48Критерий её успеха — умение создавать субагентов и делегировать задачи.
00:03:53Функции создания агентов и назначения ролей вшиты прямо в оркестратор.
00:03:58Она запускает помощников под разные нужды, раздает им указания,
00:04:02собирает результаты и сводит всё в единый финал.
00:04:06По словам авторов, этот метод «роя» улучшает работу со сложными задачами.
00:04:11Внутренние тесты показали сокращение времени выполнения на 80%.
00:04:16Это позволяет справляться с гораздо более масштабными и долгосрочными проектами.
00:04:20Они сравнили её с лучшими моделями для сложных задач,
00:04:23такими как Opus 4.5, а также с Kimi 2.5 без использования «роя»,
00:04:26и выяснили, что связка Kimi 2.5 с агентами превзошла всех конкурентов в бенчмарках.
00:04:32К тому же, использование группы агентов вместо одного позволило существенно сэкономить время.
00:04:36Всё это были заявления разработчиков.
00:04:39Для проверки мы установили KimiCode CLI —
00:04:42нового кодинг-агента, выпущенного вместе с этой моделью.
00:04:45У нас уже был готовый интерфейс, который мы хотели перевести на другую структуру компонентов.
00:04:49Проект был написан на ShadCN, а мы решили переделать его на Material UI.
00:04:53В проекте было много страниц,
00:04:55поэтому мы попросили Kimi поменять UI всего проекта с ShadCN на Material UI,
00:05:00используя агентов для каждой страницы,
00:05:02чтобы миграция прошла быстрее за счет параллельной работы.
00:05:05Модель начала сканировать директории, подобно тому как это делает Claude Code.
00:05:08Она составила список всех страниц, требующих конвертации.
00:05:13Похожие страницы были сгруппированы,
00:05:15например, страницы регистрации, входа и восстановления пароля, для более эффективной обработки.
00:05:20Однако она запустила больше агентов, чем мы ожидали,
00:05:23что, как выяснилось позже, было багом в CLI.
00:05:26В итоге для задачи было задействовано пять агентов,
00:05:28что вполне допустимо для нового продукта.
00:05:30Весь процесс занял около 15 минут,
00:05:32хотя мы надеялись на большее ускорение за счет параллелизма.
00:05:35В конце модель проверила и почистила проект.
00:05:38Некоторые компоненты после миграции стали не нужны,
00:05:41и она их удалила.
00:05:43Kimi проследила, чтобы все зависимости были установлены и обновлены,
00:05:45включая файлы тестов, и проверила остальное.
00:05:48После завершения она удалила все хвосты от ShadCN,
00:05:53не оставив лишнего мусора в зависимостях,
00:05:55про который большинство агентов обычно забывают, раздувая проект.
00:05:59Интерфейс был слегка изменен.
00:06:01К примеру, в главном блоке текст и картинка изначально стояли в ряд,
00:06:05а модель расположила их друг под другом.
00:06:07В остальном всё выглядело практически идентично,
00:06:10просто с заменой библиотеки компонентов.
00:06:12Несмотря на масштаб задачи, было использовано лишь 25% контекстного окна,
00:06:16а значит, модель может эффективно работать в долгих сессиях.
00:06:19Итак, «рой» агентов работает, но это не всегда дает выигрыш в скорости,
00:06:22особенно на очень больших кодовых базах.
00:06:24Вы, наверное, заметили, что в наших роликах мы много чего создаем.
00:06:27Все промпты, код, шаблоны —
00:06:29всё то, что обычно приходится копировать с экрана, ставя видео на паузу.
00:06:32Всё это есть в нашем сообществе — и по этому ролику, и по всем предыдущим.
00:06:35Ссылки в описании.
00:06:37Главная фишка Kimi 2.5 — это её визуальный агентный интеллект.
00:06:41Заявлено, что она особенно сильна во фронтенде.
00:06:44Она может взаимодействовать со сложными макетами и внедрять продвинутую анимацию,
00:06:48например, скроллинг текста.
00:06:50Разработчики показали несколько примеров анимации, и все они были выполнены качественно.
00:06:53Но вот где она реально выделяется.
00:06:55Kimi 2.5 отлично кодит «по картинке», выходя за рамки простых текстовых и фото-запросов.
00:07:00Она может принимать видео в качестве входных данных и генерировать код,
00:07:03став одной из первых моделей с такой функцией.
00:07:06Это значительно упрощает объяснение того, как должен работать интерфейс.
00:07:08Данная мультимодальность не была прикручена позже.
00:07:12Её интегрировали непосредственно в процессе обучения.
00:07:14В большинстве случаев дополнительные возможности добавляют
00:07:16уже после того, как текстовая база станет достаточно сильной,
00:07:19что часто приводит к компромиссу между качеством зрения и пониманием текста.
00:07:23Но благодаря методике обучения Kimi 2.5,
00:07:25этот компромисс исчезает, и обе способности развиваются параллельно.
00:07:29Разумеется, мы протестировали это сами.
00:07:30Мы записали видео, как создаем новую страницу в Notion и используем слеш-команды.
00:07:35Запись была короткой, так как в документации указан лимит на видео в 40 МБ.
00:07:40Мы дали ссылку на запись и попросили клонировать сайт из видео.
00:07:45Мы намеренно не уточняли в промпте, что именно на видео,
00:07:48поэтому модель использовала инструмент анализа медиафайлов.
00:07:52Она поняла, что это интерфейс в стиле Notion, распознала все функции
00:07:56и определила, что это клон Notion в окне в стиле Mac OS.
00:07:59Составив описание увиденного, она приступила к реализации.
00:08:02Если планируете использовать обработку видео в своих проектах, помните об одном.
00:08:06Видео и изображения быстро съедают контекстное окно,
00:08:09так что следите за размером файлов и перегрузкой контекста.
00:08:12Копия интерфейса получилась точной.
00:08:15UI был редактируемым, включая иконки страниц и фишки Notion,
00:08:18хотя поначалу не всё работало как надо.
00:08:21Слеш-команды сначала не запускались, но внешне всё было очень похоже.
00:08:25Было бы круче, если бы команды работали сразу, ведь это ключевая часть рабочего процесса.
00:08:29Но это мелочь, которую можно было исправить итерациями.
00:08:32Мы дали промпт с просьбой исправить недочеты в текущей реализации.
00:08:37После этого модель начала самоитерацию: вносила правки, проверяла результат
00:08:41и добивалась работы функций без дальнейших подсказок с нашей стороны.
00:08:46В итоге проблема со слеш-командами была решена,
00:08:49и интерфейс превратился в полноценный клон Notion.
00:08:52Так что обещания разработчиков подтверждаются.
00:08:54Разобравшись с парой нюансов, мы пришли к выводу, что это может быть отличной дешевой альтернативой Claude Code,
00:08:58учитывая, что тарифы Claude довольно высокие, а Kimi стоит заметно меньше.
00:09:03На этом наш обзор подходит к концу.
00:09:05Если хотите поддержать канал и помочь нам выпускать такие видео чаще,
00:09:08присоединяйтесь к AI Labs Pro.
00:09:10Как всегда, спасибо за просмотр, и до встречи в следующем выпуске!