Я никогда не видел ничего подобного

AAI LABS
컴퓨터/소프트웨어창업/스타트업경영/리더십AI/미래기술

Transcript

00:00:00Можно ли на самом деле обучить модель быть эффективным менеджером?
00:00:02Компания Moonshot недавно выпустила Kimi 2.5, назвав её самой мощной open-source моделью на сегодняшний день.
00:00:08Это утверждение не совсем верно, так как она относится к категории open-weight, а не open-source.
00:00:11Разница есть, но сейчас речь не об этом.
00:00:13Kimi 2.5 заявляет о двух возможностях, которые действительно стоит проверить.
00:00:17Во-первых, утверждается, что она с нуля обучалась оркестровке групп агентов,
00:00:21способных запускать до 100 субагентов параллельно.
00:00:23Система обучения с подкреплением вознаграждает не только за правильные ответы,
00:00:27но и за то, насколько эффективно модель распределяет работу между агентами.
00:00:30Во-вторых, заявляется о наличии визуального агентного интеллекта,
00:00:33который якобы создает сложнейшую анимацию всего по одному промпту.
00:00:37Теперь уже не просто пользователи хвастаются быстрой сборкой — об этом заявляют сами создатели.
00:00:42Поэтому мы попросили одного из наших сотрудников протестировать оба аспекта.
00:00:44Кое-что из обещанного подтвердилось, а что-то — нет.
00:00:48Как я уже сказал, Kimi 2.5 позиционируется как open-source модель.
00:00:51На самом деле, это не так.
00:00:54Согласно определению Open Source Initiative,
00:00:57открытая модель подразумевает, что код, данные для обучения и методология должны быть публичными,
00:01:02чтобы любой желающий мог их изучить, изменить или распространить.
00:01:05В данном же случае это модель с открытыми весами (open-weight).
00:01:07Это значит, что доступны только финальные веса,
00:01:10а код обучения и наборы данных остаются закрытыми.
00:01:14Вы получаете только веса, чтобы дообучать, адаптировать или внедрять модель в свои проекты.
00:01:20Архитектура этой модели очень похожа на DeepSeek с использованием Mixture of Experts (смесь экспертов).
00:01:25Всего в ней 1 триллион параметров, но активны одновременно лишь 32 миллиарда.
00:01:30Значит ли это, что мы не используем модель на полную мощность?
00:01:33Она выдает точность триллионной модели,
00:01:36но требует гораздо меньше вычислительной мощности и затрат.
00:01:39Именно эта разница между общим числом параметров и активными
00:01:43делает её одной из самых быстрых open-weight моделей на рынке.
00:01:47Меньшее число активных параметров на запрос
00:01:52значительно ускоряет работу системы.
00:01:54И это главная причина, почему она настолько дешевле конкурентов.
00:01:57Разработчики говорят, что это нативная мультимодальная модель с передовыми возможностями в кодинге и зрении.
00:02:03Но так говорят создатели почти каждой новой модели.
00:02:08Нам пришлось всё проверить самостоятельно, и сейчас мы покажем результаты.
00:02:12Но прежде чем перейти к уникальным фишкам, пару слов о спонсоре.
00:02:16Opera Neon. Это первый агентный браузер от Opera,
00:02:19созданный специально для продвинутых пользователей, готовых заглянуть в будущее.
00:02:23В Neon вместо хаотичных вкладок используются «Задачи» — сфокусированные рабочие пространства,
00:02:27где ИИ может анализировать данные и действовать сразу в нескольких вкладках в одном контексте.
00:02:32Представьте, что вам нужна небольшая утилита для работы.
00:02:34Вместо того чтобы открывать IDE, просто воспользуйтесь Neon Make.
00:02:37Введите запрос типа «Создай таймер Помидор в стиле киберпанк»,
00:02:40и браузер запустит виртуальную машину, составит план,
00:02:43напишет код и мгновенно развернет приложение.
00:02:45Это колоссально экономит время: вы можете прототипировать идеи
00:02:50или автоматизировать сбор данных через Neon Do, не отвлекаясь от основного процесса.
00:02:53Это как если бы младший разработчик был встроен прямо в интерфейс.
00:02:56Я определенно буду использовать карточки Neon для автоматизации своих промптов.
00:02:59Подпишитесь на Opera Neon сегодня. Не просто наблюдайте за приходом эры агентов.
00:03:03Станьте её частью. Ссылка в описании.
00:03:05Модель Kimi способна управлять группой агентов, координируя задачи между ними.
00:03:10Вы можете возразить, что Claude делает то же самое, создавая субагентов под конкретную задачу.
00:03:15Но вот в чем отличие этой модели.
00:03:17Kimi 2.5 научилась самостоятельно управлять «роем» из 100 субагентов,
00:03:23выполняя параллельные рабочие процессы в рамках 1500 скоординированных шагов благодаря особому обучению.
00:03:29Напомню, обучение с подкреплением — это процесс, где модель получает награду,
00:03:33когда действует правильно, и штраф за отклонение от цели.
00:03:36Обычно модели вознаграждают только за итоговый результат.
00:03:39Но здесь модель поощряют еще и за то, насколько хорошо она умеет параллелить шаги
00:03:43и выступать в роли руководителя.
00:03:44Проще говоря, Kimi специально натренирована быть оркестратором.
00:03:48Критерий её успеха — умение создавать субагентов и делегировать задачи.
00:03:53Функции создания агентов и назначения ролей вшиты прямо в оркестратор.
00:03:58Она запускает помощников под разные нужды, раздает им указания,
00:04:02собирает результаты и сводит всё в единый финал.
00:04:06По словам авторов, этот метод «роя» улучшает работу со сложными задачами.
00:04:11Внутренние тесты показали сокращение времени выполнения на 80%.
00:04:16Это позволяет справляться с гораздо более масштабными и долгосрочными проектами.
00:04:20Они сравнили её с лучшими моделями для сложных задач,
00:04:23такими как Opus 4.5, а также с Kimi 2.5 без использования «роя»,
00:04:26и выяснили, что связка Kimi 2.5 с агентами превзошла всех конкурентов в бенчмарках.
00:04:32К тому же, использование группы агентов вместо одного позволило существенно сэкономить время.
00:04:36Всё это были заявления разработчиков.
00:04:39Для проверки мы установили KimiCode CLI —
00:04:42нового кодинг-агента, выпущенного вместе с этой моделью.
00:04:45У нас уже был готовый интерфейс, который мы хотели перевести на другую структуру компонентов.
00:04:49Проект был написан на ShadCN, а мы решили переделать его на Material UI.
00:04:53В проекте было много страниц,
00:04:55поэтому мы попросили Kimi поменять UI всего проекта с ShadCN на Material UI,
00:05:00используя агентов для каждой страницы,
00:05:02чтобы миграция прошла быстрее за счет параллельной работы.
00:05:05Модель начала сканировать директории, подобно тому как это делает Claude Code.
00:05:08Она составила список всех страниц, требующих конвертации.
00:05:13Похожие страницы были сгруппированы,
00:05:15например, страницы регистрации, входа и восстановления пароля, для более эффективной обработки.
00:05:20Однако она запустила больше агентов, чем мы ожидали,
00:05:23что, как выяснилось позже, было багом в CLI.
00:05:26В итоге для задачи было задействовано пять агентов,
00:05:28что вполне допустимо для нового продукта.
00:05:30Весь процесс занял около 15 минут,
00:05:32хотя мы надеялись на большее ускорение за счет параллелизма.
00:05:35В конце модель проверила и почистила проект.
00:05:38Некоторые компоненты после миграции стали не нужны,
00:05:41и она их удалила.
00:05:43Kimi проследила, чтобы все зависимости были установлены и обновлены,
00:05:45включая файлы тестов, и проверила остальное.
00:05:48После завершения она удалила все хвосты от ShadCN,
00:05:53не оставив лишнего мусора в зависимостях,
00:05:55про который большинство агентов обычно забывают, раздувая проект.
00:05:59Интерфейс был слегка изменен.
00:06:01К примеру, в главном блоке текст и картинка изначально стояли в ряд,
00:06:05а модель расположила их друг под другом.
00:06:07В остальном всё выглядело практически идентично,
00:06:10просто с заменой библиотеки компонентов.
00:06:12Несмотря на масштаб задачи, было использовано лишь 25% контекстного окна,
00:06:16а значит, модель может эффективно работать в долгих сессиях.
00:06:19Итак, «рой» агентов работает, но это не всегда дает выигрыш в скорости,
00:06:22особенно на очень больших кодовых базах.
00:06:24Вы, наверное, заметили, что в наших роликах мы много чего создаем.
00:06:27Все промпты, код, шаблоны —
00:06:29всё то, что обычно приходится копировать с экрана, ставя видео на паузу.
00:06:32Всё это есть в нашем сообществе — и по этому ролику, и по всем предыдущим.
00:06:35Ссылки в описании.
00:06:37Главная фишка Kimi 2.5 — это её визуальный агентный интеллект.
00:06:41Заявлено, что она особенно сильна во фронтенде.
00:06:44Она может взаимодействовать со сложными макетами и внедрять продвинутую анимацию,
00:06:48например, скроллинг текста.
00:06:50Разработчики показали несколько примеров анимации, и все они были выполнены качественно.
00:06:53Но вот где она реально выделяется.
00:06:55Kimi 2.5 отлично кодит «по картинке», выходя за рамки простых текстовых и фото-запросов.
00:07:00Она может принимать видео в качестве входных данных и генерировать код,
00:07:03став одной из первых моделей с такой функцией.
00:07:06Это значительно упрощает объяснение того, как должен работать интерфейс.
00:07:08Данная мультимодальность не была прикручена позже.
00:07:12Её интегрировали непосредственно в процессе обучения.
00:07:14В большинстве случаев дополнительные возможности добавляют
00:07:16уже после того, как текстовая база станет достаточно сильной,
00:07:19что часто приводит к компромиссу между качеством зрения и пониманием текста.
00:07:23Но благодаря методике обучения Kimi 2.5,
00:07:25этот компромисс исчезает, и обе способности развиваются параллельно.
00:07:29Разумеется, мы протестировали это сами.
00:07:30Мы записали видео, как создаем новую страницу в Notion и используем слеш-команды.
00:07:35Запись была короткой, так как в документации указан лимит на видео в 40 МБ.
00:07:40Мы дали ссылку на запись и попросили клонировать сайт из видео.
00:07:45Мы намеренно не уточняли в промпте, что именно на видео,
00:07:48поэтому модель использовала инструмент анализа медиафайлов.
00:07:52Она поняла, что это интерфейс в стиле Notion, распознала все функции
00:07:56и определила, что это клон Notion в окне в стиле Mac OS.
00:07:59Составив описание увиденного, она приступила к реализации.
00:08:02Если планируете использовать обработку видео в своих проектах, помните об одном.
00:08:06Видео и изображения быстро съедают контекстное окно,
00:08:09так что следите за размером файлов и перегрузкой контекста.
00:08:12Копия интерфейса получилась точной.
00:08:15UI был редактируемым, включая иконки страниц и фишки Notion,
00:08:18хотя поначалу не всё работало как надо.
00:08:21Слеш-команды сначала не запускались, но внешне всё было очень похоже.
00:08:25Было бы круче, если бы команды работали сразу, ведь это ключевая часть рабочего процесса.
00:08:29Но это мелочь, которую можно было исправить итерациями.
00:08:32Мы дали промпт с просьбой исправить недочеты в текущей реализации.
00:08:37После этого модель начала самоитерацию: вносила правки, проверяла результат
00:08:41и добивалась работы функций без дальнейших подсказок с нашей стороны.
00:08:46В итоге проблема со слеш-командами была решена,
00:08:49и интерфейс превратился в полноценный клон Notion.
00:08:52Так что обещания разработчиков подтверждаются.
00:08:54Разобравшись с парой нюансов, мы пришли к выводу, что это может быть отличной дешевой альтернативой Claude Code,
00:08:58учитывая, что тарифы Claude довольно высокие, а Kimi стоит заметно меньше.
00:09:03На этом наш обзор подходит к концу.
00:09:05Если хотите поддержать канал и помочь нам выпускать такие видео чаще,
00:09:08присоединяйтесь к AI Labs Pro.
00:09:10Как всегда, спасибо за просмотр, и до встречи в следующем выпуске!

Key Takeaway

Kimi 2.5 от Moonshot — это мощная мультимодальная модель с архитектурой MoE, которая совершает прорыв в автоматизации разработки благодаря встроенным способностям к оркестровке агентов и анализу видео-интерфейсов.

Highlights

Kimi 2.5 является моделью с открытыми весами (open-weight), а не полностью open-source, что накладывает ограничения на доступ к коду обучения.

Архитектура Mixture of Experts (MoE) с 1 триллионом параметров позволяет достигать высокой точности при низких затратах ресурсов.

Модель специально обучена технике «роя» для управления до 100 параллельными субагентами, что ускоряет решение сложных задач.

Внедрена нативная мультимодальность, позволяющая анализировать видео и генерировать код на его основе без потери качества текста.

KimiCode CLI продемонстрировал способность к глубокой рефакторизации кода и автоматической очистке проекта от лишних зависимостей.

Модель позиционируется как доступная и эффективная альтернатива дорогостоящим решениям вроде Claude Code.

Timeline

Введение и технические характеристики Kimi 2.5

Автор представляет новую модель Kimi 2.5 от компании Moonshot, уточняя разницу между понятиями open-source и open-weight. Техническая основа базируется на архитектуре Mixture of Experts, где из 1 триллиона параметров активны одновременно только 32 миллиарда. Это решение обеспечивает высокую скорость работы и значительно снижает стоимость эксплуатации по сравнению с конкурентами. Спикер подчеркивает, что модель обучалась с подкреплением (RL) для эффективного распределения задач между агентами. Основной акцент сделан на нативной мультимодальности, объединяющей зрение и кодинг.

Обзор спонсорского решения: Opera Neon

В этом сегменте рассматривается Opera Neon, позиционируемый как первый агентный браузер для продвинутых пользователей. Вместо привычных вкладок в интерфейсе используются «Задачи», создающие сфокусированные рабочие пространства. Одной из ключевых функций является Neon Make, позволяющая генерировать и развертывать мини-приложения прямо в браузере. Инструмент Neon Do помогает автоматизировать сбор данных, выступая в роли встроенного младшего разработчика. Данный раздел объясняет, как современные браузеры интегрируют ИИ для оптимизации рабочих процессов.

Механика оркестровки «роя» агентов

Спикер подробно объясняет уникальность системы управления агентами в Kimi 2.5, которая способна координировать до 100 субагентов одновременно. В отличие от других моделей, Kimi получает вознаграждение в процессе обучения именно за качество делегирования и параллелизации шагов. Разработчики заявляют о сокращении времени выполнения сложных проектов на 80% благодаря этой методике. Внутренние бенчмарки показывают преимущество Kimi над Opus 4.5 при выполнении комплексных задач. Это превращает модель из простого чат-бота в полноценного руководителя цифрового рабочего процесса.

Практический тест: Миграция UI-компонентов

Для проверки заявлений разработчиков проводится тест KimiCode CLI на реальном проекте по переводу интерфейса с ShadCN на Material UI. Модель просканировала директории, сгруппировала страницы и запустила параллельные рабочие процессы для конвертации кода. Несмотря на небольшой баг в количестве запущенных агентов, процесс занял 15 минут и завершился полной очисткой зависимостей. Автор отмечает, что Kimi удалила неиспользуемые файлы, чего часто не делают другие ИИ-агенты. Результат теста подтвердил эффективность модели в задачах рефакторинга и управления контекстом.

Визуальный интеллект и клонирование по видео

Рассматривается главная особенность модели — способность генерировать код на основе видеозаписи интерфейса. В ходе эксперимента Kimi 2.5 успешно проанализировала видео создания страницы в Notion и воссоздала его интерфейс в стиле Mac OS. Модель самостоятельно распознала элементы дизайна и логику работы слеш-команд, даже без подробных текстовых пояснений. Через процесс самоитерации ИИ исправил ошибки в работе функций, превратив статичную картинку в рабочее веб-приложение. Это демонстрирует преимущество нативной интеграции визуального и текстового обучения.

Заключение и выводы

Автор подводит итоги обзора, называя Kimi 2.5 отличной бюджетной альтернативой премиальным инструментам разработки. Основные обещания создателей по поводу мультимодальности и агентской оркестровки подтвердились в ходе практических испытаний. Зрителям предлагается присоединиться к сообществу AI Labs Pro для получения доступа к использованным в видео промптам и шаблонам. Видео завершается призывом следить за новыми выпусками в эру стремительного развития ИИ-агентов. Спикер выражает уверенность в том, что подобные доступные модели изменят ландшафт программирования.

Community Posts

View all posts