Kimi K2.6 может запустить бизнес за 40 минут! (Полный разбор модели)

BBetter Stack
컴퓨터/소프트웨어마케팅/광고창업/스타트업AI/미래기술

Transcript

00:00:00Как видите на этом примере, вы можете практически запустить свое маленькое веб-агентство
00:00:04всего за 40 минут, используя эту функцию Kimi.
00:00:07Что ж, друзья, Moonshot AI вернулись с очередным обновлением своей флагманской модели Kimi.
00:00:13Kimi K 2.6 — их новейшая модель, которая обещает передовые возможности в кодинге,
00:00:18долгосрочное выполнение задач и работу агентских роев.
00:00:22В сегодняшнем видео мы рассмотрим эту новую модель, оценим, как она справляется с различными
00:00:27агентскими задачами, и узнаем, действительно ли она так впечатляет, как заявлено.
00:00:32Будет очень интересно, так что давайте начнем.
00:00:34Несколько месяцев назад я делал обзор на Kimi K 2.5, и она отлично справилась с фронтенд-дизайном.
00:00:44И меня искренне впечатлила их функция «агентского роя» (agent swarm).
00:00:48Мне также понравилось, сколько усилий они вложили в UX на странице своего чат-бота.
00:00:54Итак, в этой новой итерации Kimi обещает довольно масштабные
00:00:57шаги вперед в том, как мы используем ИИ-агентов в производственной среде.
00:01:02Во-первых, возможности агентского роя увеличились практически втрое.
00:01:05В версии K 2.5 мы видели около 100 субагентов, но K 2.6 горизонтально масштабируется
00:01:12до 300 специализированных агентов, которые могут выполнять до 4000 скоординированных шагов.
00:01:18Так что это довольно внушительное обновление.
00:01:20Теперь вы можете запускать больше параллельных задач одновременно.
00:01:24Они также добавили новый «режим сохранения мышления» (preserved thinking mode),
00:01:26который поддерживает согласованность логической цепочки модели в многоходовых задачах.
00:01:31Это предотвращает дрейф памяти, который обычно случается, когда вы глубоко погружены в сложный рабочий процесс.
00:01:36А еще у нас есть задачи с долгосрочной перспективой.
00:01:39В их собственных тестах модель справилась с 13-часовой инженерной задачей, показав рост пропускной способности на 185%.
00:01:46А что касается эстетики, то она перешла к дизайну на основе кода.
00:01:51Вместо того чтобы просто создавать красивый лендинг, K 2.6 использует свой собственный встроенный визуальный энкодер
00:01:57под названием MoonVIT, чтобы глубже анализировать структуры UI и UX.
00:02:03Теперь она может обрабатывать полностековые рабочие процессы, от аутентификации до логирования в базе данных,
00:02:08превращая единый визуальный референс или промпт в полностью функциональный интерактивный прототип
00:02:14с анимациями GSAP, эффектами при прокрутке и прочими полезными вещами.
00:02:19И, кстати, всё это с открытым исходным кодом, включая визуальный энкодер.
00:02:23Так что, если захотите, вы можете запускать ее автономно,
00:02:26отдельно от архитектуры Kimi, если скачаете модель с Hugging Face.
00:02:30Всё это звучит очень впечатляюще, но давайте протестируем и посмотрим, как это работает на самом деле.
00:02:35Модели Kimi с открытым исходным кодом, так что теоретически вы можете использовать их в любой удобной вам среде.
00:02:40Но чтобы протестировать их «агентский рой», я буду использовать их собственный интерфейс чат-бота
00:02:46для достижения наилучших результатов. Во-первых, я хочу попробовать новую функцию «агентского роя».
00:02:50Изучая примеры на их сайте, я обратил внимание на одну вещь.
00:02:54Это был раздел, где K 2.6 использовали для поиска 30 розничных магазинов в Лос-Анджелесе без
00:03:01официальных веб-сайтов на Google Картах и генерации для каждого из них конверсионных лендингов.
00:03:06Я видел, как этот тренд расходится в Instagram, поэтому хочу попробовать и проверить, сможем ли мы реально
00:03:11создать свое маленькое веб-агентство. Итак, для этого теста я решил сделать кое-что похожее.
00:03:16Я живу в Торонто, и заметил, что у многих нотариусов в моем районе сайты либо отсутствуют, либо очень устарели.
00:03:21Поэтому я подумал, что было бы круто найти
00:03:2620 нотариусов в Большом Торонто, поискать их на Google Картах или в
00:03:32канадских «Желтых страницах» и сгенерировать для каждого из них конверсионные лендинги.
00:03:37И для этой задачи Kimi запустила пять субагентов, каждый из которых отвечал за одну из подзадач.
00:03:43Было интересно наблюдать, как субагенты перемещаются по сети и посещают
00:03:48сайты. Они даже пытались оценить, устарел сайт или нет, используя собственное
00:03:53суждение. В общей сложности у Kimi ушло около 40 минут на завершение всего процесса.
00:03:58Но по итогу Kimi создала подробный аналитический отчет со всеми выводами
00:04:03о каждом сайте. Она даже сгенерировала пример письма для рассылки, которое я мог бы отправить потенциальным
00:04:09клиентам с предложениями по веб-сайту, а также отчет об общем объеме рынка и потенциале получения дохода.
00:04:16И вместе с этим, конечно, мы получили все сгенерированные файлы. А еще есть
00:04:22выделенная страница, созданная Kimi, где я могу просмотреть каждый лендинг. И я должен
00:04:27сказать, что все эти лендинги выглядят абсолютно одинаково, что немного разочаровывает. Но, может быть,
00:04:32это была моя ошибка — я дал недостаточно подробный промпт, хотя на их собственном сайте был
00:04:38использован такой же промпт. Но, возможно, у них были заранее настроенные «обвязки» (harnesses). Поэтому в качестве последующей задачи
00:04:43я попросил Kimi пройтись по каждой странице и применить уникальный стиль для каждой, а также добавить
00:04:49изображения, чтобы сделать лендинги более захватывающими. И здесь мы видим, что Kimi действительно сгенерировала
00:04:55пользовательские изображения для каждого сайта. И, как забавное примечание, я также заметил, как Kimi любит
00:05:00хвалить себя. Например, здесь: «все 20 изображений потрясающие». Теперь я создам 20 полностью
00:05:06уникальных лендингов. Я имею в виду, ладно, Kimi, но позволь мне быть судьей в этом вопросе. В любом случае, Kimi потребовалось
00:05:12около 17 минут, чтобы закончить эту дополнительную задачу. И снова мы видим здесь, как Kimi хвалит себя,
00:05:17что лендинги выглядят фантастически. Ладно, Kimi, ладно. Теперь у нас есть новая страница предварительного просмотра,
00:05:23но она странным образом сломана. Наверное, там возникла проблема с CSS-стилями или что-то в этом роде, но это нормально.
00:05:28Я не буду обращать на это внимание. Меня больше интересуют сами веб-страницы. Новые страницы действительно выглядят намного
00:05:34лучше, потому что теперь у нас есть эти приятные CSS-анимации, и на каждой веб-странице теперь есть заголовок с изображением,
00:05:40сгенерированным ИИ, но тем не менее, это хороший заголовок. Но я также заметил, что каждая страница
00:05:45по-прежнему следует одной и той же схеме. У нас те же разделы, та же структура сайта. Поэтому, хотя
00:05:51все эти страницы теперь выглядят иначе, у них всё равно один и тот же шаблон (boilerplate), что немного
00:05:56разочаровывает, потому что я очень надеялся на более уникальный подход. Но это хорошее начало,
00:06:02тем не менее. Итак, как видите по этому примеру, вы можете практически запустить свое маленькое веб-агентство
00:06:07всего за 40 минут с помощью этой функции Kimi. Просто попросите «агентский рой» Kimi пройтись по вашим
00:06:13местным предприятиям и связаться с каждым из них с помощью специально адаптированного сайта и специально адаптированного
00:06:18письма для рассылки, и у вас, по сути, готов хороший подработок. Я представляю, что после этого видео каждый маленький
00:06:25местный бизнес начнет получать сотни таких писем с предложениями со специально
00:06:29адаптированными веб-сайтами, сгенерированными ИИ. Но что есть, то есть. И я должен отметить, что для использования этой функции «агентского роя»
00:06:36вам нужно быть на их плане Allegretto. Но я также должен сказать, что, я почти
00:06:41уверен, это намного дешевле, чем просить Claude Code выполнить ту же задачу. Жаль только, что статистика использования Kimi
00:06:46не дает нам больше деталей о том, сколько токенов было потрачено на эту гигантскую 40-минутную
00:06:53задачу. Но у меня такое чувство, что я бы наверняка исчерпал все свои лимиты использования к этому моменту,
00:06:58если бы я использовал Claude для выполнения того же самого. В общем, это новый улучшенный агентский рой. И, кстати,
00:07:04если вы недавно использовали агентский рой Kimi для проведения каких-либо интересных экспериментов, поделитесь своими
00:07:09результатами в комментариях ниже. Теперь я хочу проверить, как Kimi улучшилась в плане кодинга.
00:07:14Итак, они утверждают, что 2.6 показала сильные улучшения в долгосрочных задачах по программированию с надежной
00:07:20генерализацией. Для этой задачи я решил попросить Kimi создать простое веб-приложение с фронтендом
00:07:26и бэкенд-интерфейсом, который также поддерживает веб-скрейпинг. Наверное, все мы слышали, какими безумно
00:07:31дорогими стали цены на оперативную память за последние месяцы. Поэтому я подумал, что было бы круто
00:07:36создать сайт для сравнения цен, который активно собирает данные о ценах на различную оперативную память и предоставляет вам
00:07:42сравнительную таблицу, чтобы найти самые дешевые варианты. На выполнение этой задачи у Kimi ушло примерно 12 минут.
00:07:47И я вижу, что они теперь добавили счетчик токенов в свою новейшую
00:07:52версию CLI. Так что теперь мы можем следить за реальным расходом токенов, что довольно круто. Итак, вот
00:07:59конечный результат. Как видите, сайт оформлен в приятной темной теме. И мы можем переключаться
00:08:05между отдельными брендами. Мы также можем видеть различные варианты цен в разных магазинах для
00:08:11каждого модуля оперативной памяти. И что еще круче, мы можем запустить «живое обновление» (live refresh), которое активно
00:08:16пересобирает данные магазинов. Жаль, что не удалось загрузить большинство изображений товаров,
00:08:21но основная функциональность на месте. Также есть раздел сравнения. Но нет возможности добавить
00:08:27туда что-либо. Поэтому мне пришлось дать Kimi последующую задачу, чтобы исправить эту проблему. И теперь мы получаем кнопку
00:08:34«добавить к сравнению». И если мы перейдем на вкладку сравнения, то получим отличную сравнительную таблицу
00:08:41всех выбранных модулей оперативной памяти. Так что это довольно хорошо. И глядя на код, я вижу, что модель решила
00:08:46создать сайт, используя «голый» Node.js и Express. Она даже не использовала React, а вместо этого выбрала
00:08:53эту версию на ванильном JavaScript, где каждое изменение напрямую модифицирует элемент innerHTML, что является
00:08:59интересным выбором. Но эй, если это работает, я не могу жаловаться. И, наконец, она даже добавила эти замечательные
00:09:05функции-скрейперы, которые используют Axios и Cheerio для скрейпинга Amazon, Newegg и Best Buy. Так что это
00:09:13довольно круто. Вот и всё, друзья, это новая модель Kimi K 2.6. И, честно говоря,
00:09:19судя по всем тестам, которые мы провели сегодня, я бы не сказал, что это гигантский шаг вперед по сравнению с 2.5.
00:09:25Но есть некоторые действительно приятные улучшения для удобства использования. И я ценю тот факт, что
00:09:30Moonshot AI продолжает активно улучшать свою платформу. И мне также нравится, что они предоставляют солидную
00:09:36более дешевую альтернативу некоторым более дорогим гигантам, таким как Claude Code. В общем,
00:09:43отличная работа, Moonshot AI, продолжайте в том же духе. И я с нетерпением жду, как Kimi улучшится в
00:09:48будущем. И, друзья, если вы нашли это видео полезным или информативным, пожалуйста, дайте мне знать,
00:09:53нажав кнопку лайка под видео. И также обязательно подпишитесь на наш канал, чтобы
00:09:58не пропустить ни одно из наших будущих видео с техническими разборами. Это был Андрес из
00:10:04Better Stack, и увидимся в следующих видео.

Key Takeaway

Обновленная модель Kimi K 2.6 расширяет возможности агентского роя до 300 субагентов и автоматизирует разработку функциональных веб-приложений и лендингов за 40 минут при более низкой стоимости использования по сравнению с конкурентами.

Highlights

  • Модель Kimi K 2.6 поддерживает горизонтальное масштабирование до 300 специализированных агентов, способных выполнять 4000 скоординированных шагов.

  • Внутренние тесты показывают рост пропускной способности на 185% при выполнении 13-часовых инженерных задач.

  • Встроенный визуальный энкодер MoonVIT анализирует структуры UI и UX для преобразования промптов в функциональные интерактивные прототипы с анимациями GSAP.

  • Автоматизация процесса поиска и создания лендингов для 20 местных компаний занимает около 40 минут.

  • Новый «режим сохранения мышления» поддерживает согласованность логической цепочки в многоходовых задачах, предотвращая дрейф памяти модели.

Timeline

Обновления агентской архитектуры Kimi K 2.6

  • Масштабируемость роя агентов увеличена в три раза по сравнению с версией 2.5.
  • Режим сохранения мышления исключает потерю контекста в глубоких рабочих процессах.
  • Дизайн на основе кода использует визуальный энкодер MoonVIT для анализа структур интерфейсов.

Модель Kimi K 2.6 представляет значительный сдвиг в сторону производственной среды. Увеличение числа субагентов до 300 позволяет выполнять до 4000 шагов в рамках одного задания. Внедрение MoonVIT позволяет превращать визуальные референсы в прототипы с поддержкой аутентификации и логирования базы данных. Весь инструментарий, включая визуальный энкодер, доступен с открытым исходным кодом.

Практическое использование агентского роя для бизнеса

  • Поиск 20 потенциальных клиентов и создание для них лендингов занимает около 40 минут.
  • Использование специализированных промптов позволяет генерировать уникальные изображения для каждой веб-страницы.
  • Для работы с агентским роем требуется подписка на тариф Allegretto.

Автоматизированный поиск нотариусов в Торонто через Google Карты и Желтые страницы продемонстрировал возможности модели по генерации контента и аналитических отчетов. Хотя первая итерация создала страницы с общим шаблоном, последующая доработка позволила добавить уникальные стили и изображения. Модель также автоматически подготавливает сопроводительные письма для потенциальных клиентов.

Тестирование возможностей программирования

  • Создание приложения для сравнения цен на оперативную память потребовало 12 минут.
  • Реализованы функции скрейпинга данных с использованием библиотек Axios и Cheerio.
  • В CLI добавлен встроенный счетчик токенов для отслеживания расхода ресурсов.

Задача по созданию веб-приложения на Node.js и Express с поддержкой сравнения цен и живого обновления данных была успешно реализована. Модель выбрала подход на ванильном JavaScript с прямой модификацией элементов DOM. Интеграция счетчика токенов в CLI позволила наглядно видеть затраты вычислительных ресурсов при выполнении сложных инженерных задач.

Community Posts

View all posts