Transcript
00:00:00Эй, Джарвис, давай сводку на сегодня.
00:00:03Доброе утро.
00:00:04У тебя около 466 000 подписчиков на всех платформах, плюс 3 000 за эту неделю.
00:00:12Последние видео набирают около 4 000 просмотров в день, 17 000 на данный момент.
00:00:18Главная новость в сфере ИИ сегодня: правительство США заставило Anthropic приостановить публичный доступ к их топовой модели класса Mythos.
00:00:27Самое важное в списке на сегодня — смонтировать и выпустить видео с демонстрацией HUD Джарвиса.
00:00:33Хочешь, чтобы я провёл ежедневный аудит входящих, или у тебя другие планы?
00:00:37Так что же мы здесь видим?
00:00:39Ну, это Джарвис, наша ОС на базе Claude Fable 5.
00:00:43Когда мы говорим Fable 5, я имею в виду, что система была создана с использованием Fable 5, но для её работы не требуется наличие Fable 5.
00:00:51На самом деле, многое из того, что вы видите, работает полностью локально и может запускаться практически на любой модели.
00:00:58Если вы видели мои предыдущие видео об агентной ОС, то понимаете, о чём речь.
00:01:01Мы взяли Claude Code и добавили поверх еще один слой, который дает нам возможности, недоступные в обычном терминале.
00:01:08Например, визуальные метрики, кнопки для навыков, и это не просто «театр продуктивности».
00:01:15Это инструмент, который даёт реальный прирост тем, кто работает в разных доменах, и который мы можем легко передать клиентам или членам команды, далёким от технологий.
00:01:26И Джарвис — это просто следующая эволюция данной модели агентной ОС.
00:01:30Его основа — надёжная, полностью настраиваемая архитектура навыков Claude Code, которая преобразует ваши повседневные задачи и ручные рабочие процессы в навыки и автоматизацию.
00:01:43И именно на этом фундаменте мы строим всё остальное.
00:01:46В сегодняшнем видео я покажу, как это работает, в чём заключается реальная ценность и как вы можете создать нечто подобное для себя.
00:01:53Я думаю, из этого проекта можно многое почерпнуть, особенно касательно локальной динамики голосовой модели.
00:01:58Перед тем как погрузиться в детали, пара слов от спонсора сегодняшнего видео — меня самого.
00:02:02Внутри Chase AI+ у вас есть не только доступ к моей настройке, которую вы видите в этом видео, но и мастер-класс по Claude Code — лучший способ начать путь в ИИ-разработке с нуля, особенно если у вас нет технического образования.
00:02:14Я обновляю его каждую неделю, плюс туда входит мастер-класс по Codex.
00:02:18Так что если хотите оставаться на переднем крае ИИ, вам сюда.
00:02:23Сейчас у нас действуют скидки на подписку, если интересно — загляните в закреплённый комментарий.
00:02:28Итак, давайте осмотримся в Джарвисе, чтобы вы поняли, на что именно смотрите.
00:02:34После этого заглянем под капот, чтобы увидеть, как это работает, и чтобы вы могли настроить и собрать систему самостоятельно.
00:02:41Прямо по центру у нас голосовой аспект, опять же, полностью локальный, что делает его довольно быстрым и отзывчивым по сравнению с использованием сервисов вроде 11Labs.
00:02:53В начале видео вы слышали, как Джарвис выдал мне информацию о моих последних видео, количестве подписчиков, новостях ИИ и тому подобном.
00:03:01Это не захардкоженный сценарий.
00:03:03Когда я спрашиваю Джарвиса: “Эй, дай сводку на сегодня” или “Что там интересного?”, он просматривает отчёты, автоматически созданные в моём Obsidian Vault, и определяет, что из них действительно важно и о чём мне следует знать.
00:03:18Вы могли заметить, что во время этого появлялись всплывающие окна — это отчёты или ссылки, которые актуальны в контексте разговора.
00:03:29Он сказал что-то вроде “твое последнее видео показывает такие-то результаты”, и появилось всплывающее окно с переходом к этому видео.
00:03:37Он упомянул новости об Anthropic, о том, что Fable 5, по сути, отменили из-за правительства.
00:03:42Что он делает?
00:03:43Он показывает исходную статью.
00:03:44Он также рассказал о трендах в новостях ИИ, и всё это было взято из утреннего отчёта.
00:03:49Если я кликну по нему, вы увидите полный текст.
00:03:52Этот текст находится в Obsidian.
00:03:54Вся эта система связана с Obsidian.
00:03:56Я могу прочитать это здесь, но также могу нажать “Открыть в Obsidian”, и отчёт откроется внутри программы.
00:04:04Я могу переходить по ссылкам, всё взаимосвязано.
00:04:07Вы также помните, как в конце он спросил: “Хочешь, я проведу аудит входящих писем?”
00:04:12“Хочешь, я загляну в твой Gmail, посмотрю, что важно и на что нужно ответить?”
00:04:15Что ж, это навык, и эти навыки и автоматизации представлены справа.
00:04:21Это позволяет мне мгновенно запускать любой навык или автоматизацию Cloud Code одним нажатием кнопки.
00:04:26И опять же, если помните, что мы делали с нашей облачной ОС, которую создали в Obsidian на той неделе, — идея ровно та же.
00:04:33Дополнительная ценность здесь заключается в том, что если вы работаете с нетехнической командой или нетехническим клиентом,
00:04:39и они хотят запускать навыки и автоматизации с помощью Cloud Code, но не из тех, кто когда-либо откроет терминал.
00:04:44Это даёт им всю мощь системы с помощью кнопок, и всё можно настроить.
00:04:49Допустим, мне нужен полный обзор входящих.
00:04:52Если я нажму кнопку “Inbox Brief” вверху справа, сразу увижу, что задача в очереди.
00:05:00Мы видим это здесь, а также всплывающее окно с прогресс-баром, показывающее, что автоматизация выполняется.
00:05:09Как только всё закончится, он не только создаст отчёт, но и даст устную сводку: “Вот что происходит, на это стоит обратить внимание”.
00:05:16Он дал быструю устную сводку, а сам отчёт, как всегда, доступен в Obsidian.
00:05:34Эти всплывающие окна полезны, релевантны, они ссылаются на важные вещи, и я могу очистить их в любой момент.
00:05:39Теперь посмотрим на правый край повнимательнее.
00:05:41Об этом я уже говорил.
00:05:43У нас есть разные навыки, которые можно менять в любое время.
00:05:45Один клик — и они запускаются.
00:05:47Ниже — расписание.
00:05:50Это моё ежедневное расписание, привязанное к Google Calendar.
00:05:53Нажимаю — открывается календарь.
00:05:56Раздел аудио.
00:05:58Когда Джарвис говорил, вы могли видеть анимацию, подтверждающую, что всё работает.
00:06:05А ниже — краткая сводка новостей ИИ.
00:06:10Всё, что вы здесь видите, как и всё, о чём мы говорили, полностью настраиваемо.
00:06:15Может, вам не нужно расписание из Google Calendar.
00:06:18Может, вам не интересна визуализация аудио или лента новостей ИИ.
00:06:21Это нормально.
00:06:22Прелесть этих агентных ОС в том, что это не универсальное решение.
00:06:29Это набор инструментов, которые я вам показываю, а вы можете делать с ними всё что угодно.
00:06:34Ваши метрики будут отличаться от моих.
00:06:36Вещи, которые вам нужно держать под рукой, будут совсем другими.
00:06:40Всё зависит от ваших рабочих процессов.
00:06:44Плюс в том, что при создании системы для клиентов или коллег вы можете настроить её как угодно специально под них.
00:06:51Слева — то же самое.
00:06:53Там данные: количество подписчиков, информация о последнем видео.
00:06:58У меня есть трекер токенов Claude за последние пять часов.
00:07:01И директивы.
00:07:03Директивы — это просто “вот три главные вещи на сегодня”.
00:07:06Опять же, всё динамично, Claude Code определяет это на основе моего расписания.
00:07:10И ещё трек документов.
00:07:13Всё, что создано или упомянуто Джарвисом, появляется не только как всплывающее окно.
00:07:18Оно здесь.
00:07:18Если я хочу открыть, скажем, утренний отчёт — он прямо тут.
00:07:22Вот и весь пользовательский интерфейс.
00:07:23Это визуальная сторона Джарвиса.
00:07:25Теперь о технической начинке.
00:07:28Что там происходит под капотом?
00:07:29Потому что это важнее всего, честно говоря.
00:07:32Если бы мы просто остановились на красивом интерфейсе, это была бы только “театр продуктивности”.
00:07:37Если это должно реально помогать, а не просто быть заменой терминалу, нужна прочная основа.
00:07:43И вот как это выглядит.
00:07:45Давайте пройдёмся по тому, что происходит, когда вы даёте Джарвису задание, потому что путей развития событий может быть много.
00:07:53Допустим, вы говорите Джарвису: “Дай обновление по утреннему отчёту”.
00:08:00У вас есть автоматизация, которая запускается каждое утро.
00:08:03Она собирает актуальную для вас информацию, и вы хотите, чтобы Джарвис озвучил её.
00:08:07Вы не хотите читать.
00:08:07Вы хотите, чтобы он либо запустил её, либо, если она уже запущена, рассказал о ней.
00:08:12Вы говорите Джарвису: “Что там в утреннем отчёте?”
00:08:18Этот голос, поскольку вы использовали микрофон, передаётся в Faster Whisper.
00:08:25Faster Whisper — бесплатная локальная программа, которая переведёт вашу речь в текст.
00:08:34Есть тысячи локальных аудио-транскрибаторов.
00:08:39Вы можете заменить этот на любой другой.
00:08:40Я выбрал этот, потому что он отлично работает.
00:08:42Итак, голос превратился в транскрипт.
00:08:46Что делать дальше?
00:08:47Мы говорили о Fable 5 и всём остальном.
00:08:50Нужно ли каждый транскрипт отправлять в Cloud Code и запускать Fable 5, чтобы он его проанализировал?
00:08:55Нет, конечно.
00:08:56Система создана на Fable 5, но под капотом часто работают Opus или Sonnet,
00:09:02или вообще локальная модель для многих задач, потому что Джарвис — хоть и может всё...
00:09:08можно использовать Fable, и всё будет хорошо.
00:09:11Это не создание сложных проектов.
00:09:13Это скорее персональный ассистент или решение для нетехнической команды, которой нужно
00:09:17делать схожие вещи с удобным и понятным интерфейсом.
00:09:22Это общая картина.
00:09:24Итак, мы получили транскрипт речи.
00:09:26Что теперь с ним делать?
00:09:28У нас есть три варианта.
00:09:30Первый: можем ли мы маршрутизировать транскрипт или запрос с помощью регулярных выражений (regex)?
00:09:39Это скрипт, детерминированный код, ИИ здесь не задействован,
00:09:45он просто проверяет, соответствует ли транскрипт фразам,
00:09:52которые автоматически должны что-то делать.
00:09:55Что это значит?
00:09:56Ну, что я сказал в начале?
00:09:58Сводка на сегодня, правильно?
00:10:00Я использовал термин “сводка”.
00:10:03“Сводка” — это специфическое триггерное слово, которое regex ловит и автоматически направляет по нужному маршруту.
00:10:11И это действие — то, что вы слышали в начале.
00:10:14Просмотреть отчёты, сказать, что происходит, дать сводку за день.
00:10:19Базовая суммаризация, поэтому система ловит ключевое слово и выполняет конкретную задачу.
00:10:24Это хорошо, так как это просто код, это ничего не стоит, ИИ не участвует, и это очень, очень быстро.
00:10:32В идеальном мире мы могли бы делать всё так.
00:10:36Но это невозможно, потому что в большинстве случаев просьбы к ИИ-системе могут быть довольно размытыми.
00:10:43Требуется немного интеллекта, чтобы понять, что делать и как маршрутизировать.
00:10:47И здесь приходит вариант два — Haiku.
00:10:51Почему мы используем Haiku?
00:10:52Почему мы используем самую “глупую” модель Anthropic?
00:10:54Потому что она дёшевая и быстрая.
00:10:57Мы просто выполняем маршрутизацию.
00:11:01Я не делаю ничего, кроме как использую regex, если точно знаю, куда отправить запрос.
00:11:06Мы просто пытаемся выяснить на этом этапе, куда должен уйти ответ и кто его выполнит.
00:11:11Haiku очень хороша в этом.
00:11:13Большинство вещей, которые вы будете просить Джарвиса, не слишком сложны.
00:11:18Ей нужно просто понять, по какому пути пойти, и Haiku с этим справляется.
00:11:22Опять же, мы говорим о долях цента за каждый запрос.
00:11:26Третий вариант — использовать полностью локальную модель, что я включил в свою систему.
00:11:34Можно вообще не использовать Haiku.
00:11:35Можно использовать модель на локальном компьютере, что опять же подчеркивает локальную составляющую.
00:11:42Она смотрит на транскрипт и решает, как маршрутизировать.
00:11:45Мы просто маршрутизируем.
00:11:46Итак, резюмирую: вы говорите, получаете транскрипт, а затем используете regex, Haiku или локальную модель, чтобы решить, что делать дальше.
00:11:54Итак, отступая назад: мы дали Джарвису запрос.
00:11:59Дай мне обновление по утреннему отчёту.
00:12:01Haiku скажет: “Так, давай-ка глянем Obsidian”.
00:12:06Это уже существует?
00:12:08Если этот отчёт уже есть на диске, мы можем быстро прочитать его и ответить.
00:12:16Если его нет в Obsidian, что делать?
00:12:19Он скажет Claude Code создать утренний отчёт.
00:12:24Haiku маршрутизирует, но не исполняет.
00:12:28Нам нужна модель посильнее.
00:12:30По умолчанию это Opus, но можно сменить на Sonnet.
00:12:34А если вы безумны, можете сменить на Fable 5, когда она вернётся.
00:12:38Если отчёта нет, что мы делаем?
00:12:42У нас есть headless-версия Claude Code.
00:12:44Это как запустить Claude Code, но невидимо.
00:12:47И он использует -P.
00:12:49Заметьте: использование headless Claude Code с -P не будет расходовать вашу подписку.
00:12:57Окей?
00:12:57Это будет расходовать те 200 долларов API-кредитов, которые выдают каждый месяц.
00:13:02Может ли это быть проблемой?
00:13:04При огромном масштабе?
00:13:05Да.
00:13:06Вот почему многое нужно делать на Sonnet.
00:13:10Станет ли это проблемой в реальности?
00:13:13Я бы сказал, что нет.
00:13:15В чём цель такого инструмента, как Джарвис?
00:13:17Действовать как персональный ассистент, таск-менеджер.
00:13:21Мы не строим Facebook с помощью Джарвиса.
00:13:24Если бы вы делали это, вы бы сидели в терминале.
00:13:27Это ассистентские задачи, вещи для нетехнических коллег.
00:13:31При определённом уровне сложности вы бы не использовали это.
00:13:33Это не тот инструмент для такой работы.
00:13:35С учётом этого, вероятно ли, что вы потратите 200 долларов кредитов, если в основном используете Sonnet?
00:13:44Я бы сказал нет.
00:13:46Не большая проблема, но стоит задуматься.
00:13:48И опять же, если для вас это проблема, просто не используйте Cloud Code для этого.
00:13:52Это называется Fable 5 OS, но давайте будем честны.
00:13:55Вы можете заменить это на Codex.
00:13:56Вы можете заменить всё это на локальные модели.
00:13:59Знаете, это необязательно должен быть Cloud Code.
00:14:02Инфраструктура настраиваемая, и её можно заменить на что угодно.
00:14:07Но вернемся к нашему примеру: мы сказали, что хотим утренний отчет.
00:14:10Его не было в Obsidian, поэтому теперь он запустит headless-версию Cloud Code, чтобы создать отчет для нас.
00:14:16Затем этот отчет загружается в Obsidian, он считывает его и генерирует ответ с этим резюме.
00:14:25Это резюме отправляется в Kokoro.
00:14:29Kokoro — это еще одна локальная модель с открытым исходным кодом, которая возьмет расшифровку резюме, созданную Cloud Code, и превратит её в слова, превратит в голос.
00:14:39Думайте об этом как о мини-11Labs на вашем компьютере.
00:14:43Затем Kokoro говорит: “Эй, вот утренний отчет за сегодня, бла-бла-бла...”, и это сообщение доходит до вас.
00:14:49Голос, который вы сегодня слышали у Jarvis — это голос от Kokoro.
00:14:53Его можно заменить на любой другой голос.
00:14:55Так что, опять же, всё локально и настраиваемо.
00:14:56Вот так всё это работает: когда вы просите Jarvis что-то сделать, он следует именно по этому маршруту.
00:15:04Итак, еще раз для тех, кто наверняка окончательно запутался: что происходит?
00:15:10Вы просите Jarvis что-то сделать.
00:15:13Ваш запрос нужно превратить в транскрипт.
00:15:16Faster Whisper делает это бесплатно.
00:15:18Как только транскрипт готов, нужно понять, как его обработать.
00:15:22Мы используем либо регулярные выражения, либо дешевую модель Haiku, либо локальную модель.
00:15:28Затем нужно понять: существует ли уже такая информация в Obsidian, или нам нужно вызвать Cloud Code для генерации отчета или ответа на запрос?
00:15:38После генерации результата — будь то отчет внутри Obsidian или, например, HTML-страница —
00:15:44система отправляет ответ в Kokoro, который озвучивает его, и мы слышим результат.
00:15:53Все достаточно просто.
00:15:54Теперь пойдем дальше, к тому, что происходит «под капотом».
00:15:57Когда мы говорим «утренний отчет» или «выполни навыки А, Б и В», что мы имеем в виду?
00:16:01Мы говорим об этом.
00:16:03Мы говорим об архитектуре навыков, которая является основой всего.
00:16:08Потому что что такое утренний отчет?
00:16:09Да что угодно.
00:16:10Навык — это совокупность более мелких навыков, которые собирают большой отчет, проверяя разные источники информации, социальные сети и тому подобное.
00:16:24Но, как я постоянно твержу, архитектура навыков сильна ровно настолько, насколько вы сами ее проработали.
00:16:30Как ее создать?
00:16:31Если вы смотрели другие мои видео, вы знаете мою позицию.
00:16:34Нужно найти способ проанализировать ваши ежедневные рабочие процессы.
00:16:38Что я имею в виду под ежедневными рабочими процессами?
00:16:40Что вы делаете изо дня в день в своей личной жизни или бизнесе?
00:16:43Какие задачи вы повторяете снова и снова?
00:16:47Если вы уже знаете, как пользоваться Cloud Code, садились ли вы с ним и говорили: «Слушай, вот что я делаю каждый день»?
00:16:55«Можем ли мы разбить все это на отдельные задачи?»
00:16:58«А затем превратить эти задачи в навыки?»
00:17:01И если это целесообразно, превратить навыки в автоматизацию.
00:17:04Вот как строится такая архитектура навыков.
00:17:06В этом и заключается вся ее мощь.
00:17:08Например, то, что вы видите здесь — это многие из моих навыков, как, скажем, исследование контента.
00:17:14Опять же, большинство из вас не создает контент, так что у вас будет что-то другое.
00:17:17Но суть остается прежней.
00:17:19Так что же я делаю для исследований?
00:17:20Очевидно, что мне нужно изучать YouTube.
00:17:24Я превратил поиск информации на YouTube в навык «Pipeline YouTube», который берет видео, отправляет их в Notebook LM и выдает мне краткие содержания.
00:17:35Мне нужно проводить глубокие исследования по темам, выходящие за рамки YouTube, изучая Twitter, интернет в целом и так далее.
00:17:43Что ж, я превратил это в целый настраиваемый навык глубокого исследования.
00:17:47У меня есть целая система GraphRag с LightRag, где много информации о моих прошлых действиях.
00:17:52Что я сделал?
00:17:53Я превратил эту систему запросов в навык.
00:17:56И так далее, и так далее.
00:17:58Я повторил это во всех сферах своей жизни и бизнеса: контент, сообщество, агентство, продажи и так далее.
00:18:07На практике это делается просто: вы открываете Cloud Code и рассказываете в свободном стиле, что делаете каждый день.
00:18:15А потом спрашиваете: «Можем ли мы превратить это в навыки?»
00:18:17В Chase Heia Plus по ссылке ниже у меня есть полный скрипт, который можно вставить в Cloud Code, и он проведет вас через весь этот процесс.
00:18:25Если связать все воедино: когда вы говорите Jarvis сделать навык X, Y или Z, он проходит процесс транскрибации и маршрутизации, вызывает фоновый Cloud Code, чтобы выполнить нужную работу.
00:18:42Если это простой навык, вы получите результат, который будет а) правильным и б) последовательным, потому что вы уже прописали алгоритм процесса.
00:18:53Здесь нет места случайности.
00:18:55И чем больше мы создаем детерминированных систем ИИ, тем лучше.
00:19:02Тем меньше мы зависим от проблем ИИ: «может быть, он сделает то, что нужно, а может и нет».
00:19:08Создавая навыки, мы кодифицируем определенные вещи.
00:19:11В итоге у вас есть Jarvis, и под его капотом скрывается гораздо больше, чем просто красивый интерфейс с полезными метриками.
00:19:22Там происходит многое.
00:19:23Настоящая сила в том, что это веб-приложение, которое можно упаковать и передать членам команды или клиентам.
00:19:30Им нужно лишь сказать вам, что им нужно для настройки.
00:19:36И главная сила — в архитектуре навыков и в возможности помочь им закодифицировать различные задачи.
00:19:46Потому что тогда любой человек сможет получить 80–90% мощности моего Cloud Code в том виде, в котором я использую его каждый день: через навыки и автоматизацию.
00:19:56Это доступно буквально в один клик.
00:19:58Это то, что вы действительно им даете.
00:20:00А если им нужно что-то еще, есть голосовой модуль.
00:20:03Но в конечном счете — это лишь красивый слой поверх всего остального.
00:20:07Такова вся система в двух словах.
00:20:09Мне она очень нравится из-за возможности настройки и добавления локальных инструментов.
00:20:14Вы можете проявить креативность в том, что она делает и к чему подключается.
00:20:18Ничто не мешает вам добавить еще больше внешних источников или превратить это в Slack-агента, например.
00:20:26На этом я вас оставлю, ребята.
00:20:30Если хотите узнать подробнее о моем сетапе, ссылка на Chase AM+ есть в закрепленном комментарии.
00:20:36В остальном, дайте знать, что вы думаете, и увидимся.
Community Posts
No posts yet. Be the first to write about this video!
Write about this video