Transcript
00:00:00ジャービス、今日の予定を教えて。
00:00:03おはようございます。
00:00:04全プラットフォームのフォロワー数は約46万6,000人、今週で約3,000人増加しました。
00:00:12最新動画は1日あたり約4,000回再生されており、現時点で1万7,000回再生されています。
00:00:18AI関連のビッグニュースです。米政府の指令により、Anthropic社は「Mythos」クラスへの一般公開を停止しました。
00:00:27今日の最優先事項は、「ジャービスHUD公開動画」の編集と公開です。
00:00:33いつもの受信トレイの監査を始めましょうか、それとも他に何かありますか?
00:00:37さて、具体的に何を見ているのか説明しよう。
00:00:39これは我々の「Claude Fable 5 OS」、ジャービスだ。
00:00:43「Fable 5」と呼んでいるのはFable 5を使って構築したからだが、動かすのにFable 5が必要なわけではない。
00:00:51実際、ここで見ているものの多くは完全にローカルで動作しており、どんなモデルでも実行できる。
00:00:58私の以前の「エージェント型OS」の動画を見たことがある人なら、大体わかるだろう。
00:01:01Cloud Codeを採用し、その上にレイヤーを重ねることで、ターミナル内では得られない機能を実現しました。
00:01:08視覚的なメトリクスや、ボタン化されたスキルなど、これは単なるパフォーマンスではない。
00:01:15多様な領域で作業する人にとって真のブーストになり、非技術者であるチームメンバーやクライアントにも簡単に配布できるものだ。
00:01:26ジャービスは、このエージェント型OSモデルの次の進化系だ。
00:01:30そのバックボーンは、カスタマイズ可能な「Claude Code」スキルアーキテクチャだ。日常の手作業やタスクをスキルや自動化に変換する。
00:01:43その基盤の上に、これを作り上げたんだ。
00:01:46今日の動画では、その仕組みと価値、そして自分自身でこれを作る方法を紹介する。
00:01:53特にローカル音声モデルのダイナミクスには、学べる点が多いと思う。
00:01:58本題に入る前に、スポンサーから一言。私からだ。
00:02:02「Chase AI+」では、動画で見せた設定をそのまま使えるだけでなく、「Claude Codeマスタークラス」にもアクセスできる。技術的な背景がない人がAI開発者になるための最高の道だ。
00:02:14毎週更新しており、Codexマスタークラスも含まれている。
00:02:18AIの最前線に立ち続けたいなら、ここが最適だ。
00:02:23現在、メンバーシップのお得なキャンペーンを実施中なので、ピン留めされたコメントを確認してほしい。
00:02:28まずはジャービスの概要から説明して、何を見ているのかを理解してもらおう。
00:02:34その後、内部構造を見て、カスタマイズ方法や構築方法を解説する。
00:02:41中央にある音声機能は完全にローカルで動作する。これにより、11Labsなどを経由するよりも非常に高速でキビキビと反応する。
00:02:53冒頭でジャービスが動画やフォロワー数、AIニュースについて話していたが、あれはハードコーディングされた台本ではない。
00:03:01あれは台本ではない。
00:03:03ジャービスに「今日の予定は?」と聞くと、Obsidian Vault内で自動生成された様々なレポートを参照し、何が重要で何を伝えるべきかを判断するんだ。
00:03:18その際にポップアップが表示されただろう。これらは話題の内容に関連するレポートやリンクだ。
00:03:29例えば、動画の調子について話した時は、その動画へ飛ぶ「最新デプロイ」のポップアップが表示される。
00:03:37Anthropicが政府によってFable 5を停止された件について触れた時も、
00:03:42何をしたかというと、
00:03:43ソース記事を表示したんだ。
00:03:44AIニュースやトレンド情報もすべて朝のレポートから来ている。
00:03:49これをクリックすれば、詳細な記事が見られる。
00:03:52この内容はObsidian内に保存されている。
00:03:54システム全体がObsidianと連携しているんだ。
00:03:56ここで読むこともできるし、「Obsidianで開く」をクリックすれば、Obsidian内の元のレポートが呼び出される。
00:04:04リンクもクリックできて、全体がつながっている。
00:04:07最後に「受信トレイの監査をしようか?」と聞いてきたのを覚えているだろうか。
00:04:12Gmailを確認して、重要なメールがあるか見てほしい、ということだ。
00:04:15それが一つの「スキル」であり、画面右側にボタンとして配置されている。
00:04:21これにより、Claude Codeのスキルや自動化をボタン一つで実行できる。
00:04:26先週Obsidianで作ったCloud OSと同じ考え方だ。
00:04:33この付加価値は、技術的ではないチームやクライアントが使う場合に特に役立つ。
00:04:39彼らはClaude Codeのパワーを使いたいが、ターミナルを開くタイプではない。
00:04:44例えば、受信トレイのブリーフィングが欲しい場合。
00:04:49右上の「受信トレイのブリーフィング」をクリックすると、即座にキューに入れられたことがわかる。
00:04:52ここに表示され、ポップアップにも進捗バーが出て処理中であることを示してくれる。
00:05:00完了するとレポートが生成されるだけでなく、何が起きているか口頭で教えてくれる。
00:05:09こうして簡単な口頭説明を受け、詳細なレポートもObsidian内のリンクからいつでも確認できる。
00:05:16これらのポップアップは関連性が高く有用で、いつでもクリアできる。
00:05:34右側の他の機能も見てみよう。
00:05:39既に触れたが、
00:05:41スキルはいつでも入れ替え可能だ。
00:05:43ワンクリックで実行できる。
00:05:45その下にはスケジュールがある。
00:05:47Googleカレンダーと連携している日々の予定だ。
00:05:50クリックするとカレンダーが開く。
00:05:53オーディオセクションもある。
00:05:56話している間、波形が上下して動作中であることを知らせてくれる。
00:05:58その下にはAIニュースの要約がある。
00:06:05これらすべて、これまで話した通り完全にカスタマイズ可能だ。
00:06:10カレンダーの表示が不要かもしれないし、
00:06:15オーディオの波形やニュースもいらないかもしれない。
00:06:18それでいい。
00:06:21エージェント型OSシステムの魅力は、ワンサイズ・フィッツ・オール(万能な一つ)ではないことだ。
00:06:22私が紹介しているのはあくまでツールセットであり、どう使うかは自由だ。
00:06:29君の指標は私とは違うだろう。
00:06:34ワンクリックで呼び出したい項目も、私とは全く異なるはずだ。
00:06:36それは君のワークフローやビジネスの内容次第だ。
00:06:40だが、これの良い点は、クライアントやチームメンバー向けに好きなように作り変えられることだ。
00:06:44左側も同じだ。
00:06:51フォロワー数や最新動画の状況などを表示している。
00:06:53過去5時間のClaudeトークン消費量トラッカーもある。
00:06:58「ディレクティブ(指針)」もある。
00:07:01これは今日取り組むべきトップ3のタスクだ。
00:07:03これらも完全に動的で、Claude Codeがカレンダーに基づいて判断する。
00:07:06文書のトレイルもある。
00:07:10ジャービスが作成・参照したすべての文書は、ポップアップだけでなくここにも残る。
00:07:13ここにある。
00:07:18朝のレポートのように、クリックすればいつでも表示できる。
00:07:18これがユーザーインターフェースだ。
00:07:22ジャービスの視覚的な側面だ。
00:07:23さて、核心部分、舞台裏の話をしよう。
00:07:25何が起きているのかが重要だ。
00:07:28正直、それが一番大事だ。
00:07:29ただの見た目がいいUIで終わってしまっては、生産性シアター(ごっこ遊び)になってしまう。
00:07:32ターミナルで作業するのと比較して、実際に成果を出すなら適切なバックボーンが必要だ。
00:07:37それを見ていこう。
00:07:43ジャービスに何かを頼んだ時、どのような経路を通るのかを順を追って見ていく。
00:07:45君が「今日の朝のブリーフィングを更新して」と頼んだとしよう。
00:07:53毎朝実行する自動化タスクがあるはずだ。
00:08:00自分に関連する情報を集め、それをジャービスに伝えてほしいとする。
00:08:03読みたくはない。
00:08:07実行するか、すでに実行済みなら教えてほしいわけだ。
00:08:07「今日の朝のレポートはどうなっている?」とジャービスに話しかける。
00:08:12マイク経由の音声は、「Faster Whisper」に送られる。
00:08:18Faster Whisperは無料でローカル動作するプログラムで、話した内容を書き起こしてくれる。
00:08:25ローカルの音声書き起こしツールは他にもたくさんある。
00:08:34好きなものに入れ替えてもいい。
00:08:39これは私がうまく動くから使っているだけだ。
00:08:40これで声が文字に書き起こされた。
00:08:42次にどうするか。
00:08:46Fable 5について話してきたが、すべてをFable 5で処理する必要があるのか?
00:08:47いや、もちろん違う。
00:08:50このシステムはFable 5ベースだが、
00:08:55内部の多くはOpusかSonnet、あるいはローカルモデルでも十分動作する。
00:08:56もちろんFableを使ってもいいが、
00:09:02わざわざFableを使わなくてもいい。
00:09:08開発プロジェクトを作成するわけではないからだ。
00:09:11これはパーソナルアシスタントや、非技術的なチームが使うためのものだ。
00:09:13わかりやすいUIで定型作業をこなすためのものだ。
00:09:17大枠としてはそんなところだ。
00:09:22書き起こされたテキストをどう処理するか。
00:09:243つの選択肢がある。
00:09:26一つ目は正規表現(Regex)によるルートだ。
00:09:28AIを使わずに、決定論的なコードで特定のフレーズにマッチするか判定する。
00:09:30AIは関与せず、特定の指示に対して自動で動作させる。
00:09:39冒頭で私が何と言ったか。
00:09:45「今日の予定(rundown)」と言った。
00:09:52Rundownはトリガーワードだ。
00:09:55正規表現がそれを拾い、自動的に特定のアクションへルートする。
00:09:56レポートを確認して要約を作成する。
00:09:58これが基本の要約アクションだ。
00:10:00コードだけで処理するのでコストがかからず、非常に高速だ。
00:10:03完璧な世界ならすべてこれでいい。
00:10:11だが、そうもいかない。
00:10:14AIへの指示が曖昧な場合、少しのインテリジェンス(AI)が必要になる。
00:10:19そこでオプション2、Haikuの登場だ。
00:10:24なぜHaikuを使うのか。一番「おバカ」なモデルだからだ。
00:10:32安くて速いからだ。ここでやっているのは単なる「ルート」の選択だ。
00:10:36指示をどこに送るべきか、誰が処理すべきかを決める。
00:10:43Haikuはこれが非常に得意だ。
00:10:47多くの指示は複雑ではない。
00:10:51適切なルートを選ぶだけでいい。
00:10:52リクエストごとに数分の一ペニーで済む。
00:10:54オプション3は完全にローカルモデルを使うことだ。
00:10:57Haikuを使う必要すらない。
00:11:01自分のコンピューター上のモデルで同じことが可能だ。
00:11:06書き起こしを見て、どこへルートするか判断するだけだ。
00:11:11要約すると、話す、文字起こしする、そして正規表現かHaiku、あるいはローカルモデルでルートを決める。
00:11:13さて、ジャービスにリクエストを送った後だ。
00:11:18「朝のレポートの更新」を依頼する。
00:11:22HaikuがObsidianを見て、レポートが存在するか確認する。
00:11:26すでにディスクにあるなら、それを読んで応答するだけだ。
00:11:34なければ、Claude Codeに朝のレポート作成を命じる。
00:11:35Haikuはルートを決めるだけで、実行するのはより強力なモデルだ。
00:11:42デフォルトではOpusだが、Sonnetに変更してもいい。
00:11:45作成されていない場合、ヘッドレス版Claude Codeを起動する。
00:11:46Claude Codeを開くのと似ているが、目に見えない。
00:11:54「-p」フラグを使用する。
00:11:59注:ヘッドレスClaude Codeで「-p」を使うと、サブスクリプションの枠は消費しない。
00:12:01APIクレジットから消費される。
00:12:06大規模なら問題になるが、個人のアシスタントならそうはならない。
00:12:08Sonnetを使えばコストの問題はないだろう。
00:12:16ジャービスの役割を考えると、これで十分だ。
00:12:19Facebookを作るわけではないからね。
00:12:24技術的なチームメンバーや、
00:12:28アシスタント機能としてなら完璧だ。
00:12:30もしコストが気になるなら、Claude Code以外のモデルを使えばいい。
00:12:34Codexやローカルモデルに置き換えることも可能だ。
00:12:38インフラは自由にカスタマイズできる。
00:12:42話をもどそう。朝のレポートだ。
00:12:44Obsidianになかったので、Claude Codeが作成する。
00:12:47作成されたレポートはObsidianにアップロードされ、中身を読み取って要約を作成する。
00:12:49その要約が「Kokoro」に送られる。
00:12:57Kokoroはローカルのオープンソースモデルで、要約を音声にしてくれる。
00:12:57コンピューター上の小さな11Labsのようなものだ。
00:13:02Kokoroが音声として話してくれる。
00:13:04今日聞いたジャービスの声はKokoroだ。
00:13:05どんな声にも変えられる。
00:13:06すべてローカルでカスタマイズ可能だ。
00:13:10リクエストから音声出力までの流れはこうだ。
00:13:13最後にもう一度まとめよう。
00:13:15混乱している人も多いだろうからね。
00:13:17ジャービスに何かを頼む。
00:13:21それを書き起こす必要がある。
00:13:24Faster Whisperで無料で行う。
00:13:27文字起こしができたら、どうルートするかを決める。
00:13:31そうすればあとは自動だ。
00:13:33今日はお付き合いいただきありがとう。
00:13:35また次回会おう。
00:13:44素晴らしい。
00:13:46最後にもう一度言う。
00:13:48ジャービスのOSは柔軟だ。
00:13:52自分でカスタマイズしてほしい。
00:13:55これが私のジャービスだ。
00:13:56君のジャービスを作ってくれ。
00:13:59幸運を祈る。
00:14:02質問があれば教えてくれ。
00:14:07また次の動画で会おう。
00:14:10(音楽・動画終了)
00:14:16(音楽・動画終了)
00:14:25(音楽・動画終了)
00:14:29(音楽・動画終了)
00:14:39(音楽・動画終了)
00:14:43そうするとKokoroが、今日の朝のレポートは〜といった具合に話しかけてきて、それがあなたに届きます。
00:14:49今日Jarvisの声として聞こえたのは、Kokoroによるものです。
00:14:53これも好きな声に入れ替えることができます。
00:14:55繰り返しになりますが、ローカルでカスタマイズ可能です。
00:14:56Jarvisに何かを頼んだ際、全体がどのように動作して、どのような経路をたどるのかは以上の通りです。
00:15:04皆さんも混乱されていると思うので、もう一度手順をまとめましょう。何が起きているのでしょうか?
00:15:10あなたがJarvisに何かを頼みます。
00:15:13その依頼を文字起こし(トランスクリプト)にする必要があります。
00:15:16Faster Whisperなら無料でそれが可能です。
00:15:18文字起こしができたら、どうルーティングするかを判断しなければなりません。
00:15:22正規表現を使うか、安価なHaikuモデル、あるいはローカルモデルを使います。
00:15:28次に、それが既にObsidianにある情報なのか、あるいはCloud Codeを呼び出してレポートやリクエストを生成させる必要があるのかを判断します。
00:15:38必要な生成が終わったら、Obsidian内にレポートを作成するか、あるいはHTMLページなどが生成されます。
00:15:44いずれにせよ、最終的な応答をKokoroに送り、それを音声に変換して、あなたに届くという流れです。
00:15:53簡単でしょう。
00:15:54さて、さらに一歩進んで、内部で実際に何が起きているかを見てみましょう。
00:15:57「朝のレポート」や「スキルA、B、Cを実行して」と言うとき、実際には何をしているのでしょうか?
00:16:01それは、これのことです。
00:16:03すべてを支える基盤である「スキルアーキテクチャ」について話しています。
00:16:08では「朝のレポート」とは何でしょうか?
00:16:09それは何でもあり得ます。
00:16:10「スキル」とは、他の小さなスキルの集合体であり、「指定されたソースの情報を確認せよ」「SNSをチェックして情報を得よ」といった指示をまとめて実行するものです。
00:16:24しかし、しつこく言っているように、このスキルアーキテクチャはあなたがどれだけ作り込むか次第です。
00:16:30どうやって作るのでしょうか?
00:16:31私の他のビデオを見ていれば、私のやり方はご存知でしょう。
00:16:34必要なのは、日々のワークフローをどうやって扱うかを見つけることです。
00:16:38「日々のワークフロー」とはどういう意味か。
00:16:40私生活や仕事で毎日行っていることを指しています。
00:16:43何度も繰り返される、よくある共通のタスクは何でしょうか?
00:16:47Cloud Codeの使い方が分かっている人なら、実際にCloud Codeと向き合って「私が毎日やっていることはこれだ」と伝えたことはありますか?
00:16:55それらを個別のタスクに分解できるでしょうか?
00:16:58そして、それらのタスクをスキルに変えられるでしょうか?
00:17:01そして理にかなっていれば、それらを自動化するのです。
00:17:04そうやってスキルアーキテクチャを構築するのです。
00:17:06そこにすべてのパワーが宿っています。
00:17:08例えば、私が行っている様々なスキルの一部、コンテンツリサーチのようなものです。
00:17:14皆さんの多くはコンテンツ作成をしていないでしょうから、内容は全く異なるものになるはずです。
00:17:17しかし、重要な点は同じです。
00:17:19では、私はリサーチのために何をしているか。
00:17:20当然、YouTubeのようなものに目を向ける必要があります。
00:17:24そこで、YouTubeの動画を検索して情報を見つけるプロセスを「YT Pipeline」というスキルにし、YouTube動画をNotebookLMに送り、要約を返させるようにしました。
00:17:35YouTubeだけでなく、Twitterやインターネット全般など、特定のトピックについて詳細な調査を行う必要もあります。
00:17:43そこで、私はそれをカスタムのディープリサーチスキルに作り変えました。
00:17:47過去の活動に関する多くの情報を持つ、LightRagを使ったGraphRagシステムがあります。
00:17:52では、何をしたか?
00:17:53そのクエリシステム全体をスキルにしたのです。
00:17:56これを繰り返していくわけです。
00:17:58コンテンツ、コミュニティ、エージェンシー、セールスなど、個人的な生活とビジネスのあらゆる領域でこれを繰り返しました。
00:18:07具体的にどうやるかと言えば、文字通りCloud Codeを開いて、「私が毎日やっていることはこれです」とストリーム・オブ・コンシャスネス(意識の流れ)で伝えるのです。
00:18:15そして「これをスキルに変えられますか?」と聞くわけです。
00:18:17Chase Heia Plus(下のリンク参照)の中には、Cloud Codeに貼り付けるだけでこれを実行してくれるフルスクリプトを用意しています。
00:18:25以上のことをまとめると、私たちがスキルについて語るとき、Jarvisに「スキルX、Y、Zを実行せよ」と言うと、文字起こしとルーティングを経て、バックグラウンドでヘッドレスCloud Codeが動作して何かを実行します。
00:18:42もしそれが単純なスキルであれば、プロセスを既にマッピングしているので、正確で一貫性のある結果が得られることは分かっています。
00:18:53偶然に左右される要素はほとんどありません。
00:18:55より決定論的な性質を持つAIシステムを作成できればできるほど、それは良いことです。
00:19:02「やりたいことをやってくれるかもしれないし、やってくれないかもしれない」といったAI全般の問題の影響を減らすことができます。
00:19:08スキルを作ることで、特定の事柄をコード化(体系化)しているのです。
00:19:11これらをすべて合わせればJarvisになります。内部を見ると、単に見た目が良くてメトリクスが表示されるだけのUI以上のものがあることがわかります。
00:19:22その下では多くのことが起きています。
00:19:23そして、このようなものが持つ真の力は、Webアプリであるため、チームメンバーやクライアントと共有できるという点にあります。
00:19:30彼らは、あなたが彼らのために作成しているなら、カスタマイズ面で何を望むかを伝えるだけでいいのです。
00:19:36そして、本当の本当の力は、スキルアーキテクチャ全体であり、様々なタスクをコード化するプロセスを彼らに案内できるという事実にあります。
00:19:46そうすれば、誰でも私の椅子に座って、私が毎日使っているCloud Codeのパワーの80〜90%を手に入れることができます。それはこれらのスキルと自動化のおかげです。
00:19:56文字通り、クリック一つで利用できるのです。
00:19:58それが彼らに提供できる価値です。
00:20:00さらに何か別のものが欲しければ、音声の部分も用意されています。
00:20:03ですが、結局のところ、これはすべての上に被せられた素晴らしいレイヤーに過ぎません。
00:20:07というわけで、これがシステム全体の概要です。
00:20:09私はこれがとても気に入っています。主にカスタマイズ性が高く、多くのローカルな要素を追加できるからです。
00:20:14ですから、それができることや、何に接続できるかについて、かなりクリエイティブになれます。
00:20:18Slackエージェントに変えるなど、このような他の外部ソースをさらに追加することに何も制限はありません。
00:20:26以上で、今回は終わりにしたいと思います。
00:20:30私の正確なセットアップが必要な場合は、固定コメントにあるリンクからChase AM+へアクセスしてください。
00:20:36それでは、感想を聞かせてください。またお会いしましょう。
Community Posts
No posts yet. Be the first to write about this video!
Write about this video