00:00:00HermesはアメリカのNews Research社が開発した
00:00:06自己改善型のオープンソースAIエージェントです。使えば使うほど進化し、
00:00:10自ら考え、学び、成長します。話した内容は決して忘れず、
00:00:16独自のスキルまで作成します。しかし、より多くのチャネルに対応し、
00:00:22サンドボックス環境も整ったOpenClawを置き換えるほどでしょうか? ぜひご覧ください。
00:00:30「Hermes」という名前は、ご存じの通りギリシャ神話の伝令の神に由来します。
00:00:37このシンボルもそこから来ています。動画の後半でも登場しますが、
00:00:42以前紹介したOpenClawは素晴らしいものの、個人的に使わない機能も多く、
00:00:47NanoClawは機能が少ない一方、Claude Agent SDKをベースにしているため、
00:00:52サードパーティ製ツールでのClaudeサブスク利用制限により使いにくくなりました。
00:00:59そこで新しいAIアシスタントを探していたところ、
00:01:04自己改善型エージェントのHermesに辿り着きました。今回は、
00:01:09過去の動画を基にプロモーション用のツイートを作成させてみます。
00:01:14いくつかの台本と指示を与えて進めます。単純なタスクに見えますが、
00:01:20重要なのは、Hermesが私の執筆スタイルやフィードバックを記憶し、
00:01:26何度も指示し直さずとも好みのツイートを作れるかという点です。では始めましょう。
00:01:30すでにこちらのコマンドでHermesをインストール済みです。非常にシンプルで、
00:01:35モデルの選択まで一通り完了しました。今回はOpenRouterのGemma 4を選びましたが、
00:01:40ハードウェアが許せばローカルで動かし、CLIツール等と連携させることも可能です。
00:01:45OpenClawを使ったことがあれば、このプロセスは非常に馴染み深いでしょう。
00:01:51念のためVPSにセットアップしましたが、ローカルマシンへのインストールも簡単です。
00:01:55Hermesコマンドを入力すると新しいチャットが始まり、シンボルと共に
00:01:59利用可能なツールやスキルが表示されます。注意点として、コマンドを実行すると
00:02:04Claude Codeのように、指定しない限り前のセッションは引き継がず新規セッションになります。
00:02:08ここでプロンプトを入力します。「動画の台本を基にツイート作成を手伝ってほしい」。
00:02:12そのプロセスを見ていきましょう。しばらくすると返答があり、
00:02:16構成が気に入ったので、追加のプロンプトを与えます。「scriptsフォルダに
00:02:21台本があるから、私の執筆スタイルとトーンを分析して」と伝え、
00:02:25ターゲット層と希望するツイートの長さも指定しました。するとツールを使って
00:02:30ファイルを検索し、しばらくして台本から私のスタイルを分析してくれました。
00:02:34「実用的で懐疑的」との分析。まさにその通りです。「開発者中心」で、
00:02:40「透明性があり親しみやすい」とも。ターゲットへの戦略も良さそうです。
00:02:45ただ、考えが変わりました。210文字程度と言いましたが、
00:02:50やはりもう少し長くしたいので、新しいプロンプトを与えます。また、
00:02:54処理に時間がかかり、コンテキストも多く消費していることに気づきました。
00:02:59セッションの途中で「/model」コマンドを使ってモデルを変更できます。
00:03:04今回はGLM-4-Turboに切り替えます。これでモデルが切り替わりました。
00:03:08ツイートを長くするよう指示すると、レスポンスが格段に速くなり、
00:03:13明示的に指示せずとも多くの情報をメモリに追加してくれました。文字数設定を
00:03:19400文字に更新し、希望するスタイルも変更。最新の台本から生成してみましょう。
00:03:23最初の試行でかなり良いものが出てきましたが、いくつか個人的に
00:03:28使わない表現がありました。「汗を流す」や「驚くべき」といった言葉です。
00:03:34私は「非常に良い」という表現を好みます。数回の微調整で、実際に
00:03:39プロフィールで使えそうなツイートが完成しました。これらはすべてメモリに保存されます。
00:03:44将来的に書きやすくするため、スキル作成を指示します。するとスキルマネージャーが
00:03:49スキルを作成し始めます。実際に見てみましょう。ご覧ください、
00:03:54複数の選択肢を提示してくれました。好みのものを選べます。
00:03:59連投用のスレッドまで作成してくれました。すべてを記憶しているため、
00:04:04新しくHermesのセッションを立ち上げ、モデルを変更して
00:04:09ツイートの書き方を知っているか尋ねると、私の好みのスタイルを
00:04:14正確に答えてくれます。使用する絵文字のタイプまで把握しています。
00:04:19トークンを浪費せずに、どうやってこれらの情報をメモリから引き出すのか
00:04:24不思議に思うかもしれません。実は、メモリは外部ファイルに保存されています。
00:04:30「memory.md」や、設定次第でSuper Memory、Mem0などの外部プロセッサを使います。
00:04:38メモリは各セッションでプリロードされますが、全文ではありません。
00:04:43約3,500文字(約700トークン)に要約されたバージョンです。一方、
00:04:49全セッションはSQLiteデータベースに保存され、FTS5による全文検索が可能です。
00:04:56昨日の発言を思い出してほしいと頼めば、DBを検索して
00:05:01情報を提示してくれます。また面白いことに、コンテキスト窓の50%を超えると
00:05:06セッションを圧縮します。Claude Codeの80%とは異なりますが、
00:05:11モデルによって基準が異なるため、50%という数字は妥当でしょう。そして、
00:05:17単純に全体を圧縮するのではなく、古いツール実行の結果を削除し、
00:05:23セッションの最初と最後を残して中間を圧縮します。これがDBに保存されます。
00:05:28会話の全文ではなく、この圧縮版が保存される仕組みです。また、10ターンごとに
00:05:35重要な情報をメモリに保存したり、必要に応じてスキルを書くよう自らに促します。
00:05:39この短いデモだけではHermesの真価をすべてお見せするのは難しいですが、
00:05:44与えた情報に基づいて、いかに記憶しスキルを作成するかは伝わったかと思います。
00:05:50実際、私はこれを本格的に使い始めるつもりです。今月、あるいは
00:05:54来月にかけて、GLMのような安価なモデルを使いHermesをメインアシスタントにして
00:05:59その結果をまた報告します。皆さんの意見もぜひコメントで教えてください。
00:06:04チャンネル登録もお忘れなく。それではまた。ハッピーコーディング!