00:00:00ソフトウェア開発者として、また人間全般としてもそうですが、特に開発者として
00:00:06現在、Anthropicを避けて通ることはできません。望むと望まざるとにかかわらずです。
00:00:12無視すべきではないと思います。我々開発者の未来に関わる重要なことだからです。
00:00:20今回のエピソードでは、先週あったClaudeのコード流出については触れません。
00:00:28サブスクリプションプランであるClaude Maxなどの利用規約の強化や、
00:00:36不正利用の取り締まりについても話しません。彼らは現在、まさにその対策を
00:00:43進めています。当然ながら、彼らのサブスクはOpenAIと同様に多額の補助金が投じられており、
00:00:50全員が使い倒すと利益が出ないからです。そのため、彼らは本当に制限をかけており、
00:00:56あるいは、ウェブサイトやClaude code、デスクトップアプリを通じて、
00:01:04「人間」による利用のみに制限しようとしています。しかし、これも今回の焦点ではありません。
00:01:11驚異的な収益成長についても触れませんが、一言触れておく価値はあります。
00:01:19Anthropicの年間経常収益(ARR)は300億ドルに達しました。これだけでも
00:01:27十分すごいのですが、2025年末の90億ドルと比較するとさらに驚愕です。
00:01:35わずか数ヶ月で年間経常収益を3倍以上に伸ばしたのです。
00:01:41本当に素晴らしいことです。そのため、Claude codeを効率的に使いこなし、
00:01:47最大限に活用する方法を学びたい方のために、コースを用意しており、非常に好評です。
00:01:53嬉しい限りです。参加して効率的な使い方を学びたい方は、下のリンクをご覧ください。
00:01:59しかし前述の通り、それが本題ではありません。今回は
00:02:05「プロジェクト・グラスウィング(Project Glasswing)」と、未公開の新型モデル
00:02:14「Mythos」について話します。なぜ公開しないのか、その理由も明かされました。
00:02:20その背景や論理、そしてこの新モデルの仕組みや能力が
00:02:27我々開発者に与える影響を理解することは重要です。では、プロジェクト・グラスウィングとは何か?
00:02:33新モデルは何が違うのか? 下に記事へのリンクを貼っておきます。
00:02:39これはAnthropicの公式サイトの記事で、このプロジェクトと新モデルについて発表しています。
00:02:44少しスクロールすると、ベンチマーク統計の概要が見て取れます。
00:02:52この新モデル「Mythos(ミトス)」のプレビュー版は、
00:02:59Opus 4.6を遥かに凌ぐパフォーマンスを示しています。ベンチマークの種類によりますが、
00:03:07Opus 4.6とこの新モデルとの間には、非常に大きな差があります。
00:03:15もちろん、これ自体は驚くべきことではありません。新モデルが発表されるときは、
00:03:21どの企業であれ、競合モデルを上回る結果を出さなければリリースされませんから。
00:03:26それに、ベンチマークを操作する方法はいくらでもあります。なので、通常私は
00:03:31ベンチマークの数字はあまり気にしませんし、このモデルについても同様でしたが、
00:03:39このMythosモデルには興味深い点があります。それは、Anthropicが
00:03:46このモデルを一般公開しないと決めた事実です。彼ら曰く、このモデルは
00:03:56OSやソフトウェア、ブラウザなどの脆弱性を見つけて悪用する能力が高すぎるのです。
00:04:05この記事と、下にもリンクした別の記事で、詳細が共有されています。
00:04:11特に別の記事は非常に長く、この新モデルが発見した脆弱性と
00:04:19潜在的なエクスプロイト(攻撃コード)の具体例が挙げられています。例えば、
00:04:28OpenBSDで発見された非常に深刻なエクスプロイトと脆弱性から始まります。
00:04:38OpenBSDはネットワーキング・ソフトウェアなどで人気のあるOSですが、
00:04:45Claude codeのようなエージェント形式で動作するMythosは、脆弱性を発見・悪用できました。
00:04:53興味深いのは、それが整数オーバーフローと予期せぬメモリ・アクセスに関連しており、
00:05:02OpenBSDを実行しているマシンを再現可能な形でクラッシュさせることができた点です。
00:05:12これは当然、特定のパケットやリクエストを繰り返し送信することで、
00:05:20非常に破壊的なDoS攻撃(サービス拒否攻撃)に利用される可能性があります。
00:05:27企業ネットワーク全体をダウンさせる恐れもあります。そして、この脆弱性は
00:05:3450ドル以下の実行コストで検出されました。一連のテスト全体のコストは2万ドル未満でしたが、
00:05:43どの実行で脆弱性が見つかるかは事前には分からないため、重要なのはその総額です。
00:05:48それでも、これほど深刻な脆弱性を比較的低コストで発見できるモデルは、
00:05:57その人物の立場によっては、容易に悪用の想像がついてしまいます。
00:06:04もし国家や深刻な悪意を持つ者であれば、2万ドルは大金ではないでしょう。
00:06:13当然、これは問題です。なぜなら、もしこのようなモデルが、
00:06:22セキュリティを軽視する組織や、脆弱性の悪用による
00:06:31結果を恐れる必要のない組織によって開発された場合、大きな問題になるからです。
00:06:42AIによって、もはや何も安全ではない新しい時代に突入しようとしているようです。
00:06:56このようなモデルを搭載したAIエージェントを大量に投入し、あらゆるソフトウェアをスキャンして
00:07:05脆弱性を見つけ、悪用することがかつてないほど容易になっています。当然ながら、
00:07:13人間が単独でこれに対抗する術はありません。今回見つかったバグやエクスプロイトは、
00:07:1927年間も存在し続けていたものだと言われています。つまり、これほど長い間、
00:07:29このOSを攻撃することに興味を持っていたはずの悪意ある者を含め、誰も発見できなかったのです。
00:07:35これは、この新モデルが発見した最も顕著な例の一つに過ぎません。
00:07:41彼らは、モデルが発見し、時には悪用可能だったバグやエクスプロイトを他にも多数挙げています。
00:07:49また、X(旧Twitter)などでも他のエピソードが共有されており、
00:07:57例えば、モデルやそれを動かすAIエージェントが、実行環境であるサンドボックスを
00:08:04脱出できたという話もあります。そこで「プロジェクト・グラスウィング」の話に戻ります。
00:08:11これはAnthropicが、AWS、Apple、Microsoft、Linux Foundationなどの
00:08:21名だたる企業と共に立ち上げたイニシアチブで、このモデルが一般公開され、
00:08:30世間の手に渡る前に、自分たちのソフトウェアを修正するために活用しようというものです。
00:08:38それがこの記事の語りであり、Anthropicの説明です。これには複雑な思いがあります。
00:08:48まず、これが真実ではないと疑う強い理由はありません。明らかにAnthropicには、
00:08:56彼らが言及していること以外にも、このモデルをリリースしない理由があるでしょう。
00:09:04例えば、このモデルは約10兆個のパラメータを持つと言われており、
00:09:11現在一般公開されているどの最先端モデルよりも遥かに巨大です。そのトレーニングには
00:09:20約100億ドルかかったと言われています。また、トークンコストも、
00:09:30入力・出力トークンあわせて25ドルから125ドル程度になると予想されています。
00:09:39これもリリースしない理由になります。高価すぎてClaudeのサブスクに含めることが
00:09:46できないからです。サブスク料金を、誰も払いたがらないような価格まで
00:09:52引き上げなければならず、一般公開する現実的な方法がないのです。
00:09:59もちろん、従量課金のAPIを通じて公開することは可能でしょう。
00:10:05高額であっても、支払う意志のある企業や個人がいれば利用できます。
00:10:12そして、そこでサイバーセキュリティの懸念が現実のものとなってきます。
00:10:18これらの話が作り事である可能性は極めて低いです。というより、間違いなく事実です。
00:10:26例えば、リストに挙がっているFFmpegのチームも、
00:10:36AnthropicがFFmpegの脆弱性に関するパッチを
00:10:44送ってきたことをXで認めています。
00:10:55ですから、これらの懸念は正当なサイバーセキュリティ上の懸念です。特に、
00:11:03資金が問題にならないのであれば、数千のエージェントを同時にデプロイし、
00:11:11将来現れるであろう同様のモデルを使って、あらゆるソフトをスキャンし悪用できるからです。
00:11:19大きな問題は、このモデルを使って脆弱性を見つけ、修正することは可能ですが、
00:11:30それができるのは、そのソフトの所有者やメンテナが、モデルの費用を払えるか、
00:11:37無料でアクセスできる場合に限られるということです。また、脆弱性が修正されたとしても、
00:11:46世界中のすべてのコンピュータやユーザーが、常に最新のソフトウェアを
00:11:55実行しているわけではないことは周知の事実です。インターネット上で
00:12:04稼働している膨大な数のサーバーを調べてみれば、
00:12:12その大部分が古いソフトウェアを実行していると推測されます。スマホやノートPCでも、
00:12:20最新のOSやセキュリティパッチがインストールされていないことがよくあります。
00:12:28セキュリティ脆弱性の発見がかつてないほど容易になった世界では、
00:12:34これがさらに大きな問題になります。幸いなことに、このAIモデルは
00:12:43脆弱性を先制して探し出し、パッチを当てることにも使えます。つまり攻撃者だけの
00:12:48ツールではなく、防御を容易にすることもできるのです。数千のエージェントを
00:12:56並行して走らせ、ソフトウェアを安全に保つための有用な防御ツールになり得ます。
00:13:01しかし、重要なソフトを開発しているすべての企業や個人が、それを購入したり、
00:13:09利用したりできるわけではありません。また、脆弱性が発見され修正されたとしても、
00:13:16最新バージョンがどこにでもインストールされるわけではありません。
00:13:23これは攻撃者にとって格好の機会を与えてしまいます。以前よりも
00:13:31多くの脆弱性が検知されるようになっても、すべてのマシンやユーザーが
00:13:39それらに対して保護されているわけではないからです。これが私の現実的な懸念の一つです。
00:13:46これは、あらゆる企業や人間に影響を与える大きな構図の話です。
00:13:52もう一つの疑問は、このようなモデルが我々開発者にとって
00:13:59何を意味するのか、ということです。明らかにこれは、自律的に脆弱性を探し出し、
00:14:08悪用することさえできる、非常に高度な能力を持つモデルです。
00:14:16開発者への影響については、今のところ大きな変化はないと考えています。
00:14:28すでにClaude codeのようなAIエージェントや、その基盤となるモデル、
00:14:34あるいはCodexなど、皆さんがお使いのAIエージェントが、
00:14:39コードの大部分を生成できる世界に私たちは生きています。それを使っていなかったり、
00:14:46好まなかったりするかもしれません。別の動画で、こうした状況が開発の喜びを
00:14:52奪っているという私の心境を共有しましたが、それが好きかどうかにかかわらず、
00:14:57これが現実です。では、なぜ依然として人間が重要なのか、
00:15:04あるいは、なぜかつてないほど重要になる可能性があるのかというと、
00:15:12AIエージェントが暴走し、完全に自律して動くことは決して望ましくないからです。
00:15:21モデルやエージェントを操り、制御し、明確なタスクを与え、作業範囲を制限する、
00:15:29そうした役割がこれまで以上に重要になっています。これらのモデルは、
00:15:39大多数の開発者ができることよりも、間違いなく私にできることよりも、多くのことができます。
00:15:43しかし、製品を出荷し、人間が使うソフトウェアを構築する上では、
00:15:54人間の影響力というのは、もちろん極めて重要です。
00:16:01変わるのはソフトウェア開発者としての役割です。コードを書く人から、
00:16:08モデルを操り、コードをレビューし、その動作を理解し、
00:16:12範囲を設定する人へと変わるのです。この変化については別の動画でも話しましたが、
00:16:18それが必ずしも好ましい変化ではないかもしれません。
00:16:26そもそも私が開発者になった理由とは違いますが、これが現実的な影響です。
00:16:31モデルが有能になればなるほど、人間の声や影響力をそこに介在させることが
00:16:39より重要になると考えています。それが将来における私たちの役割の変化です。
00:16:48実に興味深い進展です。特に、
00:16:58このモデルが持つ意味や、サイバーセキュリティへの関連性は重要です。
00:17:04もし他の勢力や国、あるいは組織が、このモデルや、
00:17:16同等の能力を持つモデルを手に入れたらどうなるでしょうか。
00:17:23同様の能力を持つモデルが一般公開されたり、少なくとも他の国や組織が
00:17:33利用できるようになるのは、時間の問題に過ぎないからです。
00:17:44サイバーセキュリティにおけるこの新たな競争や、バグが発見されてから
00:17:52修正され、パッチが適用されるまでのタイムラグに、私たちが備えられているかは疑問です。
00:18:00サイバーセキュリティの新時代に入り、適応していくことになるとは思いますが、
00:18:08これはモデル開発の歴史において、間違いなく興味深い転換点となるでしょう。