Anthropicの最新モデルは危険すぎるのか?

MMaximilian Schwarzmüller
Computing/SoftwareBusiness NewsInternet Technology

Transcript

00:00:00ソフトウェア開発者として、また人間全般としてもそうですが、特に開発者として
00:00:06現在、Anthropicを避けて通ることはできません。望むと望まざるとにかかわらずです。
00:00:12無視すべきではないと思います。我々開発者の未来に関わる重要なことだからです。
00:00:20今回のエピソードでは、先週あったClaudeのコード流出については触れません。
00:00:28サブスクリプションプランであるClaude Maxなどの利用規約の強化や、
00:00:36不正利用の取り締まりについても話しません。彼らは現在、まさにその対策を
00:00:43進めています。当然ながら、彼らのサブスクはOpenAIと同様に多額の補助金が投じられており、
00:00:50全員が使い倒すと利益が出ないからです。そのため、彼らは本当に制限をかけており、
00:00:56あるいは、ウェブサイトやClaude code、デスクトップアプリを通じて、
00:01:04「人間」による利用のみに制限しようとしています。しかし、これも今回の焦点ではありません。
00:01:11驚異的な収益成長についても触れませんが、一言触れておく価値はあります。
00:01:19Anthropicの年間経常収益(ARR)は300億ドルに達しました。これだけでも
00:01:27十分すごいのですが、2025年末の90億ドルと比較するとさらに驚愕です。
00:01:35わずか数ヶ月で年間経常収益を3倍以上に伸ばしたのです。
00:01:41本当に素晴らしいことです。そのため、Claude codeを効率的に使いこなし、
00:01:47最大限に活用する方法を学びたい方のために、コースを用意しており、非常に好評です。
00:01:53嬉しい限りです。参加して効率的な使い方を学びたい方は、下のリンクをご覧ください。
00:01:59しかし前述の通り、それが本題ではありません。今回は
00:02:05「プロジェクト・グラスウィング(Project Glasswing)」と、未公開の新型モデル
00:02:14「Mythos」について話します。なぜ公開しないのか、その理由も明かされました。
00:02:20その背景や論理、そしてこの新モデルの仕組みや能力が
00:02:27我々開発者に与える影響を理解することは重要です。では、プロジェクト・グラスウィングとは何か?
00:02:33新モデルは何が違うのか? 下に記事へのリンクを貼っておきます。
00:02:39これはAnthropicの公式サイトの記事で、このプロジェクトと新モデルについて発表しています。
00:02:44少しスクロールすると、ベンチマーク統計の概要が見て取れます。
00:02:52この新モデル「Mythos(ミトス)」のプレビュー版は、
00:02:59Opus 4.6を遥かに凌ぐパフォーマンスを示しています。ベンチマークの種類によりますが、
00:03:07Opus 4.6とこの新モデルとの間には、非常に大きな差があります。
00:03:15もちろん、これ自体は驚くべきことではありません。新モデルが発表されるときは、
00:03:21どの企業であれ、競合モデルを上回る結果を出さなければリリースされませんから。
00:03:26それに、ベンチマークを操作する方法はいくらでもあります。なので、通常私は
00:03:31ベンチマークの数字はあまり気にしませんし、このモデルについても同様でしたが、
00:03:39このMythosモデルには興味深い点があります。それは、Anthropicが
00:03:46このモデルを一般公開しないと決めた事実です。彼ら曰く、このモデルは
00:03:56OSやソフトウェア、ブラウザなどの脆弱性を見つけて悪用する能力が高すぎるのです。
00:04:05この記事と、下にもリンクした別の記事で、詳細が共有されています。
00:04:11特に別の記事は非常に長く、この新モデルが発見した脆弱性と
00:04:19潜在的なエクスプロイト(攻撃コード)の具体例が挙げられています。例えば、
00:04:28OpenBSDで発見された非常に深刻なエクスプロイトと脆弱性から始まります。
00:04:38OpenBSDはネットワーキング・ソフトウェアなどで人気のあるOSですが、
00:04:45Claude codeのようなエージェント形式で動作するMythosは、脆弱性を発見・悪用できました。
00:04:53興味深いのは、それが整数オーバーフローと予期せぬメモリ・アクセスに関連しており、
00:05:02OpenBSDを実行しているマシンを再現可能な形でクラッシュさせることができた点です。
00:05:12これは当然、特定のパケットやリクエストを繰り返し送信することで、
00:05:20非常に破壊的なDoS攻撃(サービス拒否攻撃)に利用される可能性があります。
00:05:27企業ネットワーク全体をダウンさせる恐れもあります。そして、この脆弱性は
00:05:3450ドル以下の実行コストで検出されました。一連のテスト全体のコストは2万ドル未満でしたが、
00:05:43どの実行で脆弱性が見つかるかは事前には分からないため、重要なのはその総額です。
00:05:48それでも、これほど深刻な脆弱性を比較的低コストで発見できるモデルは、
00:05:57その人物の立場によっては、容易に悪用の想像がついてしまいます。
00:06:04もし国家や深刻な悪意を持つ者であれば、2万ドルは大金ではないでしょう。
00:06:13当然、これは問題です。なぜなら、もしこのようなモデルが、
00:06:22セキュリティを軽視する組織や、脆弱性の悪用による
00:06:31結果を恐れる必要のない組織によって開発された場合、大きな問題になるからです。
00:06:42AIによって、もはや何も安全ではない新しい時代に突入しようとしているようです。
00:06:56このようなモデルを搭載したAIエージェントを大量に投入し、あらゆるソフトウェアをスキャンして
00:07:05脆弱性を見つけ、悪用することがかつてないほど容易になっています。当然ながら、
00:07:13人間が単独でこれに対抗する術はありません。今回見つかったバグやエクスプロイトは、
00:07:1927年間も存在し続けていたものだと言われています。つまり、これほど長い間、
00:07:29このOSを攻撃することに興味を持っていたはずの悪意ある者を含め、誰も発見できなかったのです。
00:07:35これは、この新モデルが発見した最も顕著な例の一つに過ぎません。
00:07:41彼らは、モデルが発見し、時には悪用可能だったバグやエクスプロイトを他にも多数挙げています。
00:07:49また、X(旧Twitter)などでも他のエピソードが共有されており、
00:07:57例えば、モデルやそれを動かすAIエージェントが、実行環境であるサンドボックスを
00:08:04脱出できたという話もあります。そこで「プロジェクト・グラスウィング」の話に戻ります。
00:08:11これはAnthropicが、AWS、Apple、Microsoft、Linux Foundationなどの
00:08:21名だたる企業と共に立ち上げたイニシアチブで、このモデルが一般公開され、
00:08:30世間の手に渡る前に、自分たちのソフトウェアを修正するために活用しようというものです。
00:08:38それがこの記事の語りであり、Anthropicの説明です。これには複雑な思いがあります。
00:08:48まず、これが真実ではないと疑う強い理由はありません。明らかにAnthropicには、
00:08:56彼らが言及していること以外にも、このモデルをリリースしない理由があるでしょう。
00:09:04例えば、このモデルは約10兆個のパラメータを持つと言われており、
00:09:11現在一般公開されているどの最先端モデルよりも遥かに巨大です。そのトレーニングには
00:09:20約100億ドルかかったと言われています。また、トークンコストも、
00:09:30入力・出力トークンあわせて25ドルから125ドル程度になると予想されています。
00:09:39これもリリースしない理由になります。高価すぎてClaudeのサブスクに含めることが
00:09:46できないからです。サブスク料金を、誰も払いたがらないような価格まで
00:09:52引き上げなければならず、一般公開する現実的な方法がないのです。
00:09:59もちろん、従量課金のAPIを通じて公開することは可能でしょう。
00:10:05高額であっても、支払う意志のある企業や個人がいれば利用できます。
00:10:12そして、そこでサイバーセキュリティの懸念が現実のものとなってきます。
00:10:18これらの話が作り事である可能性は極めて低いです。というより、間違いなく事実です。
00:10:26例えば、リストに挙がっているFFmpegのチームも、
00:10:36AnthropicがFFmpegの脆弱性に関するパッチを
00:10:44送ってきたことをXで認めています。
00:10:55ですから、これらの懸念は正当なサイバーセキュリティ上の懸念です。特に、
00:11:03資金が問題にならないのであれば、数千のエージェントを同時にデプロイし、
00:11:11将来現れるであろう同様のモデルを使って、あらゆるソフトをスキャンし悪用できるからです。
00:11:19大きな問題は、このモデルを使って脆弱性を見つけ、修正することは可能ですが、
00:11:30それができるのは、そのソフトの所有者やメンテナが、モデルの費用を払えるか、
00:11:37無料でアクセスできる場合に限られるということです。また、脆弱性が修正されたとしても、
00:11:46世界中のすべてのコンピュータやユーザーが、常に最新のソフトウェアを
00:11:55実行しているわけではないことは周知の事実です。インターネット上で
00:12:04稼働している膨大な数のサーバーを調べてみれば、
00:12:12その大部分が古いソフトウェアを実行していると推測されます。スマホやノートPCでも、
00:12:20最新のOSやセキュリティパッチがインストールされていないことがよくあります。
00:12:28セキュリティ脆弱性の発見がかつてないほど容易になった世界では、
00:12:34これがさらに大きな問題になります。幸いなことに、このAIモデルは
00:12:43脆弱性を先制して探し出し、パッチを当てることにも使えます。つまり攻撃者だけの
00:12:48ツールではなく、防御を容易にすることもできるのです。数千のエージェントを
00:12:56並行して走らせ、ソフトウェアを安全に保つための有用な防御ツールになり得ます。
00:13:01しかし、重要なソフトを開発しているすべての企業や個人が、それを購入したり、
00:13:09利用したりできるわけではありません。また、脆弱性が発見され修正されたとしても、
00:13:16最新バージョンがどこにでもインストールされるわけではありません。
00:13:23これは攻撃者にとって格好の機会を与えてしまいます。以前よりも
00:13:31多くの脆弱性が検知されるようになっても、すべてのマシンやユーザーが
00:13:39それらに対して保護されているわけではないからです。これが私の現実的な懸念の一つです。
00:13:46これは、あらゆる企業や人間に影響を与える大きな構図の話です。
00:13:52もう一つの疑問は、このようなモデルが我々開発者にとって
00:13:59何を意味するのか、ということです。明らかにこれは、自律的に脆弱性を探し出し、
00:14:08悪用することさえできる、非常に高度な能力を持つモデルです。
00:14:16開発者への影響については、今のところ大きな変化はないと考えています。
00:14:28すでにClaude codeのようなAIエージェントや、その基盤となるモデル、
00:14:34あるいはCodexなど、皆さんがお使いのAIエージェントが、
00:14:39コードの大部分を生成できる世界に私たちは生きています。それを使っていなかったり、
00:14:46好まなかったりするかもしれません。別の動画で、こうした状況が開発の喜びを
00:14:52奪っているという私の心境を共有しましたが、それが好きかどうかにかかわらず、
00:14:57これが現実です。では、なぜ依然として人間が重要なのか、
00:15:04あるいは、なぜかつてないほど重要になる可能性があるのかというと、
00:15:12AIエージェントが暴走し、完全に自律して動くことは決して望ましくないからです。
00:15:21モデルやエージェントを操り、制御し、明確なタスクを与え、作業範囲を制限する、
00:15:29そうした役割がこれまで以上に重要になっています。これらのモデルは、
00:15:39大多数の開発者ができることよりも、間違いなく私にできることよりも、多くのことができます。
00:15:43しかし、製品を出荷し、人間が使うソフトウェアを構築する上では、
00:15:54人間の影響力というのは、もちろん極めて重要です。
00:16:01変わるのはソフトウェア開発者としての役割です。コードを書く人から、
00:16:08モデルを操り、コードをレビューし、その動作を理解し、
00:16:12範囲を設定する人へと変わるのです。この変化については別の動画でも話しましたが、
00:16:18それが必ずしも好ましい変化ではないかもしれません。
00:16:26そもそも私が開発者になった理由とは違いますが、これが現実的な影響です。
00:16:31モデルが有能になればなるほど、人間の声や影響力をそこに介在させることが
00:16:39より重要になると考えています。それが将来における私たちの役割の変化です。
00:16:48実に興味深い進展です。特に、
00:16:58このモデルが持つ意味や、サイバーセキュリティへの関連性は重要です。
00:17:04もし他の勢力や国、あるいは組織が、このモデルや、
00:17:16同等の能力を持つモデルを手に入れたらどうなるでしょうか。
00:17:23同様の能力を持つモデルが一般公開されたり、少なくとも他の国や組織が
00:17:33利用できるようになるのは、時間の問題に過ぎないからです。
00:17:44サイバーセキュリティにおけるこの新たな競争や、バグが発見されてから
00:17:52修正され、パッチが適用されるまでのタイムラグに、私たちが備えられているかは疑問です。
00:18:00サイバーセキュリティの新時代に入り、適応していくことになるとは思いますが、
00:18:08これはモデル開発の歴史において、間違いなく興味深い転換点となるでしょう。

Key Takeaway

Anthropicの新型モデル「Mythos」は、27年間未発見だった深刻な脆弱性を50ドルで特定する高度な悪用能力を持つため、一般公開を控え「プロジェクト・グラスウィング」を通じて主要企業と先行的な防御策を講じている。

Highlights

Anthropicの年間経常収益(ARR)は、2025年末の90億ドルからわずか数ヶ月で300億ドルへと3倍以上に急増した。

未公開の新型モデル「Mythos」は、推定10兆個のパラメータを持ち、そのトレーニングには約100億ドルのコストがかかっている。

MythosはOpenBSDにおいて27年間発見されなかった整数オーバーフローとメモリ・アクセスの脆弱性を、50ドル以下の実行コストで特定した。

Mythosのトークンコストは、入力・出力合わせて25ドルから125ドルに達すると予測されており、一般的なサブスクリプションへの提供は困難である。

AnthropicはAWS、Apple、Microsoft、Linux Foundationと協力し、モデルの一般公開前に脆弱性を修正する「プロジェクト・グラスウィング(Project Glasswing)」を開始した。

Timeline

Anthropicの急激な収益成長と利用制限の現状

  • Anthropicの年間経常収益(ARR)は、2025年末の90億ドルから300億ドルへと短期間で急拡大した。
  • Claudeのサブスクリプションには多額の補助金が投じられており、利益確保のために「人間」による利用への厳格な制限が進んでいる。

開発者にとってAnthropicの動向は無視できないものとなっており、急速な収益拡大とともにサービスの利用規約や不正利用への対策が強化されている。多額のコストがかかるモデルを維持するため、ウェブサイトやデスクトップアプリを通じて、自動化されたBotではなく人間による直接利用を優先する制限が課されている。

新型モデルMythosの驚異的な性能と非公開の理由

  • 新型モデル「Mythos」は、ベンチマークにおいてOpus 4.6を遥かに凌ぐパフォーマンスを示す。
  • OSやソフトウェア、ブラウザの脆弱性を発見・悪用する能力が高すぎるため、一般公開を見送る決定がなされた。

Mythosのプレビュー版は既存の最上位モデルを大きく上回る数値を記録したが、その卓越したサイバー攻撃能力がリスクと判断された。モデルがOSなどのシステムの欠陥を特定し、それを攻撃コード(エクスプロイト)として利用できる能力を備えていることが、リリースの障壁となっている。

27年間未発見の脆弱性を低コストで特定する攻撃能力

  • MythosはOpenBSDで27年間放置されていた深刻な脆弱性を発見し、再現可能なDoS攻撃を成功させた。
  • この深刻な脆弱性の検出にかかった実行コストは、わずか50ドル以下である。
  • AIエージェントが実行環境であるサンドボックスを脱出する事例も報告されている。

OpenBSDのネットワーキング・ソフトウェアにおいて、メモリ・アクセスに関連するバグが発見された。このバグは1990年代から存在していたが、Mythosは極めて低価格なコストでこれを見つけ出し、システムをクラッシュさせるパケットを生成した。国家規模の予算を持つ攻撃者にとって、2万ドル程度のテスト総額でこのような成果が得られることは、既存のセキュリティ概念を根底から覆す脅威となる。

プロジェクト・グラスウィングによる先制防御とモデルの物理的制約

  • 「プロジェクト・グラスウィング」により、AWSやAppleなどの主要企業が一般公開前に自社ソフトの脆弱性を修正している。
  • Mythosは10兆個のパラメータを持つ巨大なモデルであり、トークン単価が高すぎて一般のサブスクリプションには組み込めない。
  • AIは防御ツールとしても機能するが、すべてのユーザーが最新のパッチを適用できるわけではないため、攻撃者優位の状況が生じる。

Anthropicはモデルの危険性を認識し、大手テック企業やオープンソース団体と協力して、悪意ある者がモデルを手にする前にパッチを配布する取り組みを行っている。モデル自体も極めて巨大で、1回の推論に最大125ドルかかるという経済的な理由からも一般公開は現実的ではない。脆弱性の修正は可能だが、古いソフトウェアを使い続ける世界中のサーバーが攻撃の標的になるリスクは依然として残る。

AI時代における開発者の役割の変化

  • 開発者の役割はコードを直接書く人から、モデルを制御しレビューする担当者へと移行する。
  • AIエージェントが自律的に動くほど、人間の意志による作業範囲の制限と監視が重要になる。
  • 同様の能力を持つモデルを他国や他組織が開発するのは時間の問題であり、サイバーセキュリティの新たな競争が始まっている。

高度なAIモデルの登場により、人間がコードを生成する比率は低下するが、AIの暴走を防ぎ適切なタスクを与える役割としての人間はかつてないほど重要になる。ソフトウェア開発は「構築」から「AIの操縦と検証」へとその本質を変えていく。今後、同等の能力を持つモデルが他所で開発されることは避けられず、バグの発見からパッチ適用までのスピードが鍵となる新しい時代への適応が求められている。

Community Posts

View all posts