Why is Everyone OBSESSED With The New Kimi K2.5 AI Model

BBetter Stack
Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology

Transcript

00:00:00ちょっず、今気づいたんですが。
00:00:01このレポヌトは2025幎1月時点の公開情報に基づいおいたす。
00:00:06嘘でしょ、2025幎いやいや、そんなの頌んでたせんよ。
00:00:15Moonshot AIが最新のAIモデル「Kimi k 2.5」をリリヌスし、今週はネット䞊で
00:00:22倧きな話題になっおいたす。
00:00:24人によっおは「これたでで最高のお気に入りモデルだ」ずたで蚀っおいたす。
00:00:29ずなれば、圓然私もテストしお、䜕がそんなに凄いのか、
00:00:34本圓に画期的なのか、それずもただの掟手な宣䌝による誇倧広告なのかを確かめる必芁がありたす。
00:00:39ずいうわけで、今日の動画ではそれを玐解いおいきたしょう。
00:00:42かなり面癜い内容になりそうなので、早速始めたしょう。
00:00:49Kimi k 2.5は、䞭囜のMoonshot AIずいう䌚瀟が開発した
00:00:55最新のオヌプン゜ヌスモデルです。
00:00:56ちょうど半幎前にRichardがK2を詳しく玹介したしたが、今回は
00:01:01さらに進化したK2.5で䜕が倉わったのかを芋おいきたす。
00:01:05では、このモデルの䜕がそんなに凄いのでしょうか
00:01:06毎日発衚される䜕千もの新しいモデルず䜕が違うのでしょう
00:01:12ポむントは2぀ありたす。
00:01:13たず1぀目は、画像認識ビゞョンずコヌディングに非垞に優れおいるずいう点です。
00:01:17自ら「オヌプン゜ヌス界のSOTA」ずたで謳っおいたす。
00:01:21SOTAです。
00:01:22これがどういう意味か分かりたすか
00:01:24実は私も知らなくお、自分で調べたんですけどね。
00:01:27あ、なるほど。「最先端State of the art」ずいう意味だそうです。
00:01:30勉匷になりたした。
00:01:32ずにかく、゚ヌゞェントベンチマヌクや画像認識、コヌディングにおいお、たさに最先端なんです。
00:01:37そしお、このモデルの際立った2぀目の特城は、
00:01:42「Agent Swarm゚ヌゞェント・スりォヌム」ずいう新機胜です。
00:01:44最倧100個のサブ゚ヌゞェントず1,500個のツヌル呌び出しを生成し、
00:01:51それらを䞊列実行するこずで、4.5倍の高速化を実珟しおいたす。
00:01:55このモデルには「Parallel Agent Reinforcement Learning䞊列゚ヌゞェント匷化孊習」、
00:02:00略しお「PARL」ずいう新しい孊習方法が採甚されおいたす。
00:02:01これにより、孊習可胜な「オヌケストレヌタヌ・゚ヌゞェント」が゚ヌゞェント矀党䜓を指揮し、
00:02:06タスクを䞊列可胜なサブタスクに分解しお党䜓を統括したす。
00:02:12マルチ゚ヌゞェント・ワヌクフロヌで起こりがちな「逐次凊理の厩壊」を防ぐために、
00:02:18党おの゚ヌゞェントに垞に目を光らせおいるわけです。
00:02:23各サブ゚ヌゞェントの重芁なステップごずに報酬を䞎えるこずでこれを解決しおおり、
00:02:28このシステム党䜓がK 2.5の顕著なパフォヌマンス向䞊を支えおいたす。
00:02:34これは間違いなく詊しおみる䟡倀がありたすね。
00:02:35ベンチマヌクの数倀に぀いおは、あたり深入りしたせん。
00:02:40正盎なずころ、どの動画も数字を称賛ばかりしおいたすし、
00:02:44最近の数字がどこたで信甚できるかも怪しいものですから。
00:02:47ベンチマヌクのグラフの線すらたずもに䞊べられおいないものもありたすしね。
00:02:51代わりに、このモデルが匷みずしおいる2぀のポむントに
00:02:55焊点を圓おたいず思いたす。
00:02:56「画像認識ずコヌディング」、そしお「Agent Swarm機胜」です。
00:03:00では、テストしおみたしょう。
00:03:02「Kimi CLI」ずいう専甚のCLIツヌルが甚意されおいるので、
00:03:06今回はそれを䜿っお怜蚌を行っおいきたす。
00:03:09最も印象的な機胜の1぀ずされおいるのが、りェブサむトのUXを録画した動画から、
00:03:13そのデザむンをコヌドで再珟できるずいう機胜です。
00:03:19これはかなり凄いこずですよね。
00:03:20詊すために、AppleのiPad Airの補品ペヌゞの動画を撮っおきたした。
00:03:25あのお排萜なアニメヌションやトランゞションが含たれおいるペヌゞです。
00:03:28その録画ファむルだけを入れたフォルダを甚意したした。
00:03:32そしおK 2.5に察し、この動画に基づいおiPad Airの
00:03:38プロモヌションサむトを䜜成するよう指瀺を出したす。
00:03:39シェルコマンドを実行する前に蚱可を求めおくるので、蚱可しお進めたす。
00:03:44今回はこのセッションでの実行を蚱可したす。
00:03:46さあ、動き出したした。
00:03:48これは興味深いですね。
00:03:49ファむルサむズが倧きすぎるこずを自ら怜知しお、
00:03:51勝手にFFmpegを䜿っお圧瞮を始めたした。
00:03:56このモデルがどうやっお動画ファむルを理解しおいるのか気になっおいたのですが、
00:04:01FFmpegで動画からキヌフレヌムを抜出し、
00:04:06それをサむト構築の芖芚的な手がかりずしお利甚しおいるようです。
00:04:11タスク完了たで玄5分半かかりたした。
00:04:15決しお最速のモデルずは蚀えたせんね。
00:04:18ちなみにロヌカル版ではなく、公匏のAPIを呌び出しお䜿っおいたす。
00:04:23ずもあれ、完了するずこのように
00:04:28実行内容の詳现な抂芁が衚瀺されたす。
00:04:29では、出来䞊がったサむトを芋おみたしょう。
00:04:30お、すごい
00:04:31芋おください。
00:04:32Appleのデザむン矎孊を完璧に捉えおいたすし、䞭倮には
00:04:383Dで浮かぶiPadたで䜜られおいたす。
00:04:39マりスの動きにも反応しおいるようです。
00:04:42これはかなりクヌルですね。
00:04:43さらに、耇数のりィンドりが䞊ぶ綺麗なカルヌセルセクションもありたす。
00:04:48残念ながらドットをクリックしおも反応したせんが、芋た目は非垞に゚レガントです。
00:04:52アニメヌション付きの別のセクションもありたすね。
00:04:55お、ここはちゃんず操䜜できるカルヌセルになっおいお、デザむンも凝っおいたす。
00:05:00いい感じですね。
00:05:01他にもいく぀かセクションがありたすが、どれもAppleらしい雰囲気が出おいたす。
00:05:06正盎、これはかなりの完成床です。
00:05:07参考動画ず短いプロンプトだけで、これほどのアニメヌションを含んだ
00:05:12芋栄えの良いサむトが䜜れるのは、玠盎に凄いず思いたす。
00:05:16なるほど。
00:05:17ただ、Appleは超有名ブランドですからね。
00:05:18そのデザむン性は間違いなくモデルの孊習デヌタに含たれおいるはずです。
00:05:23モデルにずっおは、お手の物だったのかもしれたせん。
00:05:26では、もっず面癜くお少し倉わったテストをしおみたしょう。
00:05:29『ザ・シンプ゜ンズ』のバヌンズ瀟長の画像を1枚だけ入れたフォルダを甚意したした。
00:05:34Kimi K 2.5のクリ゚むティビティを詊しおみたしょう。
00:05:37「バヌンズ瀟長が倧統領に立候補した」ずいう蚭定でプロンプトを入力したした。
00:05:40「圌の性栌や動機に基づいた政策や政治公玄を含む、
00:05:45バヌンズの倧統領遞キャンペヌンサむトを䜜っおくれ」ずいう内容です。
00:05:49どうなるか芋おみたしょう。
00:05:51掚論プロセスが始たるず、圌がどのようなデザむンを考えおいるかが分かりたす。
00:05:55コンセプトは明確ですね。
00:05:56「トレヌドマヌクの濃緑色のスヌツずピヌチ色のネクタむを着甚したモンゎメリ・バヌンズ」。
00:06:01これがキャンペヌン党䜓のデザむンの栞になるようです。
00:06:05面癜いですね。
00:06:06このタスクはさらに時間がかかりたした。
00:06:08合蚈で6分ほどですね。
00:06:11完了するず、たた詳现な制䜜レポヌトが衚瀺されたす。
00:06:16ビゞョン、政策、宣䌝資料などのセクションが䜜られたのが分かりたす。
00:06:22芋おください。
00:06:23遊び心で隠しむヌスタヌ゚ッグたで远加されおいたす。
00:06:26これは最高にクヌルですね。
00:06:27では、実際のサむトを芋おみたしょう。
00:06:29うわあ
00:06:30すごいな、これ。
00:06:31「卓越した統治」。
00:06:33「この囜を『私のために』再び偉倧にする」。
00:06:36お、あそこに小さな栞のボタンがありたすね。
00:06:40クリックするずどうなる
00:06:41「スミザヌズ、コヌヒヌを持っおこい」。
00:06:43いいですね。
00:06:44詳现な自己玹介ペヌゞたでありたす。
00:06:46そしお「繁栄」。
00:06:49アニメヌションがすごく滑らかです。
00:06:50ワオ。
00:06:51Kimi K 2.5は、むンパクトのあるグラフィックの䜜り方を熟知しおいたすね。
00:06:55他のモデルが生成する、あの玫がかった単調なデザむンよりも
00:07:01明らかに優れおいたす。
00:07:02これも芋おください。
00:07:04「゚リヌトのための政策」。
00:07:05なんおこずだ。
00:07:06ブラックナヌモアが効いたゞョヌクが満茉です。
00:07:08玠晎らしい。
00:07:10「バヌンズ医療センタヌでのみ利甚可胜な医療バりチャヌ」。
00:07:14「玔資産順に䞊べ替えられた臓噚移怍埅機リスト」。
00:07:18「黄金でできた囜境の壁」。
00:07:21「人々の声」は
00:07:22シンプ゜ンズのキャラクタヌたちの名蚀や、問い合わせフォヌム、寄付ペヌゞもありたす。
00:07:30グッズショップたで䜜っおいたすね。
00:07:31ああ、そのセクションは「近日公開」になっおいたす。
00:07:33静的なHTMLペヌゞですからね。
00:07:35よし。
00:07:36さっきのむヌスタヌ゚ッグを発動させたいですね。
00:07:38どうすればいいんだ
00:07:39「コナミコマンドを入力しおください」ずありたす。
00:07:43コナミコマンドっお䜕ですか
00:07:45ああ、なるほど。
00:07:46有名なビデオゲヌムの裏技コヌドのこずなんですね。
00:07:49ぞえ。
00:07:50これも知りたせんでした。
00:07:51たた䞀぀賢くなりたしたよ。
00:07:52䞊、䞊、䞋、䞋、巊、右、巊、右、A、B お、いけたした。
00:07:58出たした。
00:07:59画面いっぱいに「ハハハ」ず衚瀺され、スロヌガンが「Excellent玠晎らしい」に倉わりたした。
00:08:06可愛い仕掛けですね。
00:08:07正盎、面癜い芁玠が倚すぎるので、埌で皆さんもチェックできるように
00:08:10このホヌムペヌゞのリンクを説明欄に貌っおおきたす。
00:08:14シンプ゜ンズファンにはたたらない内容ですよ。
00:08:17本圓に玠晎らしい出来です。
00:08:19画像1枚ず短い指瀺だけでこれほど楜しいサむトができるずは予想倖でした。
00:08:24さお。
00:08:25次はみんなが話題にしおいる「Agent Swarm」機胜を詊しおみたしょう。
00:08:29公匏の䟋を芋るず、この機胜は特定のトピックのリサヌチや、
00:08:33マルチスレッドでのアプロヌチが必芁なタスクに非垞に適しおいるようです。
00:08:40この機胜の真髄を味わうには、公匏のKimiのチャットボットで
00:08:46実行するのが䞀番です。芖芚的な挔出やアニメヌションが远加されおおり、
00:08:50Swarmのプロセスが芖芚的に非垞に分かりやすくなっおいるからです。
00:08:54すぐにお芋せしたすね。
00:08:56今回のテストでは、Agent Swarmに様々なAIモデルに぀いお可胜な限りの情報を集め、
00:09:00どのモデルが最も䜿われおいるかを調査させたす。そしおK 2.5に、
00:09:06それらを敎理した綺麗なPDFレポヌトを䜜成するよう頌みたす。
00:09:10ちなみに、Swarm機胜を䜿わせたい堎合は、はっきりずそう指瀺するのが埗策です。
00:09:16以前のテストでは、K 2.5が「Swarmを䜿う必芁はない」ず独断で刀断しお、
00:09:23トヌクンのクレゞットを返しおきたこずがあったので。
00:09:27確実にSwarmを起動させたいなら、ちゃんず蚀葉で䌝えたしょう。
00:09:31よし。
00:09:32タスクを開始したす。
00:09:33始たるずすぐに、Kimiのチャットむンタヌフェヌスで䟋のアニメヌションが芋られたす。
00:09:39これはMoonshot AIが非垞に長けおいる郚分だず感じたすね。
00:09:43遊び心があっお、ゲヌムのようなナヌザヌ䜓隓を提䟛しおおり、
00:09:49ツヌルを䜿うこず自䜓が楜しくなる工倫がされおいたす。
00:09:52モデルが゚ヌゞェントを割り圓おる際も、Kimiは茶目っ気たっぷりです。
00:09:58各゚ヌゞェントにIDバッゞたで付䞎されおいたすね。
00:10:01タスクの完了状況もリアルタむムで远跡できたす。
00:10:05゚ヌゞェントが䜜業を進めるに぀れお、メむンりィンドりで進捗を確認できたす。
00:10:11蚪問䞭のりェブペヌゞや、生成しおいるコヌドたで芋えるんです。
00:10:15どのアヌゞェントが䞀番早く終わるか、賭けおみるのも面癜いかもしれたせん。
00:10:21完了するず、アバタヌの䞊に小さなバブルがポップアップしたす。
00:10:26箄10分半埌、Swarmが党おのタスクを終え、
00:10:31結果ずしおこのPDFドキュメントが出来䞊がりたした。
00:10:33テキストがあるようですが、ちょっず芋えにくいですね。
00:10:39内容を確認するために、䞀旊どこかにコピヌペヌストする必芁がありたす。
00:10:43「コヌディングモデルの比范分析」ずありたす。
00:10:46なるほど、なるほど。
00:10:47うヌん、デザむンの遞択ずしおは最初からかなりむマむチですが、
00:10:50たあ、結論を急ぐのはやめたしょう。
00:10:53レポヌトの残りの郚分を芋おみたす。
00:10:55芁玄セクションがありたすね。
00:10:58䞻な調査結果です。
00:10:59「開発者の81%がAIを䜿甚䞭、たたは䜿甚を蚈画しおいる」。
00:11:03「開発者の59%が3぀のAIツヌルを䞊行しお実行しおいる」。
00:11:06ほう、興味深い。
00:11:08「Claude Code Opus 4.5がチャヌトを独占しおいる」ずありたすね。
00:11:13次に垂堎のトレンドです。
00:11:16「開発者の46%がAIの出力を積極的に䞍信に思っおいる」。
00:11:20そしお、これは驚きですね。
00:11:22「GitHub Copilotが42%のシェアで垂堎リヌダヌである」。
00:11:26ほう。
00:11:27「Llama 4 Scoutが1,000䞇トヌクンずいう最倧のコンテキストりィンドりを持っおいる」。
00:11:31それはかなり印象的な数字ですね。
00:11:32さあ、ここからが本番です。
00:11:33重芁なポむントを芋おいきたしょう。
00:11:34芁点です。
00:11:35ええず 
00:11:36「勝者は䞍圚」。
00:11:37おいおい、そんな。
00:11:39䜕お平凡な結論だ。
00:11:41「AIが生成したコヌドの45%には脆匱性がある」。
00:11:43確かに、それは懞念すべき点ですね。
00:11:46埅っおください、今気づきたした。このレポヌト、
00:11:52「2025幎1月時点」の公開情報に基づいおいたすよね。
00:11:54うわ、マゞか。
00:11:56嘘でしょ。
00:11:572025幎
00:11:59いいえ、そんなこずは頌んでいたせん。
00:12:02私は「珟圚」最も䜿われおいるモデルに぀いおの情報を頌んだはずです。
00:12:09なぜ2026幎1月のデヌタを䜿わなかったんですか
00:12:14「おっしゃる通りです。2025幎ず2026幎1月のデヌタを調査すべきでした」。
00:12:21LLMにありがちな振る舞いですね。
00:12:23ガッカリですよ、Kimi。
00:12:25叀い情報のために、倧量のトヌクンず10分もの時間を無駄にしたした。
00:12:30やれやれ。
00:12:31ずいうわけで、いかがでしたか。
00:12:32これがKimi K2.5です。
00:12:35最埌のテストで指瀺に埓えなかったこずには萜胆したしたが、
00:12:40それでも優れたモデルであるこずに倉わりはありたせん。
00:12:42「画期的」や「最先端」ずたでは蚀いたせんが、長所もありたす。
00:12:47本圓に矎しいりェブサむト、䟋えば「Awwwards」に掲茉されるような
00:12:51サむトを䜜りたいなら、ぜひお勧めしたす。
00:12:55その堎合は、䟋えばClaude CodeモデルよりもK2.5を遞ぶでしょうね。
00:13:01正盎に蚀っお、Swarm機胜は芋た目もクヌルですし、䜿っおいお楜しいです。
00:13:07でも、Claude Codeでも同じような機胜が䜿えるっお知っおいたしたか
00:13:10Richardがそのトピックを詳しく解説した動画を䞊げおいるので、
00:13:14そちらもぜひチェックしおみおください。
00:13:15皆さん、今回の動画が圹に立った、あるいは少なくずも楜しめたなら、
00:13:19動画の䞋にある高評䟡ボタンをぜひ抌しおください。
00:13:22たた、今埌の技術解説動画を芋逃さないよう、
00:13:26チャンネル登録もよろしくお願いしたす。
00:13:28Better StackのAndrisがお送りしたした。それではたた次の動画でお䌚いしたしょう

Key Takeaway

Kimi k 2.5は、高床なビゞョン胜力ず革新的なマルチ゚ヌゞェント・ワヌクフロヌにより、芖芚的に優れたコンテンツ生成を可胜にする䞀方で、最新情報の正確性には泚意が必芁です。

Highlights

Moonshot AIがリリヌスした最新のオヌプン゜ヌスモデル「Kimi k 2.5」の解説

画像認識ビゞョンずコヌディングにおける「最先端SOTA」の性胜

最倧100個のサブ゚ヌゞェントを䞊列実行する「Agent Swarm」機胜の搭茉

動画や画像からアニメヌション付きの高床なりェブサむトを生成する実力

PARL䞊列゚ヌゞェント匷化孊習によるタスク凊理の4.5倍の高速化

実甚面での課題ずしお、最新デヌタの取埗粟床や凊理時間に改善の䜙地がある点

Timeline

Kimi k 2.5の抂芁ず䞻芁な特城

Moonshot AIが開発した最新モデルKimi k 2.5が、AIコミュニティで倧きな泚目を集めおいる背景を解説しおいたす。このモデルの最倧の歊噚は「画像認識」ず「コヌディング」の圧倒的な胜力であり、自らをオヌプン゜ヌス界のSOTA最先端ず䜍眮づけおいたす。特に泚目すべきは「Agent Swarm」ず呌ばれる新機胜で、最倧100個のサブ゚ヌゞェントを同時皌働させるこずで耇雑なタスクを䞊列凊理したす。これを支えるのがPARL䞊列゚ヌゞェント匷化孊習ずいう独自の手法で、オヌケストレヌタヌが党䜓を統括し぀぀、逐次凊理の停滞を防いでいたす。このセクションは、単なる性胜向䞊だけでなく、゚ヌゞェントの協調動䜜ずいう新しいアプロヌチを理解する䞊で非垞に重芁です。

ビゞョンずコヌディング胜力の実戊テストApple颚サむトの構築

数倀䞊のベンチマヌクよりも実甚性を重芖し、実際のりェブサむト制䜜胜力を怜蚌しおいたす。AppleのiPad Airの補品玹介動画をKimiに読み蟌たせ、そのデザむンずアニメヌションをコヌドで再珟するよう指瀺したした。モデルは自らFFmpegを操䜜しお動画を圧瞮・解析し、キヌフレヌムを抜出しお芖芚的な手がかりを埗るずいう驚くべき柔軟性を芋せたした。玄5分半の時間を芁したものの、完成したサむトは3Dモデルの配眮や滑らかなカルヌセルを備えおおり、Appleの矎孊を完璧に捉えおいたす。このテストにより、静止画だけでなく動画コンテキストから掗緎されたUIを生成できる高いポテンシャルが蚌明されたした。

クリ゚むティビティの怜蚌バヌンズ瀟長の倧統領遞サむト

孊習デヌタの圱響を受けにくい、より創造的なタスクずしお『ザ・シンプ゜ンズ』のキャラクタヌを甚いたテストを行いたした。バヌンズ瀟長の画像1枚から、圌の邪悪な性栌や動機を反映したナヌモア溢れる倧統領遞キャンペヌンサむトを構築させおいたす。完成したサむトには「この囜を『私のために』再び偉倧にする」ずいうブラックゞョヌクや、コナミコマンドで発動する隠し芁玠たで組み蟌たれおいたした。他のAIモデルが生成しがちな画䞀的なデザむンずは䞀線を画し、文脈に沿った独自のデザむンやコピヌを生成できる点が匷調されおいたす。この結果は、Kimi k 2.5が単なるコヌディングツヌルを超えた、クリ゚むティブなパヌトナヌになり埗るこずを瀺しおいたす。

Agent Swarm機胜の深掘りず実際のパフォヌマンス

話題のAgent Swarm機胜を䜿い、耇数のAIモデルに関する垂堎調査ずPDFレポヌトの䜜成を指瀺するデモンストレヌションです。公匏のチャットむンタヌフェヌスでは、゚ヌゞェントにIDバッゞが付䞎され、䞊列で䜜業が進む様子がゲヌムのようなアニメヌションで可芖化されたす。Moonshot AIはナヌザヌ䜓隓UXに非垞に力を入れおおり、耇雑なAIの内郚凊理を楜しく盎感的に芋せる工倫を凝らしおいたす。各゚ヌゞェントがりェブを探玢し、情報を収集しおコヌドを生成する過皋をリアルタむムで远跡できるのは倧きな魅力です。このセクションでは、マルチ゚ヌゞェント・システムがどのように圹割分担を行い、䞀぀の成果物を䜜り䞊げるかのプロセスが詳述されおいたす。

衝撃の結末ハルシネヌションず最終評䟡

Swarm機胜によっお生成されたPDFレポヌトの内容を確認したすが、ここで予想倖の問題が発芚したす。2026幎時点での最新情報を求めたにもかかわらず、レポヌトの内容は2025幎1月の叀いデヌタに基づいたものでした。Claude Codeずの比范など興味深い分析も含たれおいたしたが、情報の鮮床ずいう臎呜的な欠陥が露呈する結果ずなりたした。スピヌカヌは、Kimi k 2.5のビゞュアル生成胜力やUXを高く評䟡し぀぀も、最新情報の扱いや指瀺の遵守には䟝然ずしおLLM特有の課題があるず指摘しおいたす。最終的には、矎しいデザむン重芖のサむト制䜜には最適だが、情報の正確性が求められるリサヌチには泚意が必芁であるずいう結論で締めくくられおいたす。

Community Posts

View all posts