Kimi K2.6なら40分で起業可能！？（フルモデル徹底解説）

日本語العربية Deutsch English Español Français हिन्दी Bahasa Indonesia 한국어 Português Русский 中文

Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology

Transcript

00:00:00ご覧の通り、この例を使えば

00:00:04Kimiのこの機能で40分以内にウェブ制作事業を立ち上げることができます。

00:00:07皆さん、Moonshot AIが主力モデル「Kimi」のアップデートを発表しました。

00:00:13最新モデルの「Kimi k2.6」は、最先端のコーディングと

00:00:18長期実行能力、そしてエージェントスウォーム機能を備えています。

00:00:22今日の動画では、この新モデルを検証し、様々な

00:00:27エージェントタスクでの性能や、謳い文句通りの凄さがあるのかを確認します。

00:00:32面白くなりそうですね。それでは見ていきましょう。

00:00:34数ヶ月前、Kimi k2.5をレビューしましたが、フロントエンドデザインは非常に優秀でした。

00:00:44エージェントスウォーム機能にも純粋に感銘を受けました。

00:00:48チャットボットページのUXに非常に注力されている点も気に入っていました。

00:00:54今回のアップデートでは、実際のプロダクション環境における

00:00:57AIエージェントの活用方法が劇的に進化すると期待されています。

00:01:02まず、エージェントスウォームの規模が基本的に3倍になりました。

00:01:05k2.5では約100個のサブエージェントでしたが、k2.6では水平方向にスケールし

00:01:12300個の専門エージェントが最大4,000ステップの連携タスクを実行可能です。

00:01:18これはかなりの大型アップデートと言えます。

00:01:20より多くのタスクを並行して処理できるようになりました。

00:01:24また、新しい「保存された思考モード」が追加され

00:01:26マルチターンのタスク全体でモデルの推論プロセスの一貫性が保たれます。

00:01:31複雑なワークフローを進める際によくあるメモリドリフトを防いでくれます。

00:01:36そして、長期タスク対応です。

00:01:39彼らのテストでは、13時間のエンジニアリングタスクで185%のスループット向上を達成しました。

00:01:46美観に関しては、コーディング主導のデザインへと移行しました。

00:01:51単に綺麗なランディングページを作るのではなく、独自のビジョンエンコーダー

00:01:57「MoonVIT」を使って、UI/UXの構造をより深く推論します。

00:02:03認証からデータベースのログ記録までフルスタックのワークフローをこなせます。

00:02:08視覚的な参照画像やプロンプト一つから、完全に機能する対話型プロトタイプを

00:02:14GSAPアニメーションやスクロールトリガーエフェクトなどを駆使して構築します。

00:02:19ちなみに、このビジョンエンコーダーを含め、すべてオープンソースです。

00:02:23必要であれば、Kimiのアーキテクチャから切り離して

00:02:26Hugging Faceからモデルを取得して単独で動かすことも可能です。

00:02:30素晴らしい機能ばかりですが、実際の性能をテストしてみましょう。

00:02:35Kimiのモデルはオープンソースなので、好きな環境で理論上は使用可能です。

00:02:40今回はエージェントスウォームのテストということで、彼らのチャットボットインターフェースを

00:02:46使用して最高のパフォーマンスを見てみます。まずは新エージェントスウォーム機能です。

00:02:50公式サイトの例を見ていて、ある一点に非常に惹かれました。

00:02:54k2.6を使ってロサンゼルスの店舗30軒を特定し、

00:03:01Googleマップ上の公式サイトがない店に対し、高コンバージョンなLPを作成するというものです。

00:03:06Instagramで流行っている手法なので、実際に自分でも

00:03:11ウェブエージェンシーを作れるか試してみたいと思います。同様のテストを試みます。

00:03:16私はトロントに住んでいますが、近所の公証人の多くが

00:03:21ウェブサイトを持っていないか、非常に古いサイトのままだと気づきました。

00:03:26トロント周辺の公証人20軒をGoogleマップか

00:03:32カナダのイエローページで特定し、各店に高コンバージョンなLPを生成してみます。

00:03:37このタスクでKimiは5つのサブエージェントを起動し、それぞれがサブタスクを担当しました。

00:03:43サブエージェントが実際にウェブを巡回してサイトにアクセスする様子は

00:03:48非常に興味深かったです。彼らは独自の判断でサイトが古いかどうかを

00:03:53推定までしていました。合計でKimiは作業完了まで約40分かかりました。

00:03:58終了後、Kimiは各サイトに関する詳細な調査レポートと

00:04:03見込み客へのアウトリーチ用のサンプルメールまで生成してくれました。

00:04:09市場規模や収益の可能性に関するレポートも合わせて提供されました。

00:04:16もちろん、生成されたすべてのファイルも手に入りました。そして、

00:04:22各LPをプレビューできる専用ページも作成されました。

00:04:27ただ、生成されたLPがすべて全く同じデザインだったのは少し残念でした。

00:04:32プロンプトの詳細が足りなかったのかもしれませんが、

00:04:38公式サイトの例と同じプロンプトを使ったはずです。事前の環境構築が必要だったのかも。

00:04:43フォローアップタスクとして、各ページに独自のデザインと

00:04:49画像を加えてより魅力的にするよう指示しました。その結果、Kimiは

00:04:55サイトごとにカスタム画像を生成しました。笑い話ですが、Kimiは

00:05:00自分の成果をよく自画自賛します。例えば「20個の画像を生成した、どれも素晴らしい」など。

00:05:06「これで20個の完全にユニークなLPが完成した」と。……評価は私が決めさせてほしいですね。

00:05:12このフォローアップには17分かかりました。またしてもKimiは

00:05:17「LPは最高に仕上がった」と自賛しています。分かった、分かったから。

00:05:23新しいプレビューページが生成されましたが、なぜか表示が崩れています。CSSの問題でしょう。

00:05:28それは置いておいて、肝心のウェブページを確認します。新しいページは

00:05:34CSSアニメーションが加わり、AI生成のヘッダー画像も配置され、見た目はかなり良くなりました。

00:05:40ただ、気になったのは各ページが

00:05:45依然として同じパターンに従っている点です。セクションや構成が同じです。

00:05:51見かけは違っても、結局は同じ定型文（ボイラープレート）で

00:05:56少し残念です。もっとユニークなアプローチを期待していました。しかしスタートとしては良いでしょう。

00:06:02ご覧の通り、この例を使えば

00:06:07Kimiの機能を使って40分以内にウェブ制作事業を立ち上げることができます。

00:06:13Kimiのエージェントスウォームに近所の店を巡回させ、カスタムウェブサイトと

00:06:18カスタムメールを送れば副業の完成です。この動画の後は、

00:06:25どこの店も数百件の提案メールと、AI生成のウェブサイトで

00:06:29溢れかえりそうですが。エージェントスウォーム機能の利用には

00:06:36Allegrettoプランへの加入が必要である点は注意してください。

00:06:41Claude Codeで同じタスクを行うよりは確実に安いと思います。ただ残念なのは、

00:06:46Kimiの使用統計にこの40分間のタスクでどれだけトークンが消費されたか

00:06:53詳細が出てこないことです。Claudeならもう制限に達していた気がします。

00:06:58以上が新しく改善されたエージェントスウォームです。ところで、

00:07:04最近Kimiのエージェントスウォームを使って面白い実験をした方がいれば、

00:07:09コメント欄で結果をシェアしてください。次にコーディングの改善度をテストします。

00:07:142.6では長期コーディングタスクでの性能向上と、安定した

00:07:20汎用性を謳っています。そこで、フロントエンドとバックエンドを備えた

00:07:26ウェブスクレイピング機能付きのアプリ作成を依頼しました。最近RAMの価格が

00:07:31非常に高騰しているので、価格を追跡して比較できる

00:07:36ウェブサイトを作り、最安値を探せるようにしたいと思いました。

00:07:42作業完了まで12分かかりました。最新のCLIバージョンでは

00:07:47トークンカウンターが追加されたので、実際の

00:07:52トークン消費量を確認できるようになり、非常に便利です。結果を見てみましょう。

00:07:59サイトはダークテーマで表示されています。ブランドを選択して

00:08:05店舗ごとの価格オプションを切り替えたり確認できます。

00:08:11さらにクールな点は、データを再取得するライブリフレッシュ機能です。

00:08:16商品画像を取得できなかったのは残念でしたが、

00:08:21主要機能は動作しています。比較セクションもありますが、追加するボタンがありません。

00:08:27フォローアップで修正を依頼しました。これで「比較に追加」ボタンが表示され、

00:08:34比較タブに移動すると、選択したRAMのクールな比較表が

00:08:41表示されるようになりました。なかなか良いです。コードを見ると、

00:08:46Node.jsとExpressを使って構築しています。Reactを使わず、

00:08:53バニラJavaScriptでinnerHTMLを直接変更する手法を選んだのは

00:08:59興味深い選択でした。しかし動けば文句はありません。最後に

00:09:05AxiosとCheerioを使用してAmazon、Newegg、BestBuyをスクレイピングする関数も追加されました。

00:09:13というわけで、Kimi k2.6の検証でした。正直なところ、

00:09:19テストした結果からは、2.5から劇的な飛躍を遂げたとは言えません。

00:09:25ですが、いくつかの素晴らしいユーザビリティの向上が見られます。

00:09:30Moonshot AIがプラットフォームを継続的に改善している点を評価します。

00:09:36Claude Codeのような高額なサービスより安価な代替案を提供しているのも素晴らしい。

00:09:43Moonshot AIさん、お疲れ様です。今後のKimiの進化も楽しみです。

00:09:48皆さんもこの動画が役に立ったと思ったら

00:09:53高評価ボタンをお願いします。今後の技術解説を見逃さないよう

00:09:58チャンネル登録もお願いします。Better Stackのアンドレスでした。

00:10:04また次回の動画でお会いしましょう。

Key Takeaway

Kimi k2.6はエージェントスウォームの規模を3倍に拡大し、複雑なフルスタック開発やウェブ制作業務を最短40分で自動化する性能を備えている。

Highlights

Kimi k2.6では、最大300個の専門エージェントが最大4,000ステップの連携タスクを並行処理できる。
13時間のエンジニアリングタスクにおいて、前モデル比で185%のスループット向上を達成した。
独自のビジョンエンコーダー「MoonVIT」により、UI/UX構造を推論してフルスタックのコードを生成する。
ウェブ制作事業立ち上げのデモでは、約40分で20軒の調査と高コンバージョンLPの生成を完了した。
RAM価格比較アプリの構築タスクにおいて、12分でCLIベースの比較ツールとスクレイピング機能を実装した。

Timeline

Kimi k2.6の機能アップデート

サブエージェント数が100個から300個へ増加し、水平方向のスケーリングが強化された。
保存された思考モードの導入により、長期タスクにおける一貫性が向上した。
MoonVITエンコーダーを使用して視覚情報からコーディング主導のデザインを行う。

Kimi k2.6はエージェント連携の規模を3倍に引き上げ、長時間のワークフローでもメモリドリフトを防ぐ推論プロセスを搭載した。フロントエンドデザインは単なる視覚的再現ではなく、構造的なUI/UX推論に基づき、GSAP等のライブラリを活用して生成される。

エージェントスウォームによる事業構築テスト

トロントの公証人20軒をターゲットに、ウェブサイトの有無を自動調査しLPを作成した。
作業完了まで約40分を要し、調査レポートとアウトリーチ用メールが自動生成された。
デザインの均一化が課題であり、フォローアップ指示による個別修正にはさらに17分を要した。

実用性の検証として、ウェブサイトを持たない店舗を特定しLPを生成するプロセスを自動化した。AIは自律的に巡回、調査、生成、プレビュー作成まで実行したが、生成されたLPのデザインパターンが重複する傾向があった。CSS調整などの微修正を含め、副業として機能する水準まで短時間で構築可能である。

コーディングタスクの性能検証

価格比較アプリの構築を12分で完遂した。
Node.js、Express、バニラJavaScriptによる実装を採用し、ライブリフレッシュ機能を統合した。
AxiosとCheerioを用いた複数サイトの価格スクレイピング関数が実装された。

長期コーディングタスクの安定性を検証するため、商品価格追跡アプリを生成させた。CLI上でトークン消費量を確認できる機能を活用し、Reactを用いずにinnerHTMLで動的にDOMを操作する構成で短時間に機能要件を満たした。既存のエージェント型サービスと比較してコスト効率に優れる選択肢となっている。

Community Posts

Write about this video