Kimi K2.6なら40分で起業可能!?(フルモデル徹底解説)

BBetter Stack
Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology

Transcript

00:00:00ご覧の通り、この例を使えば
00:00:04Kimiのこの機能で40分以内にウェブ制作事業を立ち上げることができます。
00:00:07皆さん、Moonshot AIが主力モデル「Kimi」のアップデートを発表しました。
00:00:13最新モデルの「Kimi k2.6」は、最先端のコーディングと
00:00:18長期実行能力、そしてエージェントスウォーム機能を備えています。
00:00:22今日の動画では、この新モデルを検証し、様々な
00:00:27エージェントタスクでの性能や、謳い文句通りの凄さがあるのかを確認します。
00:00:32面白くなりそうですね。それでは見ていきましょう。
00:00:34数ヶ月前、Kimi k2.5をレビューしましたが、フロントエンドデザインは非常に優秀でした。
00:00:44エージェントスウォーム機能にも純粋に感銘を受けました。
00:00:48チャットボットページのUXに非常に注力されている点も気に入っていました。
00:00:54今回のアップデートでは、実際のプロダクション環境における
00:00:57AIエージェントの活用方法が劇的に進化すると期待されています。
00:01:02まず、エージェントスウォームの規模が基本的に3倍になりました。
00:01:05k2.5では約100個のサブエージェントでしたが、k2.6では水平方向にスケールし
00:01:12300個の専門エージェントが最大4,000ステップの連携タスクを実行可能です。
00:01:18これはかなりの大型アップデートと言えます。
00:01:20より多くのタスクを並行して処理できるようになりました。
00:01:24また、新しい「保存された思考モード」が追加され
00:01:26マルチターンのタスク全体でモデルの推論プロセスの一貫性が保たれます。
00:01:31複雑なワークフローを進める際によくあるメモリドリフトを防いでくれます。
00:01:36そして、長期タスク対応です。
00:01:39彼らのテストでは、13時間のエンジニアリングタスクで185%のスループット向上を達成しました。
00:01:46美観に関しては、コーディング主導のデザインへと移行しました。
00:01:51単に綺麗なランディングページを作るのではなく、独自のビジョンエンコーダー
00:01:57「MoonVIT」を使って、UI/UXの構造をより深く推論します。
00:02:03認証からデータベースのログ記録までフルスタックのワークフローをこなせます。
00:02:08視覚的な参照画像やプロンプト一つから、完全に機能する対話型プロトタイプを
00:02:14GSAPアニメーションやスクロールトリガーエフェクトなどを駆使して構築します。
00:02:19ちなみに、このビジョンエンコーダーを含め、すべてオープンソースです。
00:02:23必要であれば、Kimiのアーキテクチャから切り離して
00:02:26Hugging Faceからモデルを取得して単独で動かすことも可能です。
00:02:30素晴らしい機能ばかりですが、実際の性能をテストしてみましょう。
00:02:35Kimiのモデルはオープンソースなので、好きな環境で理論上は使用可能です。
00:02:40今回はエージェントスウォームのテストということで、彼らのチャットボットインターフェースを
00:02:46使用して最高のパフォーマンスを見てみます。まずは新エージェントスウォーム機能です。
00:02:50公式サイトの例を見ていて、ある一点に非常に惹かれました。
00:02:54k2.6を使ってロサンゼルスの店舗30軒を特定し、
00:03:01Googleマップ上の公式サイトがない店に対し、高コンバージョンなLPを作成するというものです。
00:03:06Instagramで流行っている手法なので、実際に自分でも
00:03:11ウェブエージェンシーを作れるか試してみたいと思います。同様のテストを試みます。
00:03:16私はトロントに住んでいますが、近所の公証人の多くが
00:03:21ウェブサイトを持っていないか、非常に古いサイトのままだと気づきました。
00:03:26トロント周辺の公証人20軒をGoogleマップか
00:03:32カナダのイエローページで特定し、各店に高コンバージョンなLPを生成してみます。
00:03:37このタスクでKimiは5つのサブエージェントを起動し、それぞれがサブタスクを担当しました。
00:03:43サブエージェントが実際にウェブを巡回してサイトにアクセスする様子は
00:03:48非常に興味深かったです。彼らは独自の判断でサイトが古いかどうかを
00:03:53推定までしていました。合計でKimiは作業完了まで約40分かかりました。
00:03:58終了後、Kimiは各サイトに関する詳細な調査レポートと
00:04:03見込み客へのアウトリーチ用のサンプルメールまで生成してくれました。
00:04:09市場規模や収益の可能性に関するレポートも合わせて提供されました。
00:04:16もちろん、生成されたすべてのファイルも手に入りました。そして、
00:04:22各LPをプレビューできる専用ページも作成されました。
00:04:27ただ、生成されたLPがすべて全く同じデザインだったのは少し残念でした。
00:04:32プロンプトの詳細が足りなかったのかもしれませんが、
00:04:38公式サイトの例と同じプロンプトを使ったはずです。事前の環境構築が必要だったのかも。
00:04:43フォローアップタスクとして、各ページに独自のデザインと
00:04:49画像を加えてより魅力的にするよう指示しました。その結果、Kimiは
00:04:55サイトごとにカスタム画像を生成しました。笑い話ですが、Kimiは
00:05:00自分の成果をよく自画自賛します。例えば「20個の画像を生成した、どれも素晴らしい」など。
00:05:06「これで20個の完全にユニークなLPが完成した」と。……評価は私が決めさせてほしいですね。
00:05:12このフォローアップには17分かかりました。またしてもKimiは
00:05:17「LPは最高に仕上がった」と自賛しています。分かった、分かったから。
00:05:23新しいプレビューページが生成されましたが、なぜか表示が崩れています。CSSの問題でしょう。
00:05:28それは置いておいて、肝心のウェブページを確認します。新しいページは
00:05:34CSSアニメーションが加わり、AI生成のヘッダー画像も配置され、見た目はかなり良くなりました。
00:05:40ただ、気になったのは各ページが
00:05:45依然として同じパターンに従っている点です。セクションや構成が同じです。
00:05:51見かけは違っても、結局は同じ定型文(ボイラープレート)で
00:05:56少し残念です。もっとユニークなアプローチを期待していました。しかしスタートとしては良いでしょう。
00:06:02ご覧の通り、この例を使えば
00:06:07Kimiの機能を使って40分以内にウェブ制作事業を立ち上げることができます。
00:06:13Kimiのエージェントスウォームに近所の店を巡回させ、カスタムウェブサイトと
00:06:18カスタムメールを送れば副業の完成です。この動画の後は、
00:06:25どこの店も数百件の提案メールと、AI生成のウェブサイトで
00:06:29溢れかえりそうですが。エージェントスウォーム機能の利用には
00:06:36Allegrettoプランへの加入が必要である点は注意してください。
00:06:41Claude Codeで同じタスクを行うよりは確実に安いと思います。ただ残念なのは、
00:06:46Kimiの使用統計にこの40分間のタスクでどれだけトークンが消費されたか
00:06:53詳細が出てこないことです。Claudeならもう制限に達していた気がします。
00:06:58以上が新しく改善されたエージェントスウォームです。ところで、
00:07:04最近Kimiのエージェントスウォームを使って面白い実験をした方がいれば、
00:07:09コメント欄で結果をシェアしてください。次にコーディングの改善度をテストします。
00:07:142.6では長期コーディングタスクでの性能向上と、安定した
00:07:20汎用性を謳っています。そこで、フロントエンドとバックエンドを備えた
00:07:26ウェブスクレイピング機能付きのアプリ作成を依頼しました。最近RAMの価格が
00:07:31非常に高騰しているので、価格を追跡して比較できる
00:07:36ウェブサイトを作り、最安値を探せるようにしたいと思いました。
00:07:42作業完了まで12分かかりました。最新のCLIバージョンでは
00:07:47トークンカウンターが追加されたので、実際の
00:07:52トークン消費量を確認できるようになり、非常に便利です。結果を見てみましょう。
00:07:59サイトはダークテーマで表示されています。ブランドを選択して
00:08:05店舗ごとの価格オプションを切り替えたり確認できます。
00:08:11さらにクールな点は、データを再取得するライブリフレッシュ機能です。
00:08:16商品画像を取得できなかったのは残念でしたが、
00:08:21主要機能は動作しています。比較セクションもありますが、追加するボタンがありません。
00:08:27フォローアップで修正を依頼しました。これで「比較に追加」ボタンが表示され、
00:08:34比較タブに移動すると、選択したRAMのクールな比較表が
00:08:41表示されるようになりました。なかなか良いです。コードを見ると、
00:08:46Node.jsとExpressを使って構築しています。Reactを使わず、
00:08:53バニラJavaScriptでinnerHTMLを直接変更する手法を選んだのは
00:08:59興味深い選択でした。しかし動けば文句はありません。最後に
00:09:05AxiosとCheerioを使用してAmazon、Newegg、BestBuyをスクレイピングする関数も追加されました。
00:09:13というわけで、Kimi k2.6の検証でした。正直なところ、
00:09:19テストした結果からは、2.5から劇的な飛躍を遂げたとは言えません。
00:09:25ですが、いくつかの素晴らしいユーザビリティの向上が見られます。
00:09:30Moonshot AIがプラットフォームを継続的に改善している点を評価します。
00:09:36Claude Codeのような高額なサービスより安価な代替案を提供しているのも素晴らしい。
00:09:43Moonshot AIさん、お疲れ様です。今後のKimiの進化も楽しみです。
00:09:48皆さんもこの動画が役に立ったと思ったら
00:09:53高評価ボタンをお願いします。今後の技術解説を見逃さないよう
00:09:58チャンネル登録もお願いします。Better Stackのアンドレスでした。
00:10:04また次回の動画でお会いしましょう。

Key Takeaway

Kimi k2.6はエージェントスウォームの規模を3倍に拡大し、複雑なフルスタック開発やウェブ制作業務を最短40分で自動化する性能を備えている。

Highlights

  • Kimi k2.6では、最大300個の専門エージェントが最大4,000ステップの連携タスクを並行処理できる。

  • 13時間のエンジニアリングタスクにおいて、前モデル比で185%のスループット向上を達成した。

  • 独自のビジョンエンコーダー「MoonVIT」により、UI/UX構造を推論してフルスタックのコードを生成する。

  • ウェブ制作事業立ち上げのデモでは、約40分で20軒の調査と高コンバージョンLPの生成を完了した。

  • RAM価格比較アプリの構築タスクにおいて、12分でCLIベースの比較ツールとスクレイピング機能を実装した。

Timeline

Kimi k2.6の機能アップデート

  • サブエージェント数が100個から300個へ増加し、水平方向のスケーリングが強化された。
  • 保存された思考モードの導入により、長期タスクにおける一貫性が向上した。
  • MoonVITエンコーダーを使用して視覚情報からコーディング主導のデザインを行う。

Kimi k2.6はエージェント連携の規模を3倍に引き上げ、長時間のワークフローでもメモリドリフトを防ぐ推論プロセスを搭載した。フロントエンドデザインは単なる視覚的再現ではなく、構造的なUI/UX推論に基づき、GSAP等のライブラリを活用して生成される。

エージェントスウォームによる事業構築テスト

  • トロントの公証人20軒をターゲットに、ウェブサイトの有無を自動調査しLPを作成した。
  • 作業完了まで約40分を要し、調査レポートとアウトリーチ用メールが自動生成された。
  • デザインの均一化が課題であり、フォローアップ指示による個別修正にはさらに17分を要した。

実用性の検証として、ウェブサイトを持たない店舗を特定しLPを生成するプロセスを自動化した。AIは自律的に巡回、調査、生成、プレビュー作成まで実行したが、生成されたLPのデザインパターンが重複する傾向があった。CSS調整などの微修正を含め、副業として機能する水準まで短時間で構築可能である。

コーディングタスクの性能検証

  • 価格比較アプリの構築を12分で完遂した。
  • Node.js、Express、バニラJavaScriptによる実装を採用し、ライブリフレッシュ機能を統合した。
  • AxiosとCheerioを用いた複数サイトの価格スクレイピング関数が実装された。

長期コーディングタスクの安定性を検証するため、商品価格追跡アプリを生成させた。CLI上でトークン消費量を確認できる機能を活用し、Reactを用いずにinnerHTMLで動的にDOMを操作する構成で短時間に機能要件を満たした。既存のエージェント型サービスと比較してコスト効率に優れる選択肢となっている。

Community Posts

View all posts