開発チームのようなAIコーディングツール「Routa」を試してみた

BBetter Stack
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00これはRuda、オープンソースのAIコーディングツールです
00:00:03AIエージェントを、より実用的な
00:00:05デリバリーシステムへと変貌させます。
00:00:07「リポジトリのコンテキストを貼り付けて、動くことを祈る」だけのツールではありません。
00:00:11バックログ、開発、レビューを備えた
00:00:14証拠とゲートがあるデリバリーシステムです。
00:00:16AIコーディングツールは開発を高速化しましたが、
00:00:19同時に「AIの管理」という新しい仕事も増えました。
00:00:22Rudaは無料のローカルファーストなツールで、
00:00:25AIエージェント向けのカンバンボードが中心です。
00:00:27実際に使えるものか試してみましょう。
00:00:30(ロゴの音)
00:00:34多くのAI開発ツールは、同じ3つの壁に突き当たります。
00:00:36第一は「チャット地獄」です。
00:00:38重要な情報のすべてが会話の中に埋もれてしまいます。
00:00:42計画、失敗した試み、修正、
00:00:44奇妙な回避策。すべてが会話の中に閉じ込められ、
00:00:46ひたすらスクロールして遡る。
00:00:47私たちはいつもこれをやっています。
00:00:48次に「トレーサビリティの欠如」です。
00:00:50AIはコードを変更しますが、何を試し、
00:00:53なぜそのアプローチを選び、
00:00:56どんな根拠に基づいて変更したのか、いつも分かるとは限りません。
00:00:58最後に、「品質ゲート」が実質的にないことです。
00:01:01「テストは実行したか?」「差分は確認したか?」といった
00:01:04確認を自分でする必要があります。
00:01:06受け入れ基準を本当に満たしているのか?
00:01:08これが問題なのです。コードを書くことと
00:01:10ソフトウェアをデリバリーすることは別物だからです。
00:01:13Rudaの考え方は単純です。
00:01:16AIコーディングを単なるチャットセッションとして扱うのはやめよう。
00:01:19タスク、エージェント、レビュー段階、
00:01:22証拠とゲートを備えたデリバリーパイプラインとして扱おう。
00:01:25つまり、AI支援によるソフトウェア開発にCI/CDの考え方を導入するのです。
00:01:30では、これでワークフローがどう変わるか見てみましょう。
00:01:32コーディングを効率化するツールがお好きなら、
00:01:34ぜひチャンネル登録してください。
00:01:35動画は定期的に公開しています。
00:01:37これがRudaのデスクトップアプリです。
00:01:39リポジトリをプルしてDocker Composeを実行すれば、
00:01:42自前でホストすることも可能です。セルフホスト派の方へ。
00:01:45私はGitリポジトリの同期で少しトラブルがあったので、
00:01:48プラグアンドプレイのデスクトップ版を選びました。
00:01:52ワークスペースを作成して、実在するリポジトリを紐付け、
00:01:56カンバンを選択します。
00:01:58これで画面が開くので、
00:02:001つか2つ、小さなタスクを与えます。
00:02:02大げさなものじゃなく、アプリ全体を作るわけでもなく、
00:02:05実際の開発でAIツールに依頼するような
00:02:07ごく普通のタスクです。
00:02:11通常ならここで空のチャットを開いて、
00:02:14頑張って良いプロンプトを書こうとするところです。
00:02:16でもここでは、タスクを追加すると自動的に
00:02:19カンバンボードに追加されます。
00:02:22タスクがチャットの中に流れてしまうことはありません。
00:02:25ちゃんと居場所があるんです。
00:02:27まずはここ、バックログから始まります。
00:02:30AIが処理を進めると、開発中に移動し、
00:02:34適切なエージェントがそれを引き受けます。
00:02:36このように、引き継ぎの様子もすべて
00:02:38自動で行われているのが分かります。
00:02:39こうして各ステージを通過していくのです。
00:02:41ささいなことに聞こえるかもしれませんが、重要です。
00:02:44AIのフローやアウトプット、
00:02:46何をしているかを確認できます。
00:02:48タスク内では、処理が行われている最中であっても
00:02:51対話することができます。
00:02:54ワークフローのふりをした巨大な会話ではなく、
00:02:56こうしてワークフローが可視化されるのです。
00:02:59証拠もトレースも手に入ります。
00:03:01何が変更され、何がチェックされ、
00:03:03開発プロセスのどこにタスクがあるのかが分かります。
00:03:07これはOpenCodeや、好きなAIエージェントを使用可能です。
00:03:11AIのAPIキーを接続して、好きなものを選べます。
00:03:14今回はAnthropicのキーを同期してClaudeを使いました。
00:03:18では、Rudaとは何なのかを整理しましょう。
00:03:21これは単なるAIチャットボックスではありません。
00:03:23ここが最も重要な点です。
00:03:25本質はカンバンボードにあります。
00:03:28調整レイヤーなのです。
00:03:30AIエージェントが取り組むべき
00:03:32プロジェクトボードだと考えてください。
00:03:35タスクはあるレーンから始まり、別のレーンへと動き、
00:03:37段階を経て進んでいきます。
00:03:39AIキーをリンクすれば、
00:03:42ステージごとに異なるエージェントを使えます。
00:03:441つのエージェントが全部やろうとするのではなく、
00:03:47計画、実装、レビュー、テスト、説明などを
00:03:50Rudaが仕事に構造を与えます。
00:03:52ワークスペースを作り、リポジトリを接続し、
00:03:55タスクを定義する。
00:03:56その構造の中でエージェントが動くのです。
00:03:59MCPやACPといったエージェントプロトコルも使えます。
00:04:03必要に応じてそれらを追加できます。
00:04:06ソフトウェアエージェントを調整するための
00:04:08インフラに近いものです。
00:04:10Rudaは単にLLMに「ねえ、Claude、
00:04:12これ良くない?」と聞くだけではありません。
00:04:14チェック機能、適合性関数、
00:04:17証拠、レビューゲートを追加しようとしています。
00:04:19これで質問の質が変わりますよね?
00:04:22どうやって使うのか?
00:04:23これでどうワークフローを加速できるのか?
00:04:25多くの開発者が同じAIコーディングの壁にぶつかります。
00:04:29関数を頼めば出力してくれる。
00:04:32テストを頼めばそれも出力してくれる。
00:04:34エラーを貼れば、何をするか?
00:04:36修正案をくれる。
00:04:38まあ、修正案をくれるといいんですが。
00:04:41しかし実際のコードベースで使い始めると、
00:04:43すべてが保守作業へと変わります。
00:04:46コンテキストが散らかり、
00:04:48エージェントは何を試したかを忘れ、
00:04:51触れてほしくないファイルまで変えてしまう。
00:04:53常に作業を確認し続けなければならない。
00:04:55何が起きているかというと、少しずつ、
00:04:58面倒なことが起きているんです。
00:05:00仕事が減ったわけではない。
00:05:02AIのマネージャーになっただけなんです。
00:05:05別の種類の仕事です。
00:05:06タスクを追跡し、差分をレビューし、
00:05:09テストを確認する。そのすべてを。
00:05:12ただ新しい仕事が増えただけです。
00:05:13Rudaはそのための可視化されたボードを提供します。
00:05:17では、既存のツールと比較してどこに位置づくのか?
00:05:19そうですよね?
00:05:20CursorやClaudeのようなツールはチャットファーストです。
00:05:23それは悪いことではありません。
00:05:25統合されていて、コードに近い強力なコードアシスタント
00:05:28が欲しいときには最高です。
00:05:31しかし、中心にあるのは会話であり、
00:05:34投げかけるプロンプトです。
00:05:36Rudaの中心は少し違います。
00:05:38バックログからテスト、レビューへと進む
00:05:41デリバリーシステムの中を動くタスクです。
00:05:44CrewAIやLangGraphのようなエージェントフレームワークと比べると、
00:05:46あちらの方が柔軟ではあります。
00:05:49しかし、その柔軟性ゆえに、自分で
00:05:51ワークフローを構築する必要があります。
00:05:52誰が計画し、誰が実装し、証拠はどこに行くのか?
00:05:55そういったすべてです。
00:05:56Rudaは無料、ローカルファースト、そしてプラグイン可能です。
00:05:59ローカルリポジトリ、ローカルワークフロー。アカウント登録も
00:06:02基本コンセプトを試すだけなら不要です。
00:06:05ここで「すべてを捨ててRudaに乗り換えろ」なんて
00:06:08言いませんよ。
00:06:09そんなの嘘です。
00:06:10それは全く真実ではない。
00:06:12これは、特定の目的には良いということです。
00:06:15使っていて楽しかったですよ。
00:06:17すぐに気に入った点がいくつかあります。
00:06:19可視化されたボード、明確なタスク状態、
00:06:22追跡可能な引き継ぎ。これは素晴らしい。
00:06:24300件のチャットスレッドよりもずっとプロフェッショナルです。
00:06:27ローカルファーストのアプローチも良い。
00:06:30多くの人が、AIツールがコードに対する境界線もなく
00:06:32サブスクリプションモデル化していくことにうんざりしています。
00:06:35これをローカルのワークフローの近くに保てるのは、
00:06:38本当の利点です。
00:06:40もちろん、技術的には自分でも
00:06:42すべてできるかもしれませんが、整理しやすく
00:06:44してくれるわけではありません。だから私の考えでは、
00:06:47Rudaを使うことはフローを加速させます。
00:06:49カンバンとプロトコルモデルには学習曲線があります。
00:06:52もし単にチャットボックスを開いて質問し、
00:06:53答えを貼り付けたいだけなら、
00:06:56これは過剰です。
00:06:57そんなツールではありません。
00:06:59デスクトップアプリがベストな使い方ですが、
00:07:01大手の商用AIほど素晴らしい
00:07:02操作感ではないかもしれません。
00:07:05Cursorの操作感は素晴らしいですから。
00:07:06あのインターフェースです。
00:07:07Claude Codeも同様。
00:07:08クローズドなツールで得られるような、
00:07:10すぐに使えるエージェントは少ないです。
00:07:12しかし、それが実は私がこの方向性を好きな理由です。
00:07:15ソフトウェアデリバリーの困難な部分が
00:07:17消え去ったふりをしていないからです。
00:07:19ただ整理しようとしているだけです。
00:07:20AIはなくなりませんが、チャットファーストなワークフローは
00:07:22限界を見せ始めています。
00:07:24次のステップは単により賢いモデルではなく、
00:07:27より良い調整、トレース、
00:07:29そしてゲートです。
00:07:30このようなコーディングツールがお好きなら、
00:07:32Better Stackチャンネルをぜひ登録してください。
00:07:34また別の動画でお会いしましょう。

Key Takeaway

RudaはCI/CDの思想をAIコーディングに導入し、カンバンボードを用いてタスクとエージェントの処理プロセスを可視化することで、散乱するチャット履歴や品質管理の問題を解決する。

Highlights

  • RudaはAIエージェントにカンバンボードを統合し、チャットベースの管理から脱却するローカルファーストのコーディングツールである。

  • タスクはバックログから開発、レビューといったパイプライン上の各ステージを通過するため、実行プロセスの可視性とトレーサビリティが確保される。

  • Docker Composeを利用してリポジトリのセルフホストが可能であり、デスクトップアプリ版はプラグアンドプレイで利用できる。

  • AI APIキーを接続することでAnthropicのClaudeなど任意のLLMをステージごとに使い分け、計画からテストまでの構造化された開発を可能にする。

  • AIコーディングに伴う「AI管理という新しい仕事」を軽減するため、チャット内に埋もれがちな試行錯誤やコード変更の根拠を明確に記録する。

Timeline

AIコーディングにおける現状の課題

  • AIコーディングの主流であるチャットセッションは重要な情報が埋もれやすく、管理コストを増大させる。
  • AIによるコード変更の根拠や試行錯誤の過程を追跡するトレーサビリティが不十分である。
  • コード生成とソフトウェアデリバリーは異なり、現状のツールには品質ゲートや自動テストの仕組みが欠けている。

多くのAI開発ツールは会話に依存しており、計画や修正内容が過去のログに埋もれる「チャット地獄」を生む。変更の経緯が不明確なまま進むため、品質ゲートが実質的に存在せず、開発者はAIの管理作業に追われる状態になる。

Rudaのワークフローと導入方法

  • RudaはAIエージェントをデリバリーパイプラインの一部として扱い、カンバン形式でタスク管理を行う。
  • デスクトップアプリはリポジトリの同期が容易で、ローカルファーストな環境を構築できる。
  • タスクが各ステージを通過するたびに自動的にエージェントへ引き継がれ、実行結果が記録される。

Rudaは空のチャットボックスではなく、バックログ、開発、レビューといった段階的なボードを重視する。タスクは個別に可視化され、AIが何を行い、どのステージにあるかが明確になるため、CI/CDのような構造化された開発が可能になる。

調整レイヤーとしてのAIインフラ

  • Rudaは特定のAIモデルに依存せず、外部APIキーを接続してClaudeなどのLLMを自由に選択できる。
  • 各ステージ(計画、実装、テスト、説明)に異なるエージェントを配置し、ワークフローをインフラレベルで構造化する。
  • MCPやACPといった標準的なエージェントプロトコルを拡張として追加できる。

各フェーズで最適なモデルを選択することで、単純なコード生成以上の制御が可能になる。この構造により、コードベースの保守作業が混乱しがちな現在のAIコーディングスタイルを、整理された管理プロセスへと変貌させる。

既存ツールとの比較と将来性

  • CursorやClaudeがチャットファーストの利便性を追求する一方、Rudaはデリバリーシステムとしての正確性と追跡能力を重視する。
  • 学習コストは高いが、プロフェッショナルな開発プロセスを求める場合に有用である。
  • チャットファーストの限界を超え、今後は調整、トレース、ゲートを備えた統合的な管理が重要になる。

Rudaは操作感の洗練よりも、ソフトウェア開発の複雑な実態を隠さないアプローチをとる。AIが生成するコードの品質を担保するため、今後は単に賢いモデルを導入するだけでなく、Rudaのような管理レイヤーが必要となる。

Community Posts

No posts yet. Be the first to write about this video!

Write about this video