00:00:00CursorがGPT 5.2 Codexのリリースを発表しました。これは長時間実行タスクのための新しい最先端モデルです。しかし、
00:00:08実はそれが私の動画のメインポイントではありません。この動画の本題は、
00:00:12CursorのCEOであるMichael Truelによるこの投稿についてです。彼はこのモデルを使用したと述べています。おそらくですが、
00:00:21ここで言及しているのはGPT 5.2であってCodexではないのですが、
00:00:25恐らくCodexのことを指しているのでしょう。彼らはこのモデルを使ってブラウザをAIで構築したのです。私の理解では、
00:00:32完全にAIだけで作ったということです。なぜなら、
00:00:35中断されることなく1週間稼働し続けたからです。つまり、
00:00:39CursorのAIが1週間稼働してブラウザを構築したのです。
00:00:43300万行以上のコードを数千のファイルに渡って書き上げました。そして、
00:00:48そのレンダリングエンジンはゼロから書かれたもので、
00:00:51HTMLパース、
00:00:53CSSカスケード、
00:00:54ブラウザに期待されるあらゆる機能を処理します。しかし、
00:00:58ここには重要な制限が一つあります。「一応動く」というレベルなのです。そして、
00:01:03Cursorチームの意図は完全に理解できます。AI単体でほぼ動作するブラウザを書いたというのは確かに印象的です。しかし、
00:01:12私自身はブラウザを作ったことはありませんし、
00:01:15恐らく今後も作ることはないでしょうが、
00:01:1880%から100%へ持っていく部分こそが複雑であることは間違いないと言えるでしょう。そしてそれはブラウザに限った話ではありません。人生で何かを作り上げたことがある人なら、
00:01:30コーディング以外の分野であっても、
00:01:32ほとんどのプロジェクトにおいて、
00:01:35本当に難しい部分は80%完成してから始まるということを知っているはずです。そしてマーケティングなどの超難しい部分についてはまだ触れてもいません。
00:01:45私が話しているのは、
00:01:46ただ構築することについてです。多くのプロジェクト、
00:01:50多くのソフトウェアにとって、
00:01:52100%に到達する必要はありませんが、
00:01:5480%や70%では不十分かもしれません。そして、
00:01:58達成するのが非常に難しいのは、
00:02:00その追加部分であり、
00:02:01AIだけでは到達できないかもしれない部分なのです。AIだけでは、
00:02:06という意味です。ここで非常に明確にしておきたいのは、
00:02:09あの動画を誤解したり、
00:02:11誤って解釈したりしやすいからです。私はAIに対して100%肯定的です。常に使っています。例えば、
00:02:18buildmygraphic.comのコードのほとんどはAIによって書かれています。ただし、
00:02:24バイブコーディングではなく、
00:02:26私の指示に従って、
00:02:27私自身がコードをレビューし、
00:02:29必要なときには自分でコードに入って調整を加えています。でも、
00:02:33このサイトには多くのAIを使いました。また、
00:02:36私は開発者向けAIコースの大規模なアップデートをリリースしたばかりで、
00:02:41そこではGitHub CopilotとCursorを効率的に使う方法を説明し、
00:02:47AIからより多くを引き出すために彼らが提供するさまざまな機能を探求しています。なぜなら、
00:02:53私は信じているからです。他の動画でも共有しましたが、
00:02:56AIは開発者にとっての未来です。非常に有用なツールであり、
00:03:00それを大いに効率的に使うことが重要になるでしょう。それは私が完全に確信していることです。その純粋な形でのバイブコーディングが私たちをそこに導くとは、
00:03:11あまり確信していません。そして、
00:03:13それはおそらく説明する価値があります。なぜなら、
00:03:16バイブコーディングとエージェント的エンジニアリングの間には、
00:03:20スペクトラムがあると私は言うでしょう。もちろん、
00:03:24AIを全く使わないという選択肢もあります。しかし繰り返しますが、
00:03:28私はAIを使うべきだと確信しています。問題は、
00:03:31そのスペクトラムのどこにいるかということです。ここにいますか?それともここ?真ん中ですか?どこにでもいることができます。しかし、
00:03:40異なるトレードオフやユースケースがあると言えるでしょう。問題は、
00:03:45バイブコーディングをどう定義するかでもあります。私が理解しているバイブコーディングは、
00:03:51AIにコードを書かせ、
00:03:52コードレビューをせず、
00:03:54コードベースを理解せず、
00:03:55また「このパターンを使え」や「このパッケージを使え」といったコード固有の指示も渡さないことです。つまり、
00:04:03コードについて何も知らないということです。それが100%のバイブコーディングだと私は定義します。そして、
00:04:10確かに他にもさまざまな定義があります。それが私がバイブコーディングで意味することです。このコーディング形式は、
00:04:18商業製品や実際の製品には未来がないと私は思います。しかし、
00:04:22他のもの、
00:04:22他の種類の製品には素晴らしいものになり得ます。例えば、
00:04:26バイブコーディングは、
00:04:28個人的なユーティリティツールや使い捨てソフトウェアには素晴らしいと思います。一度か二度使うだけで、
00:04:34あまり気にしないものや、
00:04:36あるいは無料のソフトウェアで、
00:04:38人々にお金を請求しないため、
00:04:40それがうまく機能するかどうかは実際には重要ではないもの。こうした主張はできますし、
00:04:46これらは純粋なバイブコーディングが実行可能なユースケースだと言えます。何かをするスクリプトをAIに要求するだけで、
00:04:54すべてのエッジケースをカバーしているか、
00:04:56潜在的なバグがあるかどうかを気にしない、
00:04:59なぜならそれがあなたのために仕事を成し遂げれば、
00:05:03あなたは満足だからです。それは全く問題ありません。そして、
00:05:07バイブコーディングを問題なく行えます。さて、
00:05:10スペクトラムの反対側には、
00:05:11エージェント的エンジニアリングがあります。そして、
00:05:15エージェント的エンジニアリングでは、
00:05:17私が行っていることであり、
00:05:19未来だと思うことですが、
00:05:21AIをツールとして使います。これは、
00:05:23単純なタスクだけに使うという意味ではありません。複雑なタスクを含むことができます。これは私にとって非常に重要です。誤解されやすいからですが、
00:05:33これには複雑なタスクが含まれ得ます。しかし、
00:05:36それは使いたいパターン、
00:05:38ライブラリなどに関する明確な指示があるということを意味します。また、
00:05:43何らかの方法でコードをレビューするということも意味します。他のAIツールの助けを借りた自動レビューを含むこともできますが、
00:05:51何が起こっているかを理解するために時々コードを見るでしょう。そして、
00:05:56AIが行き詰まったときや、
00:05:58特定のインターフェースがどのように見えるべきか、
00:06:01またはどのパターンを使いたいかを知っている特定の実装でAIを始めたいときに、
00:06:06自分でコードに入るということも意味します。AIがあなたの考えを完成させることができるように、
00:06:13と言うべきでしょう。私はこれが未来だと思います。今年、
00:06:16エージェント的エンジニアリング、
00:06:19それは少なくとも私の未来です。そしてもちろん、
00:06:22私はここで間違っているかもしれません。おそらく数年後には、
00:06:26バイブコーディングが唯一の方法になっているかもしれません。なぜなら、
00:06:31AIが非常に優れていて、
00:06:32すべてを行えるからです。そうなるとは思いませんが、
00:06:36絶対にそうなる可能性はあります。しかし、
00:06:39今唯一の間違った決定は、
00:06:40このスペクトラムのどこにもいないことだと思います。どこかにいるべきです。絶対にAIを使うべきです。そして、
00:06:48私は他の動画でもそれを共有しました。しかし、
00:06:51この投稿に戻ると、
00:06:52私はその「kind of works(なんとなく動く)」ということに問題があります。そして、
00:06:58ここで言及したように、
00:07:00このCursorの投稿のコンテキストでそれを理解しています。また、
00:07:05明らかにCursorチームは物語をシフトさせたいか、
00:07:08特にXで再び可視性を得たいと思っているようです。過去数週間、
00:07:12Xではバイブコーディングに触発された方法で、
00:07:15Claude codeとRolfループを使ってAIにすべてを構築させる開発者が支配的でした。Cursorチームが、
00:07:23Cursorを使ってもAIで長時間実行するタスクを行い、
00:07:27AIにソフトウェアを自律的に構築させることができることを示したいと思うのは理にかなっています。なぜなら、
00:07:34それは明らかに今、
00:07:36特にXで多くの可視性を獲得していることだからです。だから私はこれを完全に理解しています。そして繰り返しますが、
00:07:43Cursorは素晴らしいツールです。その点については非常に明確にしたいと思います。私がただ問題としているのは、
00:07:51この「kind of works(なんとなく動く)」という態度です。なぜなら、
00:07:57それは加速していると思うからです。AIとともに、
00:08:00それはますます問題になってきています。そして、
00:08:03私たちは何年も前からそれを見てきました。AIのずっと前から、
00:08:07iOSやWindowsのようなオペレーティングシステムが悪化していることを見てきました。それらはバグだらけです。初日にプレイ不可能なビデオゲームでそれを見ることができます。非常に多くのソフトウェアでそれを見ることができます。これはAIとは何の関係もありません。
00:08:26ソフトウェアの品質は悪化しました。そしてそれは理解できます。私たちは素早く反復できます。すぐに修正できます。それがこの15年ほどで発展してきた考え方なのです。そして、
00:08:38その考え方がAIによって今後も続き、
00:08:41加速していくと私は見ています。なぜなら、
00:08:44AIを使えばもちろん素早く修正できるからです。
00:08:47例えば、
00:08:48もしあなたがwipeコーディングをしているなら、
00:08:51バグについてそれほど気にしないかもしれません。なぜなら、
00:08:55どうせ一瞬で修正できるからです。そして、
00:08:58コードベースのコード品質がひどくても問題ないかもしれません。なぜなら、
00:09:03人間がそこに入り込む必要がないからです。AIがそれを理解して修正できます。そして、
00:09:09もしあなたの修正が、
00:09:10一つのクリーンな実装ではなく、
00:09:12起こりうるさまざまな問題を修正するための大量のif文であったとしても、
00:09:17それは問題ないかもしれません。そして繰り返しますが、
00:09:21それは私たちが持ちうる一つの未来です。私はそれが未来だとは思いませんし、
00:09:26確実にそれが未来であってほしいとも思いませんが、
00:09:29そのような未来もありえます。しかし同時に、
00:09:32開発者として、
00:09:33ソフトウェアを構築する企業として、
00:09:35高品質なソフトウェア、
00:09:37初日から壊れていないソフトウェア、
00:09:39ひどくないソフトウェアには本当の市場があると思います。そして、
00:09:44より良いソフトウェアを構築するためにAIを使うこともできます。素早く動いてソフトウェアの品質を犠牲にすることを強制する法律はありません。AIを使ってより良いソフトウェアを構築し、
00:09:56両方の世界の最高のものを得て、
00:09:58あなたのスキルとAIを組み合わせ、
00:10:01AIをコードを見てくれる追加の目として使うことができます。そして、
00:10:05私はもっとその方向に進んでいってほしいと思います。なぜなら、
00:10:10おそらく大多数はそうしないでしょうが、
00:10:12高品質なソフトウェアを構築し、
00:10:14両方の世界の最高のものを得ようとする企業や開発者には、
00:10:18価値ある機会が開かれると信じているからです。