Transcript

00:00:00CursorがGPT 5.2 Codexのリリースを発表しました。これは長時間実行タスクのための新しい最先端モデルです。しかし、
00:00:08実はそれが私の動画のメインポイントではありません。この動画の本題は、
00:00:12CursorのCEOであるMichael Truelによるこの投稿についてです。彼はこのモデルを使用したと述べています。おそらくですが、
00:00:21ここで言及しているのはGPT 5.2であってCodexではないのですが、
00:00:25恐らくCodexのことを指しているのでしょう。彼らはこのモデルを使ってブラウザをAIで構築したのです。私の理解では、
00:00:32完全にAIだけで作ったということです。なぜなら、
00:00:35中断されることなく1週間稼働し続けたからです。つまり、
00:00:39CursorのAIが1週間稼働してブラウザを構築したのです。
00:00:43300万行以上のコードを数千のファイルに渡って書き上げました。そして、
00:00:48そのレンダリングエンジンはゼロから書かれたもので、
00:00:51HTMLパース、
00:00:53CSSカスケード、
00:00:54ブラウザに期待されるあらゆる機能を処理します。しかし、
00:00:58ここには重要な制限が一つあります。「一応動く」というレベルなのです。そして、
00:01:03Cursorチームの意図は完全に理解できます。AI単体でほぼ動作するブラウザを書いたというのは確かに印象的です。しかし、
00:01:12私自身はブラウザを作ったことはありませんし、
00:01:15恐らく今後も作ることはないでしょうが、
00:01:1880%から100%へ持っていく部分こそが複雑であることは間違いないと言えるでしょう。そしてそれはブラウザに限った話ではありません。人生で何かを作り上げたことがある人なら、
00:01:30コーディング以外の分野であっても、
00:01:32ほとんどのプロジェクトにおいて、
00:01:35本当に難しい部分は80%完成してから始まるということを知っているはずです。そしてマーケティングなどの超難しい部分についてはまだ触れてもいません。
00:01:45私が話しているのは、
00:01:46ただ構築することについてです。多くのプロジェクト、
00:01:50多くのソフトウェアにとって、
00:01:52100%に到達する必要はありませんが、
00:01:5480%や70%では不十分かもしれません。そして、
00:01:58達成するのが非常に難しいのは、
00:02:00その追加部分であり、
00:02:01AIだけでは到達できないかもしれない部分なのです。AIだけでは、
00:02:06という意味です。ここで非常に明確にしておきたいのは、
00:02:09あの動画を誤解したり、
00:02:11誤って解釈したりしやすいからです。私はAIに対して100%肯定的です。常に使っています。例えば、
00:02:18buildmygraphic.comのコードのほとんどはAIによって書かれています。ただし、
00:02:24バイブコーディングではなく、
00:02:26私の指示に従って、
00:02:27私自身がコードをレビューし、
00:02:29必要なときには自分でコードに入って調整を加えています。でも、
00:02:33このサイトには多くのAIを使いました。また、
00:02:36私は開発者向けAIコースの大規模なアップデートをリリースしたばかりで、
00:02:41そこではGitHub CopilotとCursorを効率的に使う方法を説明し、
00:02:47AIからより多くを引き出すために彼らが提供するさまざまな機能を探求しています。なぜなら、
00:02:53私は信じているからです。他の動画でも共有しましたが、
00:02:56AIは開発者にとっての未来です。非常に有用なツールであり、
00:03:00それを大いに効率的に使うことが重要になるでしょう。それは私が完全に確信していることです。その純粋な形でのバイブコーディングが私たちをそこに導くとは、
00:03:11あまり確信していません。そして、
00:03:13それはおそらく説明する価値があります。なぜなら、
00:03:16バイブコーディングとエージェント的エンジニアリングの間には、
00:03:20スペクトラムがあると私は言うでしょう。もちろん、
00:03:24AIを全く使わないという選択肢もあります。しかし繰り返しますが、
00:03:28私はAIを使うべきだと確信しています。問題は、
00:03:31そのスペクトラムのどこにいるかということです。ここにいますか?それともここ?真ん中ですか?どこにでもいることができます。しかし、
00:03:40異なるトレードオフやユースケースがあると言えるでしょう。問題は、
00:03:45バイブコーディングをどう定義するかでもあります。私が理解しているバイブコーディングは、
00:03:51AIにコードを書かせ、
00:03:52コードレビューをせず、
00:03:54コードベースを理解せず、
00:03:55また「このパターンを使え」や「このパッケージを使え」といったコード固有の指示も渡さないことです。つまり、
00:04:03コードについて何も知らないということです。それが100%のバイブコーディングだと私は定義します。そして、
00:04:10確かに他にもさまざまな定義があります。それが私がバイブコーディングで意味することです。このコーディング形式は、
00:04:18商業製品や実際の製品には未来がないと私は思います。しかし、
00:04:22他のもの、
00:04:22他の種類の製品には素晴らしいものになり得ます。例えば、
00:04:26バイブコーディングは、
00:04:28個人的なユーティリティツールや使い捨てソフトウェアには素晴らしいと思います。一度か二度使うだけで、
00:04:34あまり気にしないものや、
00:04:36あるいは無料のソフトウェアで、
00:04:38人々にお金を請求しないため、
00:04:40それがうまく機能するかどうかは実際には重要ではないもの。こうした主張はできますし、
00:04:46これらは純粋なバイブコーディングが実行可能なユースケースだと言えます。何かをするスクリプトをAIに要求するだけで、
00:04:54すべてのエッジケースをカバーしているか、
00:04:56潜在的なバグがあるかどうかを気にしない、
00:04:59なぜならそれがあなたのために仕事を成し遂げれば、
00:05:03あなたは満足だからです。それは全く問題ありません。そして、
00:05:07バイブコーディングを問題なく行えます。さて、
00:05:10スペクトラムの反対側には、
00:05:11エージェント的エンジニアリングがあります。そして、
00:05:15エージェント的エンジニアリングでは、
00:05:17私が行っていることであり、
00:05:19未来だと思うことですが、
00:05:21AIをツールとして使います。これは、
00:05:23単純なタスクだけに使うという意味ではありません。複雑なタスクを含むことができます。これは私にとって非常に重要です。誤解されやすいからですが、
00:05:33これには複雑なタスクが含まれ得ます。しかし、
00:05:36それは使いたいパターン、
00:05:38ライブラリなどに関する明確な指示があるということを意味します。また、
00:05:43何らかの方法でコードをレビューするということも意味します。他のAIツールの助けを借りた自動レビューを含むこともできますが、
00:05:51何が起こっているかを理解するために時々コードを見るでしょう。そして、
00:05:56AIが行き詰まったときや、
00:05:58特定のインターフェースがどのように見えるべきか、
00:06:01またはどのパターンを使いたいかを知っている特定の実装でAIを始めたいときに、
00:06:06自分でコードに入るということも意味します。AIがあなたの考えを完成させることができるように、
00:06:13と言うべきでしょう。私はこれが未来だと思います。今年、
00:06:16エージェント的エンジニアリング、
00:06:19それは少なくとも私の未来です。そしてもちろん、
00:06:22私はここで間違っているかもしれません。おそらく数年後には、
00:06:26バイブコーディングが唯一の方法になっているかもしれません。なぜなら、
00:06:31AIが非常に優れていて、
00:06:32すべてを行えるからです。そうなるとは思いませんが、
00:06:36絶対にそうなる可能性はあります。しかし、
00:06:39今唯一の間違った決定は、
00:06:40このスペクトラムのどこにもいないことだと思います。どこかにいるべきです。絶対にAIを使うべきです。そして、
00:06:48私は他の動画でもそれを共有しました。しかし、
00:06:51この投稿に戻ると、
00:06:52私はその「kind of works(なんとなく動く)」ということに問題があります。そして、
00:06:58ここで言及したように、
00:07:00このCursorの投稿のコンテキストでそれを理解しています。また、
00:07:05明らかにCursorチームは物語をシフトさせたいか、
00:07:08特にXで再び可視性を得たいと思っているようです。過去数週間、
00:07:12Xではバイブコーディングに触発された方法で、
00:07:15Claude codeとRolfループを使ってAIにすべてを構築させる開発者が支配的でした。Cursorチームが、
00:07:23Cursorを使ってもAIで長時間実行するタスクを行い、
00:07:27AIにソフトウェアを自律的に構築させることができることを示したいと思うのは理にかなっています。なぜなら、
00:07:34それは明らかに今、
00:07:36特にXで多くの可視性を獲得していることだからです。だから私はこれを完全に理解しています。そして繰り返しますが、
00:07:43Cursorは素晴らしいツールです。その点については非常に明確にしたいと思います。私がただ問題としているのは、
00:07:51この「kind of works(なんとなく動く)」という態度です。なぜなら、
00:07:57それは加速していると思うからです。AIとともに、
00:08:00それはますます問題になってきています。そして、
00:08:03私たちは何年も前からそれを見てきました。AIのずっと前から、
00:08:07iOSやWindowsのようなオペレーティングシステムが悪化していることを見てきました。それらはバグだらけです。初日にプレイ不可能なビデオゲームでそれを見ることができます。非常に多くのソフトウェアでそれを見ることができます。これはAIとは何の関係もありません。
00:08:26ソフトウェアの品質は悪化しました。そしてそれは理解できます。私たちは素早く反復できます。すぐに修正できます。それがこの15年ほどで発展してきた考え方なのです。そして、
00:08:38その考え方がAIによって今後も続き、
00:08:41加速していくと私は見ています。なぜなら、
00:08:44AIを使えばもちろん素早く修正できるからです。
00:08:47例えば、
00:08:48もしあなたがwipeコーディングをしているなら、
00:08:51バグについてそれほど気にしないかもしれません。なぜなら、
00:08:55どうせ一瞬で修正できるからです。そして、
00:08:58コードベースのコード品質がひどくても問題ないかもしれません。なぜなら、
00:09:03人間がそこに入り込む必要がないからです。AIがそれを理解して修正できます。そして、
00:09:09もしあなたの修正が、
00:09:10一つのクリーンな実装ではなく、
00:09:12起こりうるさまざまな問題を修正するための大量のif文であったとしても、
00:09:17それは問題ないかもしれません。そして繰り返しますが、
00:09:21それは私たちが持ちうる一つの未来です。私はそれが未来だとは思いませんし、
00:09:26確実にそれが未来であってほしいとも思いませんが、
00:09:29そのような未来もありえます。しかし同時に、
00:09:32開発者として、
00:09:33ソフトウェアを構築する企業として、
00:09:35高品質なソフトウェア、
00:09:37初日から壊れていないソフトウェア、
00:09:39ひどくないソフトウェアには本当の市場があると思います。そして、
00:09:44より良いソフトウェアを構築するためにAIを使うこともできます。素早く動いてソフトウェアの品質を犠牲にすることを強制する法律はありません。AIを使ってより良いソフトウェアを構築し、
00:09:56両方の世界の最高のものを得て、
00:09:58あなたのスキルとAIを組み合わせ、
00:10:01AIをコードを見てくれる追加の目として使うことができます。そして、
00:10:05私はもっとその方向に進んでいってほしいと思います。なぜなら、
00:10:10おそらく大多数はそうしないでしょうが、
00:10:12高品質なソフトウェアを構築し、
00:10:14両方の世界の最高のものを得ようとする企業や開発者には、
00:10:18価値ある機会が開かれると信じているからです。

Key Takeaway

AIは強力なツールだが、商業的に成功する高品質なソフトウェアを構築するには、完全な自律的コーディングではなく、人間の監督とレビューを組み合わせたエージェント的エンジニアリングアプローチが必要である。

Highlights

CursorのAIが1週間稼働して300万行以上のコードでブラウザを構築したが、「一応動く」レベルに留まっている

80%から100%への最後の仕上げこそがプロジェクトで最も難しい部分であり、AIだけでは到達できない可能性がある

バイブコーディングは個人的ツールや使い捨てソフトウェアには適しているが、商業製品には向いていない

エージェント的エンジニアリングでは、AIをツールとして使い、コードレビューと明確な指示を組み合わせることが重要

AIの時代においても高品質なソフトウェアには市場価値があり、品質を犠牲にする必要はない

ソフトウェア品質の低下傾向はAI以前から存在し、AIによってさらに加速する可能性がある

AIと人間のスキルを組み合わせることで、速度と品質の両方を実現できる

Timeline

CursorのAIブラウザ構築実験の紹介

CursorがGPT 5.2 Codexモデルをリリースしたが、動画の本題はCEOのMichael Truelの投稿についてである。CursorのAIが1週間中断なく稼働し、300万行以上のコードを数千のファイルに渡って書き、ゼロからレンダリングエンジンを持つブラウザを構築した。このブラウザはHTMLパース、CSSカスケードなど基本機能を処理するが、重要な制限として「一応動く」レベルに留まっている。この実験はAIの能力を示す印象的な成果だが、完全な商業製品としての完成度には達していない点が指摘されている。

80%から100%への困難さ - 最後の仕上げの重要性

ブラウザに限らず、あらゆるプロジェクトにおいて80%から100%への最後の仕上げが最も複雑で難しい部分である。人生で何かを作り上げた経験がある人なら、コーディング以外の分野でも、本当に難しい部分は80%完成してから始まることを知っているはずだ。多くのソフトウェアでは100%に到達する必要はないかもしれないが、70%や80%では不十分な場合もある。この追加部分の達成が非常に難しく、AIだけでは到達できない可能性があることが強調されている。マーケティングなどの超難しい部分についてはまだ触れられておらず、純粋に構築の側面だけでもこの困難さが存在する。

AIの活用方法と話者の立場の明確化

話者はAIに対して100%肯定的であり、常にAIを使用していることを強調している。buildmygraphic.comのコードのほとんどはAIによって書かれているが、バイブコーディングではなく、話者の指示に従い、コードレビューを行い、必要に応じて自分で調整を加えている。また、GitHub CopilotとCursorを効率的に使う方法を説明する開発者向けAIコースの大規模アップデートをリリースしたばかりである。話者はAIが開発者にとっての未来であり、非常に有用なツールだと確信しているが、純粋な形でのバイブコーディングがその道筋になるとは確信していない点を明らかにしている。

バイブコーディングの定義と適用範囲

AIを使わない選択肢からエージェント的エンジニアリングまでのスペクトラムが存在し、異なるトレードオフやユースケースがある。話者が定義する100%のバイブコーディングとは、AIにコードを書かせ、コードレビューをせず、コードベースを理解せず、コード固有の指示も渡さないことである。このコーディング形式は商業製品や実際の製品には未来がないと考えられている。しかし、個人的なユーティリティツール、使い捨てソフトウェア、一度か二度使うだけのもの、または無料のソフトウェアなど、エッジケースやバグを気にしない場合には素晴らしい選択肢となる。バイブコーディングはすべてのエッジケースをカバーしているかを気にせず、仕事を成し遂げれば満足できる状況で実行可能である。

エージェント的エンジニアリング - AIをツールとして活用

スペクトラムの反対側にあるエージェント的エンジニアリングは、話者が行っており未来だと考える方法である。これはAIをツールとして使うことを意味し、単純なタスクだけでなく複雑なタスクも含むことができる点が重要である。使いたいパターンやライブラリに関する明確な指示があり、何らかの方法でコードをレビューすることを含む。自動レビューを含むこともできるが、何が起こっているかを理解するために時々コードを見る必要がある。また、AIが行き詰まったときや、特定のインターフェースやパターンを知っている場合に自分でコードに入り、AIが考えを完成させることができるようにする。話者は今年のエージェント的エンジニアリングが少なくとも自分の未来だと考えているが、数年後にはバイブコーディングが唯一の方法になっている可能性も認めている。

Cursorの投稿のコンテキストとマーケティング意図

話者は「kind of works(なんとなく動く)」という表現に問題を感じている。Cursorの投稿のコンテキストを理解しており、Cursorチームが物語をシフトさせたいか、特にXで再び可視性を得たいと思っていることは明らかである。過去数週間、XではClaude codeとRolfループを使ってバイブコーディング的にAIにすべてを構築させる開発者が支配的だった。Cursorチームが、Cursorを使ってもAIで長時間実行するタスクを行い、AIにソフトウェアを自律的に構築させることができることを示したいと思うのは理にかなっている。話者はこれを完全に理解し、Cursorは素晴らしいツールだと明確にしているが、「kind of works」という態度自体に問題を感じている。

ソフトウェア品質低下の歴史的背景とAIによる加速

「kind of works」という態度は加速していると話者は考えており、AIとともにますます問題になってきている。しかし、この問題は何年も前から、AIのずっと前から存在していた。iOSやWindowsのようなオペレーティングシステムがバグだらけになり、初日にプレイ不可能なビデオゲームが登場するなど、ソフトウェア品質の悪化はAIとは関係なく進行してきた。素早く反復でき、すぐに修正できるという考え方がこの15年ほどで発展してきた。AIを使えばもちろん素早く修正できるため、この考え方がAIによって今後も続き、加速していくと見られている。バイブコーディングをしている場合、どうせ一瞬で修正できるためバグについて気にしないかもしれず、人間が入り込む必要がないためコード品質がひどくても問題ないかもしれない。

高品質ソフトウェアの価値と両立の可能性

修正が大量のif文であっても問題ないという未来もありえるが、話者はそれが未来だとは思わないし、そうであってほしいとも思わない。しかし同時に、開発者として、ソフトウェアを構築する企業として、高品質なソフトウェア、初日から壊れていないソフトウェア、ひどくないソフトウェアには本当の市場があると考えている。素早く動いてソフトウェアの品質を犠牲にすることを強制する法律はなく、AIを使ってより良いソフトウェアを構築することができる。両方の世界の最高のものを得て、自分のスキルとAIを組み合わせ、AIをコードを見てくれる追加の目として使うことが可能である。おそらく大多数はそうしないだろうが、高品質なソフトウェアを構築し、両方の世界の最高のものを得ようとする企業や開発者には価値ある機会が開かれると話者は信じている。

Community Posts

View all posts