لوحة نقاش البرمجة للمستقبل

VVercel
컴퓨터/소프트웨어경영/리더십AI/미래기술

Transcript

00:00:00(موسيقى مرحة) - أهلا بكم في جلسة مستقبل البرمجة بالذكاء الاصطناعي.
00:00:04شكرا لك على قراءة المذكرة التي تقول أنه يجب عليك ارتداء ملابس سوداء بالكامل.
00:00:07(ضحك) حسنا، أريد أن أغطي بعض المقدمات.
00:00:12أنا أعرفكم جميعا بطرق مختلفة، لكن ربما الجمهور لا يعرفكم.
00:00:17ماتان، لماذا لا تبدأ أنت؟
00:00:19ما هو موقف فاكتوري في العالم الأوسع للبرمجة بالذكاء الاصطناعي؟
00:00:26- نعم، في فاكتوري، مهمتنا هي جلب الاستقلالية إلى هندسة البرمجيات.
00:00:32وهذا يعني بشكل أكثر تحديدا أننا قمنا ببناء عملاء تطوير برمجيات شاملين يسمون درويدز.
00:00:38إنهم لا يركزون فقط على البرمجة نفسها، بل على كامل دورة حياة تطوير البرمجيات.
00:00:43مثل التوثيق والاختبار والمراجعة، كل الأجزاء المملة بحيث تستطيع أنت فعل الأجزاء الممتعة مثل البرمجة نفسها.
00:00:52وللأجزاء من البرمجة التي لا تريدها، يمكنك أن تطلب من الدرويدز أن يقوموا بها.
00:00:56إذن تقوم ببناء درويدز.
00:00:58تقوم ببناء درويدز.
00:00:59وأوبن إيه آي بطبيعة الحال لا تحتاج إلى مقدمة، لكن دورك في فريق كودكس، رأيتك تظهر في فيديو كودكس.
00:01:08هذا هو كيف عرفت أنك تعمل عليها.
00:01:10لكن كيف تفكر في كودكس في هذه الأيام بعد أن تطورت كثيرا؟
00:01:14- نعم، في وقت سابق من هذا العام، أطلقنا أول وكيل برمجة خاص بنا.
00:01:19عملت على كودكس سي إل آي، وجلبت قوة نماذج التفكير لدينا إلى أجهزة الناس.
00:01:26ثم أطلقنا كودكس كلاود حيث يمكنك توزيع وتفويض تلك المهام للعمل في السحابة.
00:01:31وخلال الأشهر القليلة الماضية، كنا نوحد هذه التجارب.
00:01:34بحيث تعمل بسلاسة قدر الإمكان.
00:01:36لذا تركيزنا الكثير هو حول كيفية جعل الأساسيات، والعناصر الأساسية مفيدة قدر الإمكان.
00:01:41لقد أطلقنا للتو سي دي كي كودكس ديف ديي.
00:01:43أعتقد أن أحد الاتجاهات الرئيسية التي رأيناها هو عدم استخدام وكلاء تنفيذ الكود فقط للبرمجة، بل أيضا للمهام الشاملة.
00:01:52لذا سواء كان محاولة أن تكون الوكيل، الذي عملت عليه في وقت سابق من هذا العام والذي يقوم فعليا بتنفيذ الكود في الخلفية لإنجاز بعض المهام، لكننا بدأنا نمكّن مطورينا من البناء على أساس ليس فقط نماذج التفكير، بل أيضا أشياء مثل البيئات الآمنة وجميع الأشياء الأخرى التي بنيناها في كودكس.
00:02:07- رائع جدا.
00:02:09ف زيرو؟
00:02:10- الهدف من ف زيرو هو تمكين المطورين من القيام ببرمجة وكيل موجهة للمعاينة.
00:02:16لذا اليوم عندما تقوم ببناء تطبيقات ويب، ربما يكون لديك وكيل مفتوح، بيئة تطوير مفتوحة، بعض الأكواد، ومعاينة لما تقوم فعليا ببنائه.
00:02:25عادة ما تقوم بتشغيل خادم التطوير.
00:02:26مع ف زيرو، هدفنا هو السماح لك بمجرد وجود وكيل يعمل والاستجابة المباشرة ضد تطبيقك المعمول به.
00:02:32وهذا هو كيف نعتقد أن مستقبل تجربة المطور سيتطور.
00:02:35- حسنا، رائع جدا.
00:02:36وكل واحد له مساحات سطح مختلفة للوصول إلى وكلاء البرمجة لديك.
00:02:40لذا أعتقد أن أحد الأشياء التي نريد أن نبدأ بها هو مدى أهمية الوصول المحلي مقابل السحابة؟
00:02:45بدأت محليا بالسحابة، بدأت بالسحابة بالمحلي، أنت سحابة فقط في الوقت الحالي.
00:02:50ما هي النسبة؟
00:02:52هل سيقوم الجميع بالاندماج في النهاية؟
00:02:55- نعم، ربما يمكنني أن أبدأ هناك.
00:02:58أعتقد أنه في نهاية اليوم، الهدف من هذه الوكلاء هو أن تكونوا مفيدين قدر الإمكان وأن تكون لديهم صورة ظلية مشابهة جدا لصورة إنسان قد تعمل معه.
00:03:08وأنت لا تملك بشر محليين وبشر بعيدين يعملان بطريقة ما، كما تعرف، هذا واحد يعمل فقط في هذه البيئة، هذا واحد يعمل فقط في تلك البيئة.
00:03:16عموما، البشر يمكنهم أن يكونوا مفيدين سواء كنت في اجتماع معهم وتتوصل إلى فكرة أو كنت تجلس معهم كتفا بكتف على جهاز كمبيوتر.
00:03:24لذا أعتقد أن بشكل مقاربة، هذه تحتاج إلى أن تصبح نفس الشيء، لكنني أعتقد أنه في المدى القصير، البعيد عادة، ما نراه هو أنه عادة ما يكون أكثر فائدة للمهام الأصغر التي تكون أكثر ثقة بأن يمكنك تفويضها بشكل موثوق.
00:03:39بينما المحلي هو عندما تريد أن تكون أقرب قليلا إلى الوكيل، قد تكون مهمة أكبر أو مهمة أكثر تعقيدا ستقوم بمراقبتها بنشاط.
00:03:49وتريدها محليا بحيث لو حدث شيء خاطئ، لا تحتاج إلى سحب هذا الفرع لأسفل ثم البدء بالعمل عليها، بل أنت هناك لتوجيهها.
00:03:57- نعم، ربما أنا جشع فقط، لكنني أريد كليهما.
00:04:00وأعتقد أن وجود طريقة لنقطة ماتان حيث أحب أن أفكر في ما هي الأشكال الأساسية للتعاون التي اعتدت عليها وأستمتع بها مع زملائي.
00:04:11غالبا ما يبدأ ذلك بجلسة على السبورة البيضاء وربما نحن فقط نعمل على شيء ما في غرفة.
00:04:17عندما كنا نقوم ببناء، أعتقد أن مثالا جيدا كان agents.md، وهي تعليماتنا المخصصة التي تقصد أن تكون عامة عبر وكلاء البرمجة المختلفة.
00:04:26الطريقة التي بدأت بها كانت رومان وأنا كنا في غرفة نتوصل إلى هذه الفكرة.
00:04:31ثم بدأنا في رسم على السبورة البيضاء ثم أخذنا صورة ثم بدأنا بها في كودكس سي إل آي محليا، تماما مثل ورشة عمل في تطبيق Next.js الذي يمكننا العمل عليه، ذهبنا لتناول الغداء، وعدنا.
00:04:41كان لديه عدد جيد من البنية الأساسية.
00:04:44ومن هناك، كنا قادرين على التكرار قليلا بطريقة أقرب.
00:04:46لذا وجود هذا النوع من المزاوجة والعصف الذهني.
00:04:49وثم أعتقد أنه لتلك النقطة الثانية حول ما نوع المهام التي تفوض، أعتقد أنه تاريخيا مهام أصغر وذات نطاق محدد حيث أنت واضح جدا بشأن ما هو الناتج، هو نوع من الطريقة الصحيحة إذا كنت تفعل نسيان وإطلاق.
00:05:02لكنني أعتقد أن ما نبدأ في رؤيته مع، لقد أطلقنا كودكس جي بي دي 5 قبل حوالي شهرين.
00:05:08وأعتقد أن أحد الاختلافات الرئيسية هو أنها فعليا يمكن أن تفعل هذه المهام الأطول، والأكثر تعقيدا، والأكثر غموضا، طالما كنت واضحا بشأن ما تريده في النهاية.
00:05:16لذا يمكن أن تعمل لساعات في كل مرة.
00:05:18أعتقد أن هذا التحول كنماذج زيادة في الإمكانيات ستبدأ في تمكين المزيد من حالات الاستخدام.
00:05:24- نعم.
00:05:24نعم، أعتقد أن هناك ثلاثة أجزاء لجعل الوكيل يعمل.
00:05:27هناك حلقة الوكيل الفعلية، وهناك استدعاءات الأدوات التي يقوم بها، ثم الموارد التي تحتاج استدعاءات الأدوات للعمل عليها.
00:05:34ما إذا كنت تذهب السحابة أو المحلي أولا يعتمد على مكان وجود تلك الموارد، أليس كذلك؟
00:05:37إذا كنت تحاول العمل على نظام ملفات محلي، هذه هي الموارد التي تحتاج إلى الوصول إليها.
00:05:41من الواضح تماما أن حلقة الوكيل يجب أن تعمل محليا، أليس كذلك؟
00:05:44إذا كنت تصل إلى موارد توجد عادة في السحابة، فأنت تسحب من GitHub، مباشرة من مستودع طرف ثالث من نوع ما، فمن المنطقي أن يبدأ وكيلك في السحابة، أليس كذلك؟
00:05:54في النهاية، هذه الموارد موجودة في كلا المكانين، أليس كذلك؟
00:05:57كل مطور يتوقع أن يكون الوكيل قادرا على العمل على نظام الملفات المحلي، وكذلك على طلب سحب مفتوح قد يكون مستضافا على GitHub.
00:06:04لذا لا يهم حقا من أين تبدأ، أعتقد أن الجميع يتقاربون في نفس المكان، وهو أن حلقة الوكيل الخاصة بك تحتاج إلى أن تكون قادرة على العمل في أي مكان، استدعاءات الأدوات الخاصة بك تحتاج إلى أن تتمكن من البث من السحابة محليا أو من النسخة الاحتياطية المحلية إلى السحابة.
00:06:16ثم كل شيء يعتمد على مكان وجود الموارد التي تريد فعليا العمل عليها.
00:06:20- نعم، رائع جدا.
00:06:22حسنا، كنا نتحدث خارج المسرح وكنا نحاول إيجاد أسئلة جريئة وأشياء مثل ذلك.
00:06:27لذا أنا فعلا أحب هذا الواحد وأعتقد أنه في غاية الأهمية.
00:06:31هل تقومون بإنتاج كميات من الهراء كحرفة؟
00:06:33هل نحن في خطر من أن نكون ربما في فقاعة إثارة
00:06:40حيث نعتقد أن هذا مثل طريق مستدام للوصول للذكاء العام الاصطناعي؟
00:06:44- أعني، أعتقد أنه للبدء، يمكنك أن تقول أن الهراء لشخص ما هو كنز شخص آخر، وهذا قد يكون صحيحا إلى حد ما.
00:06:52مثل، أنت تعرف، إذا على سبيل المثال، كان لديك، أنا لا أعرف، دعنا نفترض أن كان لديك مستودع لم يكن لديه أي توثيق على الإطلاق.
00:07:00يمكنك استخدام، كما تعرف، الكثير من الأدوات التي كنا نتحدث عنها والذهاب إلى توليد التوثيق لهذا المستودع.
00:07:08الآن، هل سيكون الأكثر مثل، قطعة موثقة بشكل رقيق؟
00:07:13لا، لكن هل يوفر قيمة؟
00:07:16نعم، في رأيي، لأن الاضطرار إلى الغربلة من خلال بعض قواعد الكود القديمة جدا التي لا توثيق لها هو أصعب بكثير من قراءة بعض التوثيق المتساهل.
00:07:26وبالتالي أعتقد أن الشيء الكبير هو اكتشاف حيث يمكنك استخدام هذه الأدوات للاستفادة والدرجة التي تكون فيها هراء، أعتقد أيضا أن تعتمد على مقدار التوجيه الذي تقدمه.
00:07:38لذا إذا قلت مثل، قم ببناء لي تطبيق يفعل هذا، فأنت ربما ستحصل على بعض تطبيق الهراء العام - إنه أرجواني.
00:07:44- نعم، أزرق، أرجواني مثل تلاشى، نعم.
00:07:48بينما بدلا من ذلك أنت مثل منهجي جدا حول بالضبط ما هو أنك تريد، قدمت الأدوات للفعل تشغيل الاختبارات للتحقق من بعض القدرات التي تطلبها.
00:07:58أعتقد أن يجعل ذلك أكثر بنية بدرجة مماثلة كما لو كنت، كما تعرف، توظيف بعض مهندس الصف الأول إلى فريقك ويقول لك، مرحبا، اذهب للقيام بهذا.
00:08:08مثل أنهم ربما ستحصل على نتيجة وسيطة لأن لديهم أي مواصفات أخرى للانطلاق منها.
00:08:14وذلك غامض جدا مثل ما الذي تريد فعليا أن يتم إنجازه.
00:08:19- أعتقد أن الكلمة الرئيسية هناك هي الاستفادة، أليس كذلك؟
00:08:21مثل ما يسمح لك به وكلاء البرمجة بالذكاء الاصطناعي هو فعل 10 مرات أكثر مما كنت ستكون قادرا على فعله بنفسك مع حد أدنى جميل، أليس كذلك؟
00:08:27لذا إذا رسمت مستوى المهارة مقابل مدى فائدة الوكيل أو مدى احتمالية أنه، كما تعرف، مدى فائدته بالفعل في توليد بدون هراء، هناك ربما حد أدنى جميل إذا لم يكن لديك أي مهارة.
00:08:36لديك حد أدنى جميل جدا، أليس كذلك؟
00:08:38الوكلاء جيدون جدا من الصندوق.
00:08:39إذا كنت لا تعرف أي شيء عن التطوير، الوكيل سيفعل أكثر بكثير مما يمكنك أن تفعله.
00:08:44لكن مع ارتفاع مستويات المهارة أعلى وأعلى، مهندسي الدرجة الأولى والمبتكرين والموزعين فعلا يستخدمون الوكلاء بشكل مختلف.
00:08:50إنهم يستخدمونها لرفع مستوى الأشياء التي يمكنهم بالفعل القيام بها.
00:08:53كما تعرف، مهندس رئيسي قد يكون قادرا على كتابة يدويا 5000 سطر من الكود يوميا.
00:08:57مع الوكلاء، يمكنهم كتابة مثل 50000 سطر من الكود يوميا.
00:09:00وذلك يعمل حقا على مستوى جودة المدخلات والمعرفة التي تضعها هناك.
00:09:04لذا أعتقد أننا، كما تعرف، ببطء رفع الحد الأدنى بمرور الوقت بواسطة، كما تعرف، بناء وكلاء أفضل.
00:09:11لكنني أعتقد أنها شكل من أشكال الاستفادة.
00:09:14إنها طريقة لك لتسريع أنواع الأشياء التي يمكنك بالفعل القيام بها، افعلها أسرع.
00:09:18وللأشخاص الذين لا يملكون مهارات، كما تعرف، هذا هو عندما يمكنك فعليا رفع حد الإمكانية.
00:09:23- بالتأكيد، وفقط لإضافة إلى كل من هذه النقاط، أعتقد أنها أدوات وأضخم الحرف.
00:09:29إذا كان لديك واحد، يمكنك فعل المزيد منه.
00:09:31إذا لم يكن لديك، يكون الأمر أصعب فقط، لكنه يرفع الحد الأدنى.
00:09:34أعتقد أن من المهم جدا الإشارة إلى ذلك.
00:09:36أعتقد أنه بالنسبة للأشخاص الذين يحاولون بناء نموذج أولي أول، يحاولون تكرار فكرة أن المثال كان يشير إليه في وقت سابق.
00:09:44لا يقتصر الأمر على أنني لم أستطع قم ببناء واجهة أمامية نوعا ما مثل الموقع المدفوع بالمحتوى، لكنني لم يكن لدي الوقت.
00:09:51وكان من الأكثر متعة فقط رسم على لوح أبيض، التحدث، إجراء محادثة، ثم إطلاقها إلى وكيل.
00:09:57لكنني أعتقد أن أحد الأمثلة المثيرة للاهتمام لهذا كان عندما كنا نقوم ببناء التكرارات السابقة بكثير من كودكس وقبل سنة كاملة أو أكثر.
00:10:03وكنا نضع أمام نماذج أصلية مختلفة، الأشخاص الذين قاموا بالكثير من هندسة المنتج حيث اعتادوا على استخدام أدوات النمط الحلقي المحلي حيث اعتادوا على مجرد الدردشة وربما التكرار.
00:10:19وثم طريقة مختلفة تماما عندما نتحدث مع الأشخاص على فرق التفكير حيث كانوا سيجلسون ربما خمس دقائق فقط تحديد المهمة وعضلي عصرا، مثل مشكلة كلمة طول المقال للوكيل للذهاب والقيام بها، ثم سيعمل لمدة ساعة.
00:10:33وكان هذا فعليا 01 أو إصدارات سابقة من ذلك.
00:10:37وأعتقد أن الجزء المثير للاهتمام هناك كان فقط الطريقة التي سيقترب بها الناس من إعطاء المهمة للوكيل كانت مختلفة تماما بناء على فهمهم لما يعتقدون أنها تحتاج.
00:10:48وبالتالي أعتقد أن الارتساء حقا على التفصيل، كن واضحا جدا بشأن ما تريده أن يكون الناتج.
00:10:55وأعتقد أن هناك عنصر أوسع وهو مسؤولية لكل من الآن كمنشئي الوكلاء والأشخاص الذين يقومون بتدريب النماذج لحقا رفع ذلك الحد الأدنى وللتأكد من أن السقف للأشخاص الذين لديهم حرفة عالية، مع ذوق عالي قادرون على ممارسة ذلك بالطريقة التي يرونها مناسبة.
00:11:11- أعتقد فعلا شيء أن ذكرت جلب هذه الفكرة إلى الذهن التي بدأنا نلاحظ.
00:11:16لذا جمهورنا المستهدف هو المشروع.
00:11:19وشيء واحد شهدناه مرات متعددة وهو أن هناك اثنان مثير جدا في المقابل من حيث اعتماد التطوير الأصلي الوكيل.
00:11:28وعلى وجه الخصوص، عادة ما يكون المطورون في وقت سابق من حياتهم أكثر انفتاح الذهن لبدء البناء بطريقة أصلية الوكيل، لكنهم لا يملكون خبرة في إدارة فرق الهندسة.
00:11:39لذا ربما لا يكونون على دراية بالتفويض بطريقة تعمل بشكل جيد جدا.
00:11:44وفي الوقت نفسه، المهندسون الأكثر خبرة لديهم الكثير من الخبرة في التفويض.
00:11:47يعرفون أن، مرحبا، إذا لم أحدد هذه الأشياء بالضبط، فلن يتم إنجازها.
00:11:51وبالتالي هم حقا جيدون في مثل كتابة هذه الفقرة، لكنهم عنيدون جدا وفعليا لا يريدون تغيير الطريقة التي يقومون بها والبناء وستضطر إلى خلع Emacs من أيديهم الباردة الميتة.
00:12:03لذا إنها توازن مثير للاهتمام هناك.
00:12:05- لذا مضحك أنك تقول ذلك.
00:12:06شيء مماثل رأيناه على المشروع هو المهندسون الأكبر سنا، الناس الأعلى سيكتبون تذاكر.
00:12:12لذا هم سيفعلون فعليا العمل من كتابة كل مواصفات ما يجب القيام به.
00:12:16سيسلمونها إلى مهندس صغير للقيام به فعليا.
00:12:18المهندس الصغير يأخذ تذكرة مكتوبة بشكل رائع جدا ويعطيها للوكيل للقيام بها، أليس كذلك؟
00:12:21لذا أنت فقط كنت تحكيم فكرة أن المهندس الصغير سيفعل فعليا عمل الوكيل لأنهم أكثر راحة في القيام بذلك.
00:12:28لكن المهندس الكبير هو الشخص الذي حقا جيد في كتابة المواصفات، جيد جدا في فهم ما هي القرارات المعمارية التي يجب أن نتخذها وضعها في نوع من التذكرة.
00:12:37- نعم، بالنسبة لمن لا يعرفون، Matan والمصنع بشكل عام كانوا يكتبون ويوصون بشأن عصر التطوير الأصلي.
00:12:44لذا يمكنك قراءة المزيد على موقعهم.
00:12:45أعتقد أن شيء واحد، بالمناسبة، أريد أن أصدر ربما مثل شيء واحد في المصطلحات، وهو رفع الحد الأدنى بالنسبة لك هو شيء جيد.
00:12:54أعتقد فعليا أن الناس الآخرين يقولون أيضا تخفيض الحد الأدنى يعني نفس الشيء.
00:12:57أساسا فقط مثل إنها حول مستوى المهارة وما يمكنهم القيام به وفقط إعطاء الناس المزيد من الموارد لذلك.
00:13:05أعتقد أيضا أن الشيء الآخر هو مثل، الكثير من الناس يفكرون في طبقة النموذج، أليس كذلك؟
00:13:13بوضوح أنتم تملكون نماذجك الخاصة، كلاكما لا تفعلان.
00:13:18وأعتقد أن هناك موضوع ساخن للمحادثة في القيمة الآن.
00:13:22Airbnb، قال بريان تشيسكي أن معظم القيمة مثل تعتمد على Quinn ظاهرا.
00:13:28ما مدى أهمية النماذج المفتوحة لك جميعا ويمكن أن، لما يمكنك أن تدلي به أيضا، لكن ما مدى أهمية النماذج المفتوحة كاستراتيجية لكل من كم؟
00:13:37- أود أن أسمع منك أولا.
00:13:38- نعم.
00:13:38حسنا، أحب النماذج المفتوحة.
00:13:42أعتقد أن أحد الأشياء المهمة حول، فقط كونك قادرا على التحدث عن النماذج، أعتقد أن الانفتاح مهم حقا لأعتقد أن دورة حياة تطوير مستدامة حيث مع Codex CLI، نحن فتحنا المصدر عند البوابة والجزء من الأولوية كان فهم أن نموذج مفتوح كان سيأتي إلى أسفل الخط.
00:13:58أردنا أن نتأكد من أننا يمكن أن تفضل توثيق كيفية استخدام نماذج التفكير لدينا.
00:14:03رأينا الكثير من نوع البلبلة حول، ما نوع الأدوات للعطاء، ما ينبغي أن تكون البيئة، الموارد.
00:14:08وبالتالي أردنا أن نتأكد من أن كان واضحا قدر الإمكان وبعد ذلك أيضا تأكد من أنها عملت بشكل جيد مع النماذج المفتوحة.
00:14:12لذا أعتقد أن هناك بالتأكيد الكثير من حالات الاستخدام، خاصة عندما تدخل نوع حالات الاستخدام المدمجة أو حيث لا تريد البيانات لمغادرة محيط.
00:14:23هناك الكثير من الأسباب الجيدة لماذا قد تريد القيام بذلك.
00:14:26وبعد ذلك أعتقد أن فائدة نوع من النماذج المستضافة بالسحابة، وهذا ما نراه مع الكثير من النماذج المفتوحة.
00:14:33ينتهي بهم في النهاية، ليس تشغيلهم على جهاز، لكن هم في الواقع يتم استضافتهم على السحابة على أي حال، ربما من أجل الكفاءة، ربما من أجل التكلفة، أن هناك لا تزال الكثير من القيمة في فقط الذكاء النقي الذي تحصل عليه من استخدام نموذج أكبر بكثير.
00:14:46وهذا هو السبب الذي نراه الناس حقا تنجذب نحو النماذج من O3 إلى GBD5 إلى GBD5 Codex.
00:14:52لا تزال هناك الكثير من القيمة في ذلك.
00:14:53الآن نرى أن هذا الإرهاق لا يزال نوعا ما يأتي، حل نفسه حيث كل زوجين من الأشهر هناك نموذج جديد، صغير جدا، جدا جدا رائع.
00:15:04وأعتقد أن السحر إذا اعتبرنا فقط في بداية هذا العام، كان لدينا O3 mini نوع من الحدود وحيث نحن الآن.
00:15:10ولذا، نعم، أعتقد أن هناك طن من القيمة في النماذج المفتوحة، لكن لا تزال، أعتقد أنه شخصيا، من منظور الاستخدام، أكثر قيمة في استخدام نوع من النماذج المستضافة بالسحابة.
00:15:21- نعم، سأقاطع قليلا.
00:15:23فورد بالفعل يهتم كثيرا بالخصوصية والأمان وقوة الوكيل.
00:15:27وبالتالي إذا واجهته، تحدث معه أكثر حول ذلك.
00:15:30لكن بالنسبة لكل من كم، ربما تريد أن تبدأ قبل، ما يا هو الكروة من نسبة رمز نموذج مفتوح يتم إنشاؤها في تطبيقاتك الخاصة؟
00:15:39وهل سيرتفع أم ينخفض؟
00:15:42- لذا أعتقد، لذا ربما للبدء، لأنني أعتقد أن ما قلته هو مثير جدا للاهتمام.
00:15:47لذا قبل بضعة أسابيع، عندما أطلقنا أداة واجهة سطر الأوامر الخاصة بنا بالمصنع، كان الناس مهتمين حقا لأننا أطلقنا أيضا معها درجتنا على هذا المقياس يسمى Terminal Bench.
00:15:57وكان أحد أول الطلبات، هل يمكنكم وضع نماذج مفتوحة المصدر على الاختبار؟
00:16:02لأن وكيل الدرويد لدينا بالكامل وكيل محايد نموذج.
00:16:04لذا حالا الناس مثل، إلقاء في النماذج مفتوحة المصدر والاطلاع على كيف يفعل.
00:16:09وأعتقد أن شيء واحد كان مثير للدهشة بشكل خاص كان أن نماذج مفتوحة المصدر، وعلى وجه الخصوص GLM، كانت حقا، حقا جيدة.
00:16:17كانوا في الواقع بوضوح أقل أداء من نماذج الحدود، لكن ليس بهامش ضخم.
00:16:24أعتقد، لذا شيء واحد كان جدير بالملاحظة رغم ذلك عندما قمنا بقياس نماذج مفتوحة المصدر، من بين سبعة كانوا في الأعلى، واحد من هم قد تم بواسطة في الولايات المتحدة من قبل أنت نفسك هنا، والتي أعتقد أنها نوع من خجل.
00:16:37مثل حقيقة أن بعيد من نماذج الحدود، هو الولايات المتحدة عبر المجلس.
00:16:43لكن ثم عندما يأتي الأمر إلى مفتوح المصدر، نحن فعلا إسقاط الكرة هناك.
00:16:47لذا أعتقد أن هذا شيء واحد جدير بالملاحظة وأعتقد شيء، على الأقل عندما رأيت ذلك، أنا حقا أعتقد أن هناك يجب أن يكون مثل استدعاء إلى الأسلحة هناك في شروط تغيير ذلك.
00:16:56لأنني أعتقد أنه للإجابة على سؤالك، ما الذي وجدناه هو أنه منذ أطلقنا دعم نماذج مفتوحة المصدر، فإن نسبة الأشخاص الذين يستخدمون نماذج مفتوحة المصدر قد ارتفعت بشكل كبير.
00:17:08جزئيا بسبب التكلفة وأنه، كما تعرف، يسمح لك مثل، دعنا نقول في مثال التوثيق، ربما تريد إنشاء الوثائق، لكنك لا تريد أن تكون مثل، كما تعرف، بناء التفكير العالي جدا، مثل الحد الأقصى، مثل تكلفك ألف دولار، لكنك فقط تريد الحصول على مثل بعض الممر الأول الأولي.
00:17:24وأيضا الناس يحبون وجود تحكم أكثر قليلا.
00:17:28وأشعر بأنهم يحصلون على الكثير أكثر من هذا التحكم مع بعض هذه النماذج مفتوحة المصدر، كل من التحكم والتكلفة وفقط مثل نوع من الملاحظة في ما يحدث فعليا هناك.
00:17:39لذا أعتقد أن الطلب قد نما إلى نقطة حيث أنا بالفعل لم أتوقع منذ سنة واحدة.
00:17:43أعتقد أنه منذ سنة واحدة، كنت أقل متفائل على نماذج مفتوحة المصدر من أنا الآن، مفتوح الوزن، لكن نعم.
00:17:49- نعم، أعتقد أننا نستخدم كلا النماذج مفتوحة المصدر والمصدر المغلق في خط أنابيبنا الوكيل الشامل.
00:17:55وأعتقد أن الطريقة التي نفكر بها حولهم هي أن هناك حالتي استخدام مختلفة لاستدعاء LLM.
00:17:58واحد هو تريد التفكير على أحدث طراز.
00:18:01إنها سؤال مفتوح جدا جدا.
00:18:02أنت بالفعل لا تعرف ما هي الإجابة.
00:18:04والهدف هو مثل، وظيفة الهدف ليست محددة جدا.
00:18:07في تلك الحالات، النماذج المصدر المغلق لا تزال أحدث طراز عندما يتعلق الأمر بالتفكير والذكاء.
00:18:13نستخدم النماذج المصدر المغلق تقريبا حصرا لأنواع هذه حالات الاستخدام.
00:18:16هناك حالة استخدام ثانية حيث لدينا مهمة متخصصة أكثر مع وظيفة هدف أوضح بكثير.
00:18:22في تلك الحالات، نحاول دائما تقريبا ضبط نموذج مفتوح المصدر.
00:18:26نحن بخير أخذ قطع 20 في المئة ربما من حيث القدرة على التفكير بحيث يمكننا فعليا ضبط حالة استخدام محددة جدا جدا.
00:18:35وأعتقد أننا وجدنا أن نماذج المصدر المفتوح تتطور بسرعة كبيرة جداً.
00:18:39قبل سنة ونصف، كان من المستحيل بالنسبة لنا استخدام نماذج المصدر المفتوح كجزء من نظام v0.
00:18:45اليوم، في كل جزء من النظام، نسأل أنفسنا: هل يمكننا دمج نماذج المصدر المفتوح هنا؟
00:18:49هل يمكننا استبدال ما نستخدمه حالياً من نماذج حدودية مغلقة المصدر برضيع نموذج مصدر مفتوح؟
00:18:57وقد حققنا نجاحاً كبيراً مع Qwen و Qwen-K2 وغيرها من النماذج المشابهة.
00:19:02نعم، سأشير إلى هذا باعتباره أحد أكبر التغييرات التي لاحظتها عند الجميع.
00:19:07في بداية هذا العام، أجريت بودكاست مع أنكور من BrainTrust، وقال إن استخدام النماذج مفتوحة المصدر يبلغ حوالي 5% فقط مما تراه BrainTrust، وينخفض..
00:19:17والآن أعتقد أن الأمر سيصل بشكل معقول إلى ما بين 10 إلى 20% للجميع.
00:19:22أعتقد أنه من المثير للاهتمام أن حتى النماذج مغلقة المصدر تستثمر بشكل أكبر في فئة النماذج الصغيرة.
00:19:29مثل Haikus و GPT-5 Mini و Gemini Flash، وهذه الفئة هي التي تنافس نماذج المصدر المفتوح بشكل أكبر.
00:19:38إنها فئة النماذج الصغيرة التي تنافس رضيع نموذج المصدر المفتوح.
00:19:42وأعتقد أيضاً أن هناك حالات استخدام يكون فيها من المبالغة جداً استخدام نموذج حدودي، وإذا كان الأمر كذلك، فستكون مجبراً بطبيعة الحال على استخدام شيء أسرع وأرخص.
00:19:53وأعتقد أن جزءاً من هذا التغيير في نسبة الاستخدام هو وجود عتبة تعبر عندها النماذج المفتوحة الحد الذي يصبح فيه كافياً لمعظم المهام، ثم هناك مهام متخصصة تحتاج قوة إضافية.
00:20:10أعتقد أننا نقترب من هذه النقطة مع بعض هذه النماذج المفتوحة، وهذا هو السبب في أنني أتوقع أن نرى المزيد من الاستخدام في المستقبل.
00:20:16نعم، هذا مشجع جداً.
00:20:18لدينا بعض الوقت المتبقي قبل السؤال الختامي، وهو: ما الذي لا تستطيع وكلاؤك فعله اليوم والذي تتمنى أن يتمكنوا من فعله، والذي سيفعلونه على الأرجح العام القادم؟
00:20:27هل أبدأ أنا أولاً؟
00:20:31حسناً.
00:20:32أعتقد أنه على مدى العام الماضي، بدءاً من مرجع مثل o1 قبل سنة قليلة، أو معاينة o1، ما رأيناه حينها، عندما كنت أستخدم نقاط تفتيش مبكرة جداً من هذا النموذج، كان رائعاً مقارنة بـ GPT-4، لكن كان لا يزال ينقصه الكثير.
00:20:51لم أكن لأسند هذا النوع من المهام إليه.
00:20:53كنت في فريق الأمان في ذلك الوقت، وكان هناك الكثير من العمل والمهام التي ببساطة لم أتمكن من تفويضها إلى هذا النموذج..
00:21:00وعندما نقارنها بالوضع اليوم، حيث يمكنني أن آخذ مهمة محددة بشكل جيد، ربما جملتان أو بضعة نقاط، كما قلت، مثل: إليك الأشياء التي أعتقد أنك ستواجه مشاكل فيها، وبعد 30 دقيقة أو ساعة، تكون قد أكملتها.
00:21:14رأينا حالات حيث تعمل لساعات طويلة، ربما حتى سبع أو ثماني ساعات، أي يوم عمل كامل.
00:21:20أقضي الكثير من يومي في الاجتماعات، لذا ليس لدي بالضرورة كتلة من الوقت المتواصل..
00:21:26لكن هذا هو نصف ما يتعلق به الهندسة الفعلية فقط.
00:21:30جزء منه هو البرمجة، وجزء آخر هو العمارة والاستكشاف والتصحيح.
00:21:34النصف الآخر من المشكلة هو كتابة التوثيق وفهم النظام وإقناع الناس.
00:21:39لذا أعتقد أننا سنبدأ في رؤية متعاون خارق، حيث نريد جلب سواء في Codex أو هذه الواجهات الأخرى من خلال نموذج Codex، المتعاون المثالي الذي تريد العمل معه.
00:21:53الشخص الذي تذهب إليه أولاً، زميل العمل المفضل لديك الذي تريد العمل معه على تطوير الأفكار، هذا هو ما نريد رؤيته، على الأقل مع Codex.
00:22:02بالنسبة لنا، رأينا الكثير من التطور السريع على جبهتين مختلفتين.
00:22:07الأولى هي: كم عدد الخطوات التي يمكنك بشكل معقول أن تتوقع من وكيل القيام بها والحصول على مخرجات جيدة؟
00:22:14العام الماضي، ربما كان هناك خطوة واحدة، ثلاث على الأكثر، أليس كذلك؟
00:22:17إذا كنت تريد مخرجات موثوقة بنسبة نجاح تزيد على 90%، فأنت غالباً تشغل خطوة إلى ثلاث خطوات وكيل.
00:22:22اليوم، معظم الأدوات تعمل بخمس إلى 20 خطوة دون معدلات موثوقية رائعة حقاً، بنسبة نجاح تزيد على 90%.
00:22:29أعتقد أنه في العام القادم، سنضيف مثل 100 أو 200 أو أكثر، دعونا نشغل الكثير من الخطوات دفعة واحدة، مهام طويلة الأمد لساعات متعددة ونكون واثقين من أنك ستحصل على مخرجات في النهاية تكون مفيدة.
00:22:40الثانية هي فيما يتعلق بالموارد التي يمكن استهلاكها.
00:22:42قبل سنة، كان كل ما تضعه في نموذج الطلب، وهذا كان تقريباً كل شيء.
00:22:47اليوم، يمكنك الآن تكوين الاتصالات الخارجية عبر MCP أو بإجراء استدعاءات API مباشرة في تطبيقك.
00:22:55يمكنك القيام بذلك إذا كان لديك المعرفة والقدرة على تكوين الأشياء.
00:22:58وأعتقد أنه في السنة القادمة، ستحدث هذه الأشياء ببساطة.
00:23:00سيعمل بكل بساطة.
00:23:02الهدف هو أنه لا يجب أن تعرف ما هي مصادر السياق التي تحتاج إلى تقديمها للوكيل.
00:23:06الوكيل سيذهب فعلياً ويجد تلك المصادر السياق بشكل استباقي.
00:23:09نحن بدأنا نرى هذا بالفعل اليوم، لكنني لا أزال لست واثقاً حقاً من أنه موثوق ومفيد اليوم.
00:23:16أعتقد أنه بحلول العام القادم، ستكون هذه هي الوضع الافتراضي.
00:23:18نعم، أتفق مع ذلك.
00:23:19أعتقد أن الوكلاء يمكنهم القيام بكل شيء أساساً اليوم، لكن الدرجة التي يفعلونها بموثوقية واستباقية هي ما أعتقد أنه سيتغير.
00:23:29لكن هذا أيضاً يعتمد على المستخدم.
00:23:31إذا كنت مستخدماً لا تغير سلوكك حقاً وتقابل الوكيل حيث يكون، فقد تحصل على موثوقية واستباقية أقل.
00:23:38بينما إذا قمت بإعداد جهازك بشكل صحيح أو إعداد بيئتك بشكل صحيح، فسيكون قادراً على فعل المزيد من ذلك بموثوقية وبشكل أكثر استباقية.
00:23:45نعم، مذهل.
00:23:46حسناً، انتهى الوقت.
00:23:48مساهمتي هي رؤية الحاسوب.
00:23:49جرب الجميع Atlas.
00:23:51جرب المزيد من حالات استخدام رؤية الحاسوب، لكن شكراً جزيلاً على وقتك.
00:23:55شكراً لك.
00:23:56(تصفيق الجمهور) (موسيقى حيوية)

Key Takeaway

وكلاء البرمجة بالذكاء الاصطناعي تحول عملية التطوير من خلال تمكين المهندسين من التركيز على الأفكار والقرارات المعمارية بينما الوكلاء تنفذ المهام المحددة بوضوح بموثوقية متزايدة.

Highlights

وكلاء البرمجة بالذكاء الاصطناعي تقوم بأتمتة دورة حياة تطوير البرمجيات كاملة بما فيها التوثيق والاختبار والمراجعة والبرمجة نفسها

الوصول المحلي والسحابي متكاملان حيث يعتمد الاختيار على مكان وجود الموارد والمهام المراد تنفيذها وأسلوب التطوير المفضل

النماذج المفتوحة المصدر تشهد نمواً ملحوظاً في الاستخدام بنسبة تتراوح بين 10-20% بسبب التكلفة والتحكم والخصوصية

جودة المخرجات تعتمد بشكل كبير على وضوح التعليمات والمواصفات المقدمة وليس فقط على قدرات النموذج ذاته

المهندسون الخبراء أفضل في كتابة المواصفات التفصيلية بينما الوكلاء أفضل في تنفيذ المهام المحددة بوضوح

الوكلاء قادرة على تنفيذ مهام معقدة تتطلب عشرات الخطوات وتستغرق ساعات بموثوقية عالية تزيد على 90%

المستقبل يتجه نحو وكلاء متعاونة استباقية قادرة على البحث عن المصادر والسياق تلقائياً دون تدخل المستخدم

Timeline

مقدمة الجلسة والضيوف

تبدأ الجلسة بترحيب من المضيف عن جلسة مستقبل البرمجة بالذكاء الاصطناعي مع ملاحظة طريفة حول اللباس الأسود. يتم تقديم فريق النقاش والتحضير للحديث عن دور الذكاء الاصطناعي في تطوير البرمجيات. الجو خفيف وودود مع ضحك من الجمهور. هذا يعكس محاولة المضيف لإنشاء أجواء طبيعية وممتعة للجلسة.

دور الوكلاء الشاملة في هندسة البرمجيات

يشرح ماتان من Factory مهمتهم في جلب الاستقلالية إلى هندسة البرمجيات من خلال بناء وكلاء تطوير برمجيات شاملة تسمى Droids. توضح أن هذه الوكلاء لا تركز فقط على البرمجة نفسها بل على كامل دورة حياة التطوير بما فيها التوثيق والاختبار والمراجعة والعمليات المملة الأخرى. الهدف هو تمكين المهندسين من التركيز على الأجزاء الممتعة والإبداعية من البرمجة. يناقش المضيف بعدها تطور Codex من OpenAI ودوره المتعاظم كوكيل برمجة شامل.

تطور أدوات Codex ومنصات التطوير

يستعرض الضيف من OpenAI التطور السريع لأدوات Codex خلال العام بما فيها Codex CLI وCodex Cloud وإطلاق الأخير لـ CDK Codex Dev DIY. يشدد على الاتجاه الرئيسي حول استخدام وكلاء تنفيذ الكود ليس فقط للبرمجة بل للمهام الشاملة. يتحدث عن تمكين المطورين من البناء على أساس نماذج التفكير والبيئات الآمنة وجميع المكونات المدمجة في Codex. يؤكد على أهمية الوصول إلى أدوات عملية موثوقة تعمل بسلاسة.

V0 وتجربة المطور الموجهة للمعاينة

يشرح V0 من Vercel كمنصة موجهة لتمكين المطورين من برمجة وكيل مع معاينة فورية للنتائج. بدلاً من الاضطرار لتشغيل خادم تطوير منفصل، يسمح V0 للوكيل بالعمل والاستجابة مباشرة ضد التطبيق المعمول به. يعتقد الفريق أن هذا هو اتجاه تطور تجربة المطور في المستقبل حيث تكون الملاحظة والتفاعل الفوري جزء أساسي من العملية. يؤكد على أهمية جعل الأساسيات والعناصر الأساسية مفيدة قدر الإمكان.

المحلي مقابل السحابة: التوازن والاستراتيجية

يناقش الفريق الفرق بين الوصول المحلي والسحابي للوكلاء ويؤكدان أن الهدف هو جعل الوكلاء مفيدة بنفس الطريقة التي يمكن للمتعاون البشري أن يكون فيها. يشرحان أن الاختيار يعتمد على مكان وجود الموارد والمهام: الموارد المحلية تحتاج وكيل محلي بينما الموارد السحابية (مثل GitHub) تصلح مع وكيل سحابي. يناقشان المثال العملي لـ agents.md حيث بدأ المشروع برسم على السبورة البيضاء ثم تطوير باستخدام Codex محلياً. يشددان على أهمية العصف الذهني والتعاون الوثيق عند استخدام الوكلاء للمهام المعقدة.

مسألة جودة المخرجات والهراء المفيد

يناقش الفريق السؤال المهم عما إذا كانت الوكلاء تنتج كميات من الهراء وما إذا كان هناك خطر من فقاعة إثارة. يشرح أن قيمة المخرجات تعتمد على السياق والاستخدام وأن ما يعتبره البعض هراء قد يكون كنزاً للآخرين. يقدم مثال التوثيق حيث الوثائق التقريبية أفضل من عدم وجود توثيق على الإطلاق. يؤكدان أن جودة المخرجات تعتمد بشكل كبير على وضوح التعليمات والمواصفات المقدمة من المستخدم. يشبهان ذلك بتوظيف مهندس جديد حيث التعليمات الغامضة تؤدي لنتائج وسيطة.

الاستفادة من الوكلاء: الحد الأدنى والحد الأقصى

يوضح الفريق أن الكلمة الرئيسية هي الاستفادة: الوكلاء تسمح لك بفعل 10 مرات أكثر مما تستطيع فعله بنفسك مع حد أدنى جميل. يناقشان أنه عند رسم مستوى المهارة مقابل فائدة الوكيل، هناك حد أدنى جميل للأشخاص بدون خبرة حيث الوكلاء جيدة جداً من البداية. لكن مع ارتفاع مستويات المهارة، يستخدم المهندسون الخبراء الوكلاء بطريقة مختلفة تماماً لرفع مستوى ما يمكنهم بالفعل فعله. يشرحان أن مهندس رئيسي قد يكتب 50000 سطر كود يومياً مع الوكلاء بدلاً من 5000 يدوياً. الهدف الأساسي هو رفع الحد الأدنى تدريجياً بمرور الوقت من خلال بناء وكلاء أفضل.

اتجاهات التبني والفروقات بين المجموعات

يناقش الفريق ملاحظات مثيرة حول اتجاهات التبني للوكلاء في سوق العمل. يشير إلى وجود انقسام مثير بين المجموعات: المطورون الأصغر سناً وفي بداية حياتهم المهنية أكثر انفتاح الذهن لاستخدام الوكلاء لكنهم يفتقرون خبرة التفويض، بينما المهندسون الخبراء يعرفون كيفية التفويض بفعالية لكنهم عنيدون حول تغيير طرقهم. يشرحان ديناميكية مثيرة أخرى في الشركات حيث المهندسون الكبار يكتبون المواصفات التفصيلية ويسلمونها للمهندسين الصغار الذين بدورهم يعطونها للوكلاء. يؤكدان على أهمية وضوح التفاصيل والمسؤولية المشتركة بين منشئي الوكلاء والقائمين على تطوير النماذج لرفع الحد الأدنى والسقف.

النماذج المفتوحة المصدر مقابل المغلقة

يناقش الفريق أهمية النماذج المفتوحة المصدر واستراتيجية استخدامها. يشدد على أن الانفتاح مهم للحفاظ على دورة حياة تطوير مستدامة حيث أطلقت OpenAI أدواتها بمصدر مفتوح. يناقش الفريق من Factory تقريرهم على مقياس Terminal Bench حيث وجدوا أن النماذج مفتوحة المصدر مثل GLM كانت جيدة بشكل مفاجئ وليس بهامش ضخم أقل من نماذج الحدود. يشير إلى أن استخدام النماذج مفتوحة المصدر ارتفع بشكل كبير منذ إطلاق الدعم لها، جزئياً بسبب التكلفة والتحكم والخصوصية. يشير إلى أنه منذ سنة كان أقل تفاؤلاً بشأن النماذج مفتوحة المصدر لكنه الآن أكثر تفاؤلاً بسبب التطور السريع.

استخدام النماذج المفتوحة والمغلقة في الممارسة

يشرح الفريق من Vercel كيف يستخدمون النماذج المفتوحة والمغلقة المصدر معاً في خط أنابيبهم الشامل. هناك حالتا استخدام مختلفة: الأولى تتطلب تفكير متقدم لأسئلة مفتوحة جداً حيث النماذج المغلقة لا تزال أفضل، والثانية مهام متخصصة بوظيفة هدف واضحة حيث يضبطون نماذج مفتوحة المصدر. يشددان أنهم يقبلون قطعاً بنسبة 20% من قدرات التفكير مقابل القدرة على ضبط حالة استخدام متخصصة جداً. النماذج المفتوحة تتطور بسرعة كبيرة: قبل سنة ونصف كان من المستحيل استخدامها في v0، اليوم يسألون أنفسهم هل يمكنهم استبدال نماذج مغلقة بنماذج مفتوحة في كل جزء من النظام. يشير إلى نجاح كبير مع نماذج مثل Qwen و Qwen-K2 والتطور السريع المتوقع.

توقعات المستقبل والقدرات المطلوبة

يناقش الفريق ما لا تستطيع الوكلاء فعله اليوم والذي يتمنون أن تتمكن منه العام القادم. يشير إلى رؤيتهم لوكيل متعاون خارق يعمل كزميل العمل المفضل الذي تذهب إليه أولاً للبحث والتطوير. يتوقع رؤية تطور سريع على جبهتين: أولاً، عدد الخطوات التي يمكن للوكيل تنفيذها بموثوقية عالية (90% فأكثر) سيرتفع من 1-3 خطوات اليوم إلى 100-200 خطوة وربما أكثر، مما يسمح بمهام طويلة الأمد تستغرق ساعات. ثانياً، استهلاك الموارد والوصول إلى المصادر الخارجية سيصبح سلساً حيث الوكلاء ستبحث عن السياق استباقياً دون تدخل المستخدم. يختتم بملاحظة أن موثوقية واستباقية الوكلاء تعتمد أيضاً على كيف يعد المستخدم بيئته بشكل صحيح.

Community Posts

View all posts