نحن بأمان - جوجل لديها مهمة مختلفة

MMaximilian Schwarzmüller
컴퓨터/소프트웨어구직/면접AI/미래기술

Transcript

00:00:00مع إطلاق Gemini 3، انتهى الأمر بالنسبة للمطورين، خاصةً مطوري الواجهات الأمامية للويب.
00:00:07هذا نوع الشعور الذي قد تحصل عليه إذا قضيت أي وقت على منصة X، وهذا ربما ليس فكرة جيدة، لكن هذه قصة أخرى.
00:00:15الآن، هذه صفحة هبوط فعلية حاولت برمجتها بواسطة Gemini، ونعم، تبدو سيئة بهذا الشكل فعلاً وسأعود إليها لأريكم الأمر الذي استخدمته.
00:00:25على أي حال، حتى لو حصلت فقط على هذه النتيجة الرهيبة، من الواضح أنك على منصة X سترى الكثير من المنشورات التي تشارك صفحات هبوط مذهلة وتصورات بصرية ونماذج ثلاثية الأبعاد وأي شيء متعلق بذلك تم برمجته بواسطة Gemini ويبدو أنه يقوم بعمل رائع في ذلك، رغم أنني حصلت على نتيجة سيئة نسبياً.
00:00:48ربما المشكلة مني وحدي، لكنني كنت أعتقد أن البرمجة المرئية تعني أنك لا تحتاج إلى معرفة أي شيء، لكن مرة أخرى سأعود لذلك.
00:00:58الآن، جوجل نفسها عندما قدمت Gemini 3، وضعته بوضوح كنموذج للبرمجة المرئية أو نموذج يتفوق في البرمجة المرئية.
00:01:07إنها حرفياً النقطة الثالثة في منشور الإعلان الرسمي على X.
00:01:11السؤال هو، لماذا يُفترض أن Gemini 3 جيد جداً لدرجة أنك لم تعد بحاجة حتى لمعرفة كيفية البرمجة؟ هل هو ليس نموذجاً للمطورين الحقيقيين؟ أم أنه حقاً مخصص لاستبدالنا لأنه أفضل بكثير؟ الأمر أكثر تعقيداً من ذلك قليلاً.
00:01:29الآن، دعونا نلقي نظرة على منشور المدونة الرسمي للإعلان على موقع جوجل.
00:01:34في ذلك المنشور، في القسم الثاني تماماً، نرى مرة أخرى جزء البرمجة المرئية، حيث يسلطون الضوء مرة أخرى على أنه مذهل في البرمجة المرئية، والسؤال هو لماذا هذا مهم جداً لجوجل؟ لماذا لا يتم تأطيره كمساعد رائع للمطورين؟ أعني، جوجل لديها كل هذه الأدوات الذكية، أطلقوا محرراً جديداً تماماً يعتمد على الذكاء الاصطناعي يسمى Anti-Gravity.
00:02:01لماذا يضعون Gemini 3 كنموذج برمجة مرئية؟ وهل هو حقاً بهذه الجودة؟ هل سيأخذ وظائفنا؟ حسناً، بالنسبة لجوجل، هذا منطقي جداً لأن دعونا نتذكر كيف تربح جوجل المال؟ من خلال الإعلانات.
00:02:15أين توجد تلك الإعلانات بشكل أساسي؟ في محرك البحث الخاص بهم وعلى يوتيوب، لكن دعونا نلتزم بالبحث الآن.
00:02:23طبعاً البحث يتغير، أصبح الأمر أكثر فأكثر يتعلق بالتحدث إلى ذكاء اصطناعي.
00:02:29ومع ذلك، بالطبع، خاصة في جوجل، سترى النتائج لأنهم ما زالوا بحاجة إلى بيع الإعلانات لك، لكنه يتغير ولدى جوجل رؤية واضحة لكيفية تغييره على المدى القريب على الأقل.
00:02:42مع Gemini 3، قاموا ببناء أول نموذج لهم محسّن بشكل كبير للعمل بشكل جيد في البحث، وهذا هو السبب في طرحه في البحث للولايات المتحدة في اليوم الأول.
00:02:54وهناك ميزة رئيسية واحدة يمتلكها Gemini 3: واجهة المستخدم التوليدية.
00:03:00يسلطون الضوء عليها في منشورات المدونة الرسمية للإعلان، والفكرة هي أن Gemini 3 لا يمكنه فقط توليد نص للإجابة على الأسئلة، بل أيضاً واجهات المستخدم والتصورات البصرية والنماذج التفاعلية ثلاثية الأبعاد، أي شيء منطقي لاستعلام بحث معين.
00:03:18لذا يريدون نقل البحث إلى ما وراء توليد النص البحت، يريدون الحصول على تجربة مستخدم أكثر ثراءً، والمفتاح لذلك هو نموذج ذكاء اصطناعي جيد في إنتاج تلك التصورات البصرية وواجهات المستخدم التفاعلية.
00:03:34وهذا بالضبط ما تدور حوله البرمجة المرئية.
00:03:37يتعلق الأمر بإنتاج شيء ما، بعض النتائج، واجهة مستخدم تبدو جيدة وتعمل بشكل جيد.
00:03:44لا يحتاج أن يكون موقعاً إلكترونياً معقداً، لا داعي للقلق بشأن الحالات النادرة أو الأمان أو الأداء، كل ذلك لا يهم إذا كان هدفك الوحيد هو بناء نموذج تفاعلي ثلاثي الأبعاد.
00:03:58وبالطبع، للعديد من حالات الاستخدام، سيكون ذلك كافياً.
00:04:02بالمناسبة، هذا ليس شيئاً يحل محل مطوري الواجهات الأمامية، إنه ببساطة شيء لم يكن ممكناً حقاً من قبل، أن يكون لديك هذا النوع من واجهات المستخدم أو التصورات البصرية التفاعلية التي يتم إنشاؤها فورياً لاستعلام مستخدم محدد.
00:04:20لذا هذه بوضوح رؤيتهم، رؤية جوجل لمستقبل البحث، وبالتالي لمستقبل نماذج الذكاء الاصطناعي الخاصة بهم، على المدى القريب على الأقل.
00:04:30بالطبع، نظراً لأن Gemini 3 هو نموذج رائد، فهو أيضاً جيد في البرمجة بشكل عام، أو يجب أن يكون كذلك على الأقل.
00:04:39مرة أخرى، على منصة X سترى بعض النتائج المختلطة.
00:04:43كما ذكرت، تدفع جوجل بسردية البرمجة المرئية وترى الكثير من المنشورات المتعلقة بذلك، لكنك سترى أيضاً منشورات تدفع للخلف إلى حد ما، تسلط الضوء على جودة الكود الضعيفة، تذكر أنها غير مقتنعة بـ Gemini 3 أو أنه ليس جيداً جداً في اتباع التعليمات المعقدة، أنه سريع وفعال وجيد للبرمجة المرئية ولكن ليس بالضرورة جيداً للتفاعلات الأكثر تعقيداً والمهام الأكثر تعقيداً.
00:05:12وهذا كان نوعاً ما تجربتي أيضاً.
00:05:14بالأمس شاركت منشوراً أنني لم أكن مقتنعاً حقاً بـ Gemini 3 لأنني واجهت مشاكل جدية في جعله يتبع المهام التي أردت منه اتباعها.
00:05:24كان يفعل ذلك غالباً لكن ليس طوال الوقت، اتخذ خطوات معقدة بشكل غير ضروري في أوقات معينة، أصر على كود لا يعمل بوضوح.
00:05:34لأعطيك مثالاً، في تطبيق Tan Stack Start الذي أعمل عليه حالياً، استمر في استخدام validator هنا للتحقق من صحة المدخلات إلى دالة خادم، عندما يكون الأسلوب الصحيح هو input.
00:05:47قد يبدو validator صغيراً ومتخصصاً، لكن ضع في اعتبارك أن استخدام validator يولد خطأ فعلياً، خطأ يمكنك اكتشافه ورؤيته كمخرج، وأيضاً كنموذج إذا قمت بإجراء بعض فحوصات النوع.
00:06:01وعلى الرغم من أنني أصلحت هذا يدوياً، استمر في إعادة تقديم validator وتغيير هذا مرة أخرى إلى validator.
00:06:09كانت هذه مشاكل من هذا القبيل واجهتها.
00:06:12بشكل مضحك، لم أكن ناجحاً أيضاً في البرمجة المرئية.
00:06:17حاولت أن أجعله يبني صفحة هبوط لخدمة تنظيف احترافية وهمية، وحسناً، إذا كنت تشاهد الفيديو، هذا ما يبدو عليه.
00:06:25هل هذا جيد؟ لست متأكداً.
00:06:27نعم، على الأقل لا يستخدم اللون البنفسجي، لكن فقط لأنني أخبرته بوضوح أي ألوان يستخدم.
00:06:34الآن، أمر الإدخال الذي استخدمته كان: أنشئ صفحة هبوط لخدمة تنظيف احترافية، أريد ألوان أكوا تركواز وصفحة تسلط الضوء على الدرجة العالية من الاحترافية لخدمتنا.
00:06:47افترض بيانات وهمية ذات معنى لنص قسم البطل والتسعير والميزات.
00:06:52أمر قصير جداً، لكن مرة أخرى، أليست الفكرة الكاملة من البرمجة المرئية هي المضي مع التدفق والسماح لها بالقيام بعملها؟ بالتأكيد كان بإمكاني أن أكون أكثر دقة، كان بإمكاني إنشاء المشروع وإعداد بعض الأنماط الأساسية وبعض المكونات الأساسية ثم استخدام الذكاء الاصطناعي، لكن الفكرة وراء البرمجة المرئية مختلفة إذا لم أكن مخطئاً.
00:07:18ثم استمر، استغرق وقتاً طويلاً جداً بصراحة، وحسناً، لم أفعل أي شيء آخر، لم أغير الكود بوضوح.
00:07:25هذا ما حصلت عليه.
00:07:27لذا حتى مع البرمجة المرئية، لم أكن ناجحاً.
00:07:30ربما مجرد حظ سيئ لأنه بوضوح يبدو أنه جيد جداً في ذلك، لكن مرة أخرى، ربما يكون أيضاً جيداً بشكل خاص في توليد تلك النماذج التفاعلية ثلاثية الأبعاد والتصورات البصرية لأن، مرة أخرى، هذا يبدو بوضوح أنه تركيز هذا النموذج.
00:07:48وبالتالي، باختصار، تماماً مثل جميع نماذج الذكاء الاصطناعي الأخرى التي كانت لدينا من قبل وعلى الأرجح جميع نماذج الذكاء الاصطناعي التي على وشك القدوم، يمكن أن تكون مساعدين جيدين.
00:08:02كمطور، أنا أستخدمها، أنت تعلم ذلك.
00:08:05أنا أستخدم Gemini 3، ربما سأعود إلى Claude Sonnet، سأرى، لكنني أستخدمه وكان جيداً، تماماً مثل كل النماذج.
00:08:13يمكنها مساعدتك في توليد الكود وكتابة الكود.
00:08:17كلها لديها مشاكلها، لنكن صادقين، لكنها ليست هنا لأخذ وظيفتك أو وظيفتي، ليس الآن على الأقل، ربما ليس في المستقبل القريب.
00:08:27بالطبع، المشكلة المختلفة هي إذا رأى المسؤولون التنفيذيون والمديرون كل المواد الترويجية، إذا رأوا كل التصورات البصرية وصفحات الهبوط والنماذج ثلاثية الأبعاد المبرمجة بصرياً، والتي يوجد الكثير منها إذا ألقيت نظرة فاحصة - مرة أخرى، نعرف الآن لماذا هذا هو الحال - إذا رأيت ذلك فقط، قد تميل إلى الاعتقاد بأننا لا نحتاج إلى مطور واجهات أمامية جديد، المطور الموجود يمكنه القيام بعمل ثلاثة أشخاص بمساعدة Gemini 3 في هذه الحالة، وهذا بالطبع، مرة أخرى، يؤدي إلى عدد أقل من الوظائف في الوقت الحالي على الأقل، ربما.
00:09:08مرة أخرى، أنا مقتنع بأن هذا ليس المستقبل المتوسط أو الطويل الأجل بالضرورة، أنا مقتنع بأن الذكاء الاصطناعي يمكن أن يعمل كمسرّع، لكن هذا لا يساعدنا اليوم إذا قررت الشركات أنها يمكن أن تستخدم الذكاء الاصطناعي لإنجاز نفس العمل بعدد أقل من الناس.
00:09:27قد لا يكون ذلك صحيحاً، سيتعلمون مع الوقت، لكنه مع ذلك مشكلة اليوم، وللأسف لا يوجد حل سهل لذلك.
00:09:35لكن للإجابة على السؤال، هل سيأخذ وظائفنا؟ لا، لا أعتقد ذلك.
00:09:40من المهم أن نفهم أن Gemini 3 بالتأكيد تم بناؤه بشكل هادف وضبطه الدقيق لمهمة محددة، وهو جيد جداً في تلك المهمة، لكن هذه ليست المهمة التي يتم دفع أجرك من أجلها..

Key Takeaway

Gemini 3 هو نموذج متخصص في البرمجة المرئية لتحسين تجربة البحث في جوجل وليس أداة لاستبدال المطورين، رغم أنه قد يؤثر على سوق العمل على المدى القصير

Highlights

جوجل تضع Gemini 3 كنموذج متخصص في البرمجة المرئية وليس كبديل كامل للمطورين

الهدف الرئيسي لجوجل من Gemini 3 هو تحسين تجربة البحث من خلال واجهات المستخدم التوليدية والتصورات البصرية التفاعلية

النموذج يواجه مشاكل في اتباع التعليمات المعقدة وقد لا يكون مثالياً للمشاريع الكبيرة

البرمجة المرئية تستهدف إنشاء نماذج تفاعلية ثلاثية الأبعاد وواجهات بسيطة وليست تطبيقات معقدة تتطلب أماناً وأداءً عالياً

الذكاء الاصطناعي يعمل كمساعد للمطورين وليس كبديل كامل، على الأقل في المستقبل القريب

Timeline

المخاوف الأولية من Gemini 3 وواقع البرمجة المرئية

يبدأ الفيديو بمناقشة المخاوف المنتشرة على منصة X حول انتهاء عصر مطوري الواجهات الأمامية بسبب Gemini 3. يعرض المقدم تجربته الشخصية في محاولة برمجة صفحة هبوط باستخدام Gemini 3 والتي أنتجت نتائج سيئة بصرياً. رغم النتائج المختلطة، يشير إلى أن العديد من المستخدمين على منصة X يشاركون صفحات هبوط مذهلة ونماذج ثلاثية الأبعاد تم إنشاؤها بنجاح. يطرح السؤال الرئيسي: هل Gemini 3 مصمم لاستبدال المطورين أم هو مجرد أداة مساعدة، ولماذا تركز جوجل بشدة على البرمجة المرئية كنقطة بيع رئيسية للنموذج.

الاستراتيجية التجارية لجوجل وراء Gemini 3

يكشف الفيديو عن السبب الحقيقي وراء تركيز جوجل على البرمجة المرئية: نموذج أعمالها القائم على الإعلانات في محرك البحث. جوجل تطور Gemini 3 كأول نموذج محسّن بشكل كبير للعمل في البحث، مع ميزة رئيسية تسمى 'واجهة المستخدم التوليدية'. الهدف هو تحويل البحث من مجرد توليد نصوص إلى تجربة أكثر ثراءً تتضمن واجهات مستخدم تفاعلية وتصورات بصرية ونماذج ثلاثية الأبعاد يتم إنشاؤها فورياً استجابةً لاستعلامات المستخدمين. هذا يفسر لماذا تم طرح النموذج في البحث الأمريكي في اليوم الأول، ولماذا تؤكد جوجل باستمرار على قدراته في البرمجة المرئية في منشوراتها الرسمية.

حدود البرمجة المرئية والفرق عن التطوير الحقيقي

يوضح المقدم أن البرمجة المرئية تستهدف إنتاج واجهات مستخدم تبدو جيدة وتعمل بشكل أساسي، لكنها لا تحتاج إلى التعامل مع التعقيدات التي يواجهها المطورون الحقيقيون. لا يتطلب الأمر القلق بشأن الحالات النادرة أو الأمان أو الأداء أو بناء مواقع معقدة، بل يركز على إنشاء نماذج تفاعلية ثلاثية الأبعاد وتصورات بصرية بسيطة. هذا النوع من المخرجات كافٍ للعديد من حالات الاستخدام، خاصةً في سياق البحث. الأهم أن هذه القدرة لا تحل محل مطوري الواجهات الأمامية، بل تفتح إمكانيات جديدة لم تكن موجودة من قبل لإنشاء محتوى تفاعلي مخصص فورياً لاستعلامات المستخدمين.

تجارب واقعية ومشاكل في الأداء

يشارك المقدم تجاربه الشخصية المحبطة مع Gemini 3، حيث وجد النموذج سريعاً وفعالاً في البرمجة المرئية البسيطة لكنه يواجه صعوبات في المهام المعقدة. يذكر مشكلة محددة في مشروع Tan Stack Start حيث استمر النموذج في استخدام 'validator' بدلاً من 'input' رغم أن ذلك يولد خطأً واضحاً. حتى بعد التصحيح اليدوي، كان النموذج يعيد تقديم نفس الخطأ. كما يعرض محاولته لإنشاء صفحة هبوط لخدمة تنظيف باستخدام أمر بسيط، والتي أنتجت نتائج دون المستوى المتوقع رغم تحديد الألوان والمتطلبات بوضوح، مما يثير تساؤلات حول فعالية النموذج حتى في مجال تخصصه المفترض.

الخلاصة: مساعد وليس بديل، لكن مع تحذير

يختم المقدم بتأكيد أن Gemini 3، مثل جميع نماذج الذكاء الاصطناعي الأخرى، هو مساعد جيد للمطورين وليس بديلاً كاملاً لهم، على الأقل في الوقت الحالي والمستقبل القريب. النموذج مصمم ومضبوط بدقة لمهمة محددة هي البرمجة المرئية لتحسين البحث، وليس للمهام المعقدة التي يتقاضى المطورون أجورهم مقابلها. لكنه يحذر من خطر حقيقي: إذا رأى المسؤولون التنفيذيون والمديرون المواد الترويجية فقط وكل النماذج المبرمجة بصرياً، قد يعتقدون خطأً أن مطوراً واحداً يمكنه القيام بعمل ثلاثة أشخاص، مما يؤدي إلى تقليل الوظائف على المدى القصير رغم أن هذا قد لا يكون مستداماً على المدى الطويل.

Community Posts

View all posts