أسطورة كلود وصلت أخيراً (Fable 5)

BBetter Stack
Computing/SoftwareBusiness NewsInternet Technology

Transcript

00:00:00نموذج “كلود ميثوس” أصبح متاحاً أخيراً.
00:00:01لقد أطلقت شركة “أنثروبيك” للتو نموذجاً جديداً يسمى “فايبل 5”،
00:00:03وهو نموذج من فئة “ميثوس”،
00:00:05لكن مع الكثير من وسائل الحماية المدمجة فيه،
00:00:07وهو يتفوق على أي نموذج أصدرته الشركة من قبل،
00:00:09وربما على أي نموذج آخر.
00:00:11إنه الأحدث والأكثر تطوراً في جميع مقاييس الأداء تقريباً.
00:00:13لكن من الواضح أن هذا سيكلفك الكثير بالتأكيد،
00:00:16وقد قاموا بشيء مثير للاهتمام قليلاً
00:00:17فيما يتعلق بالتسعير هنا
00:00:18لا أعتقد أن الكثير من الناس سيكونون سعداء به.
00:00:25عادةً، لا أحب قضاء وقت طويل
00:00:27في استعراض المقاييس، لكن هذا الجدول جنوني نوعاً ما.
00:00:30القفزات التي يحققها هذا النموذج
00:00:31في بعض هذه المقاييس،
00:00:32وحقيقة أنه يتصدر كل مقياس تقريباً.
00:00:35يمكنك رؤية أنه حقق قفزة بنسبة 10% في “أرجنتيك كودينج”
00:00:37على معيار “إس دبليو إي بينش برو”،
00:00:39وهو يتفوق بنسبة 20% تقريباً على “جي بي تي 5.5”،
00:00:42وقد حقق قفزات مماثلة في معيار “فرونتير كود”.
00:00:44“فرونتير كود” هو في الواقع معيار جديد من شركة “كوجنيشن”،
00:00:47التي تقف خلف “ديفين”،
00:00:48والذي يختبر أساساً ما إذا كانت الصيانة
00:00:49قد دمجت بالفعل الكود الذي ينتجه هذا النموذج.
00:00:52في هذا الرسم البياني، يمكنك رؤية أن “فايبل 5” يتصدر
00:00:54كل النماذج الأخرى،
00:00:55حتى عند بذل مجهود استنتاجي متوسط،
00:00:57لكنني أعتقد أيضاً أنه يمكنك رؤية أن هذا النموذج
00:00:58سيكون باهظ الثمن للغاية.
00:01:00كما أنه أفضل قليلاً في استخدام الكمبيوتر،
00:01:02ليست قفزة هائلة،
00:01:03والأمر نفسه ينطبق على معيار “تيرمينال بينش” في الأسفل،
00:01:05لكن مرة أخرى، كما يمكنك أن ترى،
00:01:06إنه رائد في كل فئة تقريباً.
00:01:09لكن أحد أهم الأشياء،
00:01:10التي تزداد أهمية يوماً بعد يوم
00:01:11هي المهام طويلة الأمد.
00:01:12يبدو أن “فايبل 5” يمكنه العمل لفترة أطول
00:01:14من أي نموذج آخر،
00:01:15وقد جعلوا شركة “سترايب” تختبر هذا،
00:01:17ويبدو أنه أنجز عملية ترحيل لقاعدة بيانات كاملة
00:01:18مكونة من 50 مليون سطر برمجي بلغة “روبي”
00:01:21في يوم واحد فقط.
00:01:22ربما ساعده في ذلك حقيقة أنه أصبح
00:01:24أفضل بكثير في الذاكرة والسياق الطويل أيضاً.
00:01:26يمكنه على ما يبدو الحفاظ على تركيزه عبر ملايين
00:01:28الرموز (tokens) في المهام طويلة الأمد،
00:01:29ويقوم بتحسين مخرجاته الخاصة
00:01:31باستخدام ملاحظاته الخاصة.
00:01:32الآن، إلى جانب البرمجة،
00:01:33قدراته البصرية رائعة جداً أيضاً.
00:01:36على ما يبدو، يمكنه الفوز بلعبة “بوكيمون فاير ريد”
00:01:37باستخدام أداة بصرية بسيطة فقط الآن،
00:01:39بينما في السابق كان عليهم إعطاؤه أدوات إضافية،
00:01:42ومع ذلك كان بالكاد يفوز،
00:01:43لكن الآن ليس لديه أي مشكلة.
00:01:45سيقوم أيضاً على ما يبدو بإنشاء موقع ويب بلقطة واحدة
00:01:47من لقطة شاشة.
00:01:48لقد اختبرت هذا بالفعل باستخدام موقع “لينير”،
00:01:50وقد أصبح الأمر محيراً بعض الشيء بالنسبة لي
00:01:52أيهما هو الذي في الصورة،
00:01:53لكن الذي على اليمين هو الذي
00:01:55قام “فايبل 5” بتوليده
00:01:56بمجرد النظر إلى لقطة شاشة لموقع “لينير”.
00:01:58لم يستخدم البحث عبر الويب أو أي شيء من هذا القبيل،
00:02:00أعطيته فقط لقطة شاشة كاملة لصفحة الويب هذه،
00:02:02وأود أن أقول إنه قام بعمل رائع جداً في ذلك.
00:02:05كل لقطات الشاشة، وكل شيء،
00:02:06تم إنشاؤها باستخدام الكود،
00:02:08ويمكنك أن ترى أنه قام بعمل جيد جداً.
00:02:10إنها أشياء مثل رسوم “إس في جي” المتحركة
00:02:12التي لن تكون مثالية،
00:02:14لكن بشكل عام، أود أن أقول إنني سعيد جداً
00:02:15بالطريقة التي أعاد بها إنشاء هذا الموقع،
00:02:18وقد نجح في كل قسم تقريباً،
00:02:20أو على الأقل أوصلني إلى نقطة
00:02:21حيث يمكنني بعدها التعديل عليها
00:02:22للحصول على النتيجة التي أريدها بالضبط.
00:02:24بينما نحن هنا،
00:02:24قررت أيضاً اختبار هذه النماذج
00:02:25في بناء واجهة أمامية وخلفية
00:02:27لتطبيق لوحة تحكم مالية
00:02:28من مجلد فارغ تماماً في محاولة واحدة،
00:02:31وهذا ما قدمه لي “فايبل 5”.
00:02:33لقد اختبرت كل شيء،
00:02:34كل شيء يعمل،
00:02:35إنه يتحدث إلى واجهة برمجة التطبيقات (API)،
00:02:37وبشكل عام، يبدو التصميم جيداً حقاً.
00:02:39إنه قابل للاستخدام فعلاً،
00:02:40لكن هذا هو الطابع الجمالي
00:02:41الذي يبدو أن نماذج “كلود” تقدمه مؤخراً.
00:02:43يمكننا رؤية ذلك في النتيجة
00:02:44التي قدمها لي “أوبوس 4.8” أيضاً.
00:02:45مرة أخرى، أعتقد أن هذا الموقع يبدو جيداً حقاً،
00:02:47ولأكون صادقاً معك،
00:02:48سأجادل بأن هذا يبدو أفضل من موقع “فايبل 5”،
00:02:50لكن مرة أخرى، لديه ذلك الطابع الجمالي
00:02:51الذي تدربت عليه نماذج “كلود”،
00:02:53ولكن هذا خطئي أيضاً.
00:02:54لم أطالبه بالالتزام بأي تصميم معين.
00:02:56أنا متأكد من أنني لو فعلت ذلك،
00:02:57لكان قد قام بعمل رائع.
00:02:58إذا قارنا هذا بما قدمه لي “جي بي تي 5.5”،
00:03:00مع ذلك،
00:03:01يمكنك أن ترى أنه ليس قريباً حتى.
00:03:03كان هذا من مطالبة واحدة،
00:03:04نفس المطالبة تماماً،
00:03:05وهم متأخرون بأميال في تصميم الواجهة،
00:03:07في رأيي.
00:03:08آمل حقاً أن يقوم نموذج “جي بي تي” القادم
00:03:10بفعل شيء حيال هذا.
00:03:11لقد فاجأني “فايبل 5” بالفعل في ذلك الاختبار
00:03:13بكونه الأسرع.
00:03:14استغرق الأمر حوالي ثماني دقائق
00:03:15لإنهاء لوحة التحكم المالية تلك،
00:03:17بينما استغرق “أوبوس” 12 دقيقة،
00:03:18واستغرق “جي بي تي 5.5” 15 دقيقة
00:03:20ليصنع ذلك الشيء البشع.
00:03:22إلى جانب تجاربي فقط،
00:03:23كانت إحدى المفضلات لدي هي شركة “أنثروبيك”،
00:03:24حيث عرضت “فايبل 5” وهو يبني نموذجاً ثلاثي الأبعاد للتصميم الهندسي (CAD)
00:03:27في محرر تصميم هندسي داخل المتصفح
00:03:28قام “فايبل 5” نفسه بصنعه أيضاً.
00:03:31بناء برنامجك الصغير الخاص
00:03:32أصبح أمراً سهلاً للغاية الآن،
00:03:34والأمر نفسه ينطبق على الأدوية.
00:03:36يبدو أن هذا النموذج جيد جداً في تصميم الأدوية،
00:03:38لكنك ربما لا تحتاج إلى معرفة ذلك،
00:03:40ونعم، إنه محمي بالتأكيد،
00:03:43كما هو الحال مع أي شيء تقريباً
00:03:44يتعلق بالأمن السيبراني،
00:03:45إلا إذا كنت من الشركات
00:03:46في ذلك البرنامج الخاص.
00:03:48“فايبل 5” سيكون حذراً للغاية على ما يبدو،
00:03:51مما يعني أنه سيكون لديه
00:03:51عدد لا بأس به من النتائج الإيجابية الكاذبة،
00:03:53على ما يبدو أقل من 5% من الرسائل،
00:03:55لكن هذا لا يزال يبدو مرتفعاً جداً بالنسبة لي،
00:03:57وقد واجهت وسائل حماية “أوبوس” من قبل،
00:03:59لذا فمن المحتمل أن يكون هذا النموذج أسوأ.
00:04:01على الرغم من ذلك،
00:04:02بدلاً من مجرد الرفض المباشر،
00:04:04سيحاول إرسال طلبك
00:04:05إلى “أوبوس 4.8” أولاً
00:04:06لمعرفة ما إذا كان من الآمن لهذا النموذج القيام بالعمل،
00:04:09لكن مرة أخرى، لقد واجهت وسائل الحماية هذه من قبل،
00:04:11لذا لست متأكداً تماماً من مدى نجاح ذلك.
00:04:13يوضح هذا المعيار في الواقع
00:04:14مدى جنون وسائل الحماية تلك.
00:04:17عند اختباره على تقييمات الأمن السيبراني،
00:04:19فإن “فايبل 5” مع وسائل حمايته
00:04:20لا يجتاز أياً من هذه الاختبارات.
00:04:22إنه يرفض القيام بأي شيء تماماً،
00:04:24وكما قلت سابقاً،
00:04:25إذا كان “أوبوس” يرفضني أحياناً
00:04:27بنسبة نجاح تبلغ 88% في هذا الاختبار،
00:04:29فأنا أرى الكثير من الناس
00:04:30يواجهون وسائل حماية مع “ميثوس”.
00:04:32إذن الشيء الأخير الذي تجدر مناقشته
00:04:33هو التسعير،
00:04:34وهنا تصبح الأمور مثيرة للاهتمام قليلاً.
00:04:37إنه 10 دولارات لكل مليون رمز (token) للمدخلات،
00:04:39و50 دولاراً لكل مليون رمز للمخرجات،
00:04:41وهو ما لا أعتقد أنه سيئ للغاية في الواقع،
00:04:42ليس الأسوأ الذي رأيناه على الإطلاق،
00:04:44لكن ما لا يعجبني بشكل خاص
00:04:45هو هذا الجزء التالي.
00:04:47“فايبل 5” متاح بدءاً من اليوم
00:04:48في خطط “برو ماكس” وخطط الفرق والخطط المؤسسية،
00:04:50ولكن بعد ذلك في غضون أسبوعين
00:04:52في 23 يونيو،
00:04:53سيقومون بشكل أساسي بسحب هذه الميزة من مشتركي “بلس”
00:04:54وإزالة هذه النماذج،
00:04:56وبعد ذلك،
00:04:56سيتطلب الأمر أرصدة استخدام.
00:04:58ثم بعد ذلك،
00:04:59يقولون إنهم سيضيفون هذه النماذج
00:05:01مرة أخرى إلى تلك الخطط
00:05:02في تاريخ غير محدد.
00:05:04يبدو مجرد طريقة غريبة للقيام بالأمور،
00:05:05وأفترض أن هدفهم
00:05:06هو جعلك مدمناً على هذه النماذج،
00:05:08ثم أخذها منك،
00:05:09وجعلك تنفق المزيد من المال عليها،
00:05:11وأعتقد أنه يشير
00:05:12إلى مدى تكلفة تشغيل هذه النماذج
00:05:13بالنسبة لهم.
00:05:14أوه، وهي أيضاً تستهلك حدودك
00:05:16بسرعة مضاعفة مقارنة بـ “أوبوس”،
00:05:17لذا ربما لن أجعل هذا
00:05:18نموذجي الأساسي
00:05:19إلا إذا كنت مليارديراً من نوع ما.
00:05:21الحاشية الأخيرة
00:05:21التي أعتقد أنها مثيرة للاهتمام
00:05:23هي سياسة الاحتفاظ بالبيانات الجديدة الخاصة بهم.
00:05:25لاستخدام هذه النماذج،
00:05:25هم في الواقع يتطلبون الاحتفاظ ببياناتك لمدة 30 يوماً
00:05:27لجميع حركات المرور (traffic)
00:05:28على كل من الأدوات التابعة للطرف الأول والثالث،
00:05:30ويفترض أنه لن يتم القيام بأي تدريب
00:05:31على هذه البيانات،
00:05:33الأمر يتعلق مرة أخرى بمحاولة
00:05:34منع التهديدات الأمنية.
00:05:35إذن ها قد وصلنا،
00:05:36“ميثوس” أصبح متاحاً أخيراً.
00:05:37ما رأيك في إصدار هذا النموذج
00:05:39ومستقبل البرمجيات؟
00:05:40أخبرني بذلك في التعليقات أدناه.
00:05:41وبينما أنت هناك، اشترك،
00:05:42وكما هو الحال دائماً،
00:05:43أراك في المرة القادمة.
00:05:44وداعاً.

Key Takeaway

يمثل فايبل 5 قفزة تقنية في الأداء البرمجي والقدرات البصرية، لكنه يفرض تكاليف تشغيل مرتفعة، وقيوداً أمنية صارمة، ونظام وصول مؤقت يحد من استخدامه المباشر للمشتركين العاديين.

Highlights

  • نموذج فايبل 5 الجديد يتفوق بنسبة 10% في معيار أرجنتيك كودينج وبنسبة 20% على جي بي تي 5.5 في الاختبارات البرمجية.

  • أنجز فايبل 5 عملية ترحيل لقاعدة بيانات مكونة من 50 مليون سطر برمجي بلغة روبي في يوم واحد.

  • يولد النموذج واجهات مواقع إلكترونية كاملة وقابلة للاستخدام بناءً على لقطة شاشة واحدة فقط.

  • تصل تكلفة استخدام النموذج إلى 10 دولارات لكل مليون رمز للمدخلات و50 دولاراً لكل مليون رمز للمخرجات.

  • يتطلب استخدام النموذج احتفاظ الشركة ببيانات المستخدم لمدة 30 يوماً لمنع التهديدات الأمنية.

  • سيتم سحب صلاحية الوصول إلى فايبل 5 من مشتركي خطط بلس في 23 يونيو قبل إتاحته لاحقاً عبر نظام أرصدة الاستخدام.

Timeline

تفوق الأداء البرمجي والتقني

  • يتصدر فايبل 5 مقاييس الأداء البرمجي مقارنة بالنماذج السابقة والمنافسة.
  • يحقق النموذج قفزة نوعية في معايير مثل إس دبليو إي بينش برو وفرونتير كود.
  • تساهم التحسينات في الذاكرة والسياق الطويل في تعزيز كفاءة المهام البرمجية المعقدة.

يأتي النموذج الجديد بتطويرات ملموسة تجعله يتفوق على النماذج السابقة في جميع مقاييس الأداء تقريباً. تظهر الاختبارات قدرته العالية على دمج الكود وتطوير البرمجيات بسرعة أكبر، حيث سجل تفوقاً واضحاً على جي بي تي 5.5 في اختبارات البرمجة والواجهات، مما يجعله حالياً النموذج الأكثر تطوراً في هذا المجال.

القدرات البصرية وإنجاز المهام

  • يتميز النموذج بقدرة فائقة على معالجة المهام طويلة الأمد والذاكرة الموسعة.
  • يستطيع إنشاء واجهات برمجية كاملة وظيفياً من صورة واحدة فقط.
  • تجاوز أداء النموذج في اختبارات البرمجة والواجهات الأمامية أداء النماذج الأخرى من حيث السرعة والجودة.

أظهر النموذج مهارات متقدمة في التحليل البصري من خلال إعادة بناء مواقع معقدة بمجرد النظر إلى لقطة شاشة، مع أداء وظيفي كامل للواجهات والخلفيات. كما سجل تفوقاً زمنياً في إنجاز المهام، حيث استغرق 8 دقائق فقط لإنشاء لوحة تحكم مالية، مقارنة بـ 15 دقيقة استغرقها النموذج المنافس في نفس المهمة.

القيود الأمنية ونظام التسعير

  • تحد وسائل الحماية الأمنية المدمجة من قدرة النموذج على تنفيذ بعض المهام في اختبارات الأمن السيبراني.
  • تتطلب سياسة البيانات الجديدة الاحتفاظ بسجلات المستخدم لمدة 30 يوماً لأغراض أمنية.
  • يخضع الوصول للنموذج لنظام تسعير بالاستخدام مع إزالة ميزات الوصول المباشر من خطط بلس الحالية.

يفرض النموذج قيوداً أمنية قد تؤدي إلى نتائج إيجابية كاذبة تمنع تنفيذ الطلبات، مع وجود سياسة احتفاظ بالبيانات تهدف إلى تعزيز الأمان. من ناحية التكاليف، يتبنى النموذج نموذج تسعير يعتمد على عدد الرموز، مع خطة انتقالية تغير طريقة وصول المشتركين للخدمة، مما يشير إلى التكلفة العالية لتشغيل هذه التقنيات.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video