00:00:00في هذا الصباح استيقظت لأرى هذا المنشور على منصة X والذي يذكر أن شركة Anthropic قامت على ما يبدو بسحب
00:00:09ميزة "Cloud Code" من خطة المحترفين (Pro)، بحيث أصبحت بحاجة إلى اشتراكات أكثر تكلفة
00:00:17لكي تتمكن من استخدام Cloud Code أو استخدام اشتراكك داخل Cloud Code.
00:00:22والآن، سارعت شركة Anthropic بالتعليق على هذا الأمر، ذاكرين أن هذا مجرد اختبار صغير
00:00:27يقومون بإجرائه على 2% فقط من المشتركين الجدد في خطة المحترفين.
00:00:32أجد أنه من الغريب إجراء هذا النوع من الاختبارات، وأعتقد أيضاً أن Anthropic كان بإمكانها
00:00:40توقع ما سيحدث عند إجراء اختبار كهذا، والأثر الذي سيتركه هذا الاختبار
00:00:47على صورتهم الذهنية وما قد يعتقده الناس، لأن هذا يتناسب بالطبع مع السردية
00:00:53التي نشهدها بالفعل حيث نحصل على استخدام أقل لاشتراكاتنا، ونرى
00:00:59قيوداً أقوى أو أكثر صرامة، ونرى تدهوراً في أداء النماذج، حيث يبدو أن كل هذه
00:01:08الأمور كانت تحدث خلال الأسبوعين الماضيين. أعني أن Anthropic ضيقت بشكل كبير
00:01:14استخدام اشتراكاتهم خارج نطاق Cloud Code. إذا أردت استخدامه مع Open Cloud
00:01:21على سبيل المثال، فقد قيدوا ذلك، لذا فكل هذا يعطينا صورة أوضح وأكبر.
00:01:28وما يتناسب مع هذه الصورة أو السردية هو المقال الإخباري الذي نشره GitHub قبل بضعة
00:01:37أيام حيث أوضحوا أنهم سيوقفون مؤقتاً الاشتراكات الجديدة في خطط GitHub Copilot Pro،
00:01:43وPro Plus وخطط الطلاب، وأنهم يشددون قيود الاستخدام للخطط الفردية،
00:01:49والأهم من ذلك أن نماذج Opus لم تعد متاحة في خطط Pro، وكل ذلك
00:01:56بالطبع يبدو منطقياً، لكن علينا التعمق قليلاً في اقتصاديات ما يحدث
00:02:02لفهم سبب حدوث ذلك، والأهم من ذلك، ما يعنيه هذا بالنسبة لنا أيضاً في
00:02:07المستقبل. إنه يعني بوضوح أن أيام الاستخدام غير المحدود والدعم المكثف قد ولت، وللفهم
00:02:17علينا فهم اقتصاديات هذه الاشتراكات واستهلاك الرموز (Tokens) إن جاز التعبير، أو
00:02:25استهلاك الرموز، لأنه بالطبع نماذج الاشتراكات هذه التي تقدمها Anthropic، و
00:02:34OpenAI، وGitHub، لا تعمل حقاً إلا إذا كانت غالبية المستخدمين لا يستهلكون فعلياً كل
00:02:43الاستخدام المتاح لهم. هذا هو الحال تقريباً لأي خدمة اشتراك موجودة
00:02:49ليس فقط لاشتراكات الذكاء الاصطناعي هذه. إذا كان لديك اشتراك في Netflix وقضيت 24/7 في مشاهدة
00:02:56Netflix، فمن المحتمل جداً ألا تكون عميلاً مربحاً جداً بالنسبة لهم، لكن معظم الناس
00:03:02لا يفعلون ذلك، وهذه هي الطريقة التي يمكن لهذه الشركات من خلالها تحقيق الربح. هذا صحيح لجميع الاشتراكات
00:03:10بوضوح. الآن يمكننا رؤية السعر الحقيقي أو سعر أقرب إلى السعر الحقيقي لطلبات الذكاء الاصطناعي الخاصة بنا
00:03:19إذا ألقينا نظرة على صفحات أسعار واجهة برمجة التطبيقات (API) الخاصة بهذه الشركات، فهناك على سبيل المثال يمكننا أن نرى
00:03:26أن أحدث نموذج من Anthropic، وهو Claude Opus 3.7، لديه سعر رموز إدخال يبلغ خمسة دولارات لكل
00:03:35مليون رمز، وسعر رموز إخراج يبلغ 25 دولاراً لكل مليون رمز، ويمكننا وضع ذلك
00:03:42في علاقة مع النماذج الأخرى التي لديهم، ويمكننا بالطبع أيضاً وضعه في علاقة مع ما تقدمه OpenAI
00:03:47على سبيل المثال. هناك نرى أن GPT-4o، الذي ربما يستخدمه معظم مستخدمي Codex في الوقت الحالي، لديه
00:03:54سعر إدخال يبلغ دولارين وخمسين سنتاً لكل مليون رمز، أي نصف ما كان لدينا لنموذج Opus 3.7.
00:04:03ولدينا سعر إخراج يبلغ 22.50 دولاراً، أي أقل قليلاً مما رأيناه لنموذج Opus. الآن،
00:04:11من العدل افتراض أن أسعار واجهة برمجة التطبيقات (API) هذه هي أسعار تترك هذه الشركات
00:04:20عند نقطة التعادل أو ربح صغير فيما يتعلق بهامش الربح الإجمالي، لذا إذا نظرنا فقط إلى
00:04:29تكلفة الاستدلال (Inference) تحديداً، يمكننا على الأرجح افتراض أنهم سيحققون ربحاً إذا استخدمت
00:04:36واجهات برمجة التطبيقات الخاصة بهم. الآن بالطبع من المهم أن نفهم أن تكلفة تشغيل نماذج الذكاء الاصطناعي
00:04:43تعتمد في النهاية على عاملين رئيسيين: تدريب نماذج الذكاء الاصطناعي الذي يكلف المال،
00:04:53والاستدلال (Inference) بالطبع، لذا لدينا هذان العاملان اللذان يدخلان في الاعتبار لهذه
00:04:59شركات الذكاء الاصطناعي. الآن بالطبع، تكلفة التدريب هي أمر يحدث لمرة واحدة، أليس كذلك؟ فأنت تدرب نموذجاً مرة واحدة
00:05:06وهذا مكلف للغاية، ولكن من الواضح أنه أمر يحدث لمرة واحدة، وبالطبع تقوم هذه الشركات بعد ذلك
00:05:12بتدريب المزيد والمزيد من النماذج، وهي تكلفة جديدة لمرة واحدة لكل نموذج، ولكن بمجرد تدريب نموذج
00:05:18فإنه لم يعد يتكبد أي تكلفة تدريب باستثناء ربما لجولات الضبط الدقيق (Fine-tuning) الإضافية أو النماذج المشتقة
00:05:25من ذلك النموذج الأساسي، ولكن نعم، الجزء الأكبر من التكلفة يحدث مرة واحدة فقط. الآن بالنسبة للاستدلال
00:05:33بطبيعة الحال الأمر مختلف، فهذه تكلفة مستمرة، وهي لكل طلب في النهاية، لأنه بالطبع
00:05:41الاستدلال هو عملية إنتاج المخرجات الملموسة لمطالبتك، لمهمتك التي ترسلها
00:05:48إلى مزود النموذج، والاستدلال هو بالطبع ما يحدث طوال الوقت عندما تستخدم
00:05:53Cloud Code، عندما تستخدم Codex، ولكن أيضاً بالطبع عندما ترسل مطالبة على ChatGPT أو في
00:05:58أي طريقة أخرى. الآن هذا بالطبع هو المكان الذي تريد فيه على الأقل تحقيق التعادل مع تسعير واجهة برمجة التطبيقات الخاص بك
00:06:07لأنه بخلاف ذلك فهذا يعني أنك تخسر المال في كل طلب تتلقاه، وبينما يمكنك بالطبع
00:06:13أن تفعل ذلك لتنمية حصتك في السوق، وبينما لن أستبعد أن الشركات
00:06:19تفعل ذلك أحياناً، فإن القيام بذلك على المدى الطويل لن يكون قابلاً للاستمرار لأنك ستخرج
00:06:25من العمل. الآن بطبيعة الحال تحتاج أيضاً إلى كسب تكلفة التدريب في مرحلة ما، لذا من الناحية المثالية
00:06:34تمنحك هذه الطلبات الواردة التي يرسلها المستخدمون إليك هامش ربح إجمالي كافياً من
00:06:41تكلفة الاستدلال بحيث يغطي هذا الهامش أيضاً تكلفة التدريب، وتكلفة الموظفين، وما إلى ذلك. لذا بالطبع
00:06:48هذه هي اقتصاديات كيفية تشغيل واستخدام نماذج الذكاء الاصطناعي هذه. الآن كما ذكرنا،
00:06:57تسعير واجهة برمجة التطبيقات هو على الأرجح الجزء الذي لا تخسر فيه هذه الشركات مبالغ طائلة من
00:07:02المال، ولكن بالطبع كمستهلك كعميل، أنت تخسر إذا كنت ستشغل Cloud Code بهذه
00:07:10الأسعار عند الطلب لنموذج Opus، ستدفع أكثر بكثير مما لو كنت تستخدم اشتراكاتهم
00:07:18لأنك بالطبع مع اشتراك Max على سبيل المثال، مقابل 200 دولار فقط، أنت تحصل على
00:07:26الكثير من الاستخدام من هذه الخطة، ستحصل على ملايين الرموز من هذه الخطة، وإذا
00:07:34ألقيت نظرة على ما ستكلفك رموز الإخراج عادةً لكل مليون رمز، يمكنك أن ترى أن
00:07:39عادةً، إذا تجاهلت رموز الإدخال التي يجب ألا تتجاهلها، ولكن إذا تجاهلتها مقابل هذه
00:07:44المائتي دولار، فلا يجب أن تحصل حتى على 10 ملايين رمز إخراج، أليس كذلك؟ لأن مليون رمز
00:07:51يكلفنا 25 دولاراً، لذا يجب أن نحصل فقط على 8 ملايين رمز إخراج، وإذا أخذت في الاعتبار
00:07:56رموز الإدخال فسيكون الأمر أقل من ذلك، ومن الواضح أنه إذا كان لديك أي جلسات طويلة الأمد، إذا كنت تستخدم
00:08:02Cloud Code على سبيل المثال لمدة أسبوع وتتتبع استهلاكك للرموز، فسترى أنك
00:08:08يمكنك تجاوز هذا الحد، وبالتأكيد كان بإمكانك القيام بذلك في الماضي، وهذا يجعل من الواضح لماذا
00:08:14تحاول الشركات نوعاً ما تقييد مقدار الاستخدام الذي يمكنك الحصول عليه من اشتراكاتك
00:08:19ولماذا أعتقد أننا سنرى أسعار اشتراكات أعلى بالتأكيد في المستقبل، ربما بالفعل
00:08:25في المستقبل القريب. الآن بالطبع ليس من السهل جداً على هذه الشركات زيادة أسعارها
00:08:30لأن الحصة السوقية، من الواضح أن جميع هذه الشركات تريد الاستحواذ بقوة على الحصة السوقية
00:08:37والسبب هو أنه إذا كنت الشركة الرئيسية التي تم ترسيخها كمزود لوكيل البرمجة في
00:08:45الكثير من الشركات، والكثير من المؤسسات، فمن المحتمل أن يدفعوا أسعار اشتراك أعلى
00:08:51في المستقبل، لذا فأنت لا تريد البدء في زيادة أسعارك في وقت مبكر جداً لأن ذلك قد
00:08:57يدفع بعض عملائك إلى منافسيك، وهو أمر لا تريده بالطبع. من ناحية أخرى
00:09:02أنت لا تريد الإفلاس، أعني على سبيل المثال، OpenAI جمعت مؤخراً 122 مليار دولار
00:09:09لتسريع المرحلة التالية من الذكاء الاصطناعي، ويمكنك قراءة أن هذا سيعطيهم فقط
00:09:17حوالي 18 شهراً من الميزانية التشغيلية (Runway)، لذا 18 شهراً حتى يحتاجوا إلى جمع أموال مرة أخرى، فمن الواضح أنك لا تستطيع
00:09:26الاستمرار في دعم كل هذا الاستخدام إلى الأبد، لأنك إذا خرجت من العمل، فإن جميع عملائك
00:09:32سيذهبون إلى منافسيك على أي حال، لذا هناك مقايضة هنا، وهذا بالطبع هو بالضبط
00:09:39الموقف الصعب الذي تواجهه هذه الشركات الآن، تلك هي الاقتصاديات هنا. الآن بالطبع كما
00:09:44قرأت على الأرجح وشعرت أيضاً إذا كنت لاعباً (Gamer) على سبيل المثال، نحن في نقطة زمنية حيث بسبب
00:09:52كل أشياء الذكاء الاصطناعي التي تحدث، نحن نواجه ندرة كبيرة في الحوسبة وأزمة وأسعاراً مرتفعة للذاكرة
00:10:01وكل ما يتعلق بما تحتاجه نماذج الذكاء الاصطناعي ومراكز بيانات الذكاء الاصطناعي هذه، لذا
00:10:08الذاكرة باهظة الثمن لأن الاستدلال يحتاج إلى الكثير من الذاكرة، إذا حاولت تشغيل النماذج
00:10:13محلياً على نظامك، فأنت تعلم أنك تحتاج إلى الكثير من الذاكرة لذلك، لذا ارتفعت أسعار الذاكرة
00:10:19ولكن ليس فقط الذاكرة، بل أيضاً معدات الشبكات، لأنك بالطبع تشغل كلاً من التدريب
00:10:25والاستدلال ليس على شريحة واحدة، بل على رفوف ومجموعات ضخمة من الرقائق، وكل هذه
00:10:31المجموعات تحتاج إلى اتصالات بين المجموعات وبين الرقائق حتى تتمكن من بناء سوبر
00:10:36وحدة معالجة رسومات (GPU)، إذا جاز التعبير، وهذه المعدات الشبكية مطلوبة بشدة وبالتالي فهي باهظة الثمن، ثم بالطبع
00:10:43لدينا أيضاً الطاقة ومراكز البيانات، نحن بحاجة لكليهما، نحن بحاجة إلى مراكز بيانات لوضع تلك الرقائق، وهذا هو
00:10:52سبب حدوث الكثير من الإنشاءات هناك، ولكن بعد ذلك تحتاج مراكز البيانات هذه إلى طاقة، أليس كذلك؟ وأنت
00:10:58سمعت عن ذلك أيضاً، الطاقة مشكلة كبيرة أخرى، لا يمكنك الحصول عليها من الشبكة، فهي ببساطة غير
00:11:05مصممة لذلك، ليس هناك ما يكفي من الطاقة المتاحة هناك، ولهذا السبب فإن جميع مراكز البيانات الجديدة هذه
00:11:12تنتقل إلى حلول خارج الشبكة، حيث يتم إنتاج الطاقة بجوار مركز البيانات باستخدام توربينات الغاز
00:11:21أو الطاقة النووية، لكن ذلك بالطبع يستغرق وقتاً ويحتاج أيضاً إلى مكونات، وليس هناك
00:11:28عدد لا نهائي من الشركات التي يمكنها بناء محطات الطاقة هذه، وليس هناك عدد لا نهائي من
00:11:35المكونات التي تحتاجها لبناء محطات الطاقة هذه، لذا فكل هذا يحد من كمية
00:11:42الحوسبة التي يمكن أن تصبح متاحة عبر الإنترنت، والتي بدورها مفقودة للاستدلال وبالطبع أيضاً للتدريب.
00:11:48الآن تاريخياً، وأعني بذلك قبل عام أو عامين فقط، كان الحافز لهذه الشركات هو
00:11:54تكريس الكثير من موارد الحوسبة نحو التدريب، لأن ذلك يمنحك
00:12:00نماذج أفضل تتيح لك البقاء في المقدمة أو التقدم في سباق الذكاء الاصطناعي، ولا يزال هذا الحافز موجوداً، ولكن
00:12:07في الوقت الحاضر بالطبع، هناك أيضاً حافز أكبر وأهمية أعلى هنا على جزء الاستدلال
00:12:14لأنه جزء الاستدلال هو الذي يمنحك عملاء، وهو الذي يمنحك الرؤية في السوق
00:12:19لأنه إذا لم يتمكن أحد من استخدام نماذجك، فمن الرائع أن يكون لديك نماذج جيدة، ولكنك
00:12:25لا تكتسب أي حصة في السوق، لذا فأنت بحاجة إلى استدلال أصبح أكثر أهمية بكثير، لذا يجب على الشركات
00:12:30تقسيم موارد الحوسبة الشحيحة وقدرات مراكز البيانات بين هذين الطرفين، وبالطبع
00:12:38خاصة منذ بداية هذا العام، نحن نرى أيضاً تغيرات في سلوك استخدام العملاء.
00:12:45المقال الإخباري الخاص بـ GitHub هنا منفتح حقاً بشأن هذا، سير العمل الوكيل (Agentic workflows) قد
00:12:51غير بشكل جذري متطلبات الحوسبة لـ Copilot، الجلسات طويلة الأمد والمتوازية الآن
00:12:57تستهلك موارد أكثر بكثير مما تم تصميم هيكل الخطة الأصلي لدعمه، وهو نفس الأمر
00:13:04بالطبع بالنسبة لـ Anthropic وOpenAI في الماضي، ومرة أخرى، هذا يعني فقط منذ عام أو نحو ذلك
00:13:10لم تركز هذه الشركات بشكل أساسي، ولكن إلى حد كبير، إلا على جلسات الدردشة العرضية، مستخدم
00:13:20أو عميل يأتي أحياناً ويسأل ChatGPT أو Claude سؤالاً، وبالطبع
00:13:27يمكن أن يكون ذلك عدة مرات في اليوم، لكنه كان مجرد بضعة أسئلة، مجرد بضع إجابات،
00:13:33بضعة أسئلة متابعة، بالطبع رموز أقل بكثير من كل سير العمل الوكيل (Agentic workflows) طويلة الأمد هذه
00:13:39والجلسات البرمجية التي تقوم بتشغيلها، في تلك الجلسات البرمجية أو أياً كانت سير العمل الوكيل التي
00:13:44تقوم بتشغيلها، أنت تحرق مئات الآلاف وملايين الرموز بسرعة، بسرعة كبيرة جداً، أسرع بكثير
00:13:51مما يمكنك فعله بجلسة الدردشة العرضية الخاصة بك فقط. الآن نظراً لحقيقة أن كل
00:13:58النماذج الحديثة التي نتعامل معها هي نماذج تفكير (Thinking models)، عادةً كمية الرموز أصبحت أيضاً
00:14:05أعلى مقارنة بعام أو عامين مضيا، لأن الاستجابة ببساطة تتطلب رموزاً أكثر بسبب عملية
00:14:12التفكير تلك، والتي بالطبع لا تزال رموزاً حتى لو لم ترها في الاستجابة النهائية
00:14:17ربما، ولذلك فإن كمية الرموز المستهلكة أصبحت أكبر بكثير الآن مما كانت عليه قبل عام أو عامين
00:14:24مضيا، مما يعيدنا إلى النقطة التي أصبح فيها الاستدلال أكثر أهمية لأنك تحتاج إلى استدلال أكثر بكثير
00:14:29للتعامل مع كل ذلك التوليد للرموز الذي يحدث، وذلك هو السبب في أن كل
00:14:37هذه النماذج الجديدة باهظة الثمن جداً عند استخدامها من خلال واجهة برمجة التطبيقات، ولكن الأهم من ذلك، لماذا
00:14:43هذه الاشتراكات صعبة جداً على هذه الشركات في الوقت الحالي، لقد قدموا تلك
00:14:49الاشتراكات في الماضي عندما كان يتم استهلاك رموز أقل بكثير، وهم الآن في نقطة
00:14:56حيث مقابل نفس سعر الاشتراك، يستخدم الناس الآن رموزاً أكثر بكثير، هذه هي الصعوبة.
00:15:03الآن خاصة بالنسبة لـ Anthropic على سبيل المثال، يمكنني أن أتخيل أنهم يشعرون بالألم أكثر قليلاً
00:15:09من OpenAI، ليس فقط لأن نماذجهم تبدو أكثر تكلفة في التشغيل إذا ألقيت نظرة فقط
00:15:16على تسعير واجهة برمجة التطبيقات، ولكن أيضاً بالطبع لأن Anthropic تاريخياً، حتى قبل عام،
00:15:22كان لديها المزيد من العملاء من الشركات والمؤسسات، وهو أمر جيد بالنسبة لهم إلى حد ما، فهي قاعدة إيرادات مستقرة
00:15:29وChatGPT أو OpenAI كانت تعتمد أكثر على المستهلكين، كان لديهم المزيد من الناس العاديين، البشر العاديين
00:15:38كعملاء، والآن ينتقلون أيضاً أكثر نحو الأعمال، ولكن تاريخياً بسبب أنهم
00:15:43كان لديهم لحظة ChatGPT، كان لديهم المزيد من الأشخاص العاديين كعملاء، الجانب السلبي لـ Anthropic الآن
00:15:50بالطبع هو أن عملاء الأعمال هؤلاء هم بالضبط العملاء الذين يقومون بتشغيل سير العمل الوكيل (Agentic workflows)
00:15:55أو الذين يميلون إلى تشغيل سير العمل الوكيل، أعني أمك وأباك إذا كانوا
00:16:00يدفعون مقابل ChatGPT على الإطلاق، وهو ما يرجح أنهم لا يفعلون، فهم لا يقومون بتشغيل سير العمل الوكيل
00:16:06ولكن أنت تقوم بذلك، شركتك تقوم بذلك، وهذا بالطبع يجعل الاشتراك أكثر صعوبة بالنسبة لـ
00:16:11Anthropic، كما أتخيل، من OpenAI حيث لا يزال هناك الكثير من الأشخاص العاديين في الاشتراك
00:16:18أود أن أخمّن، بالتأكيد هم يشعرون بالألم أيضاً، وماذا يعني كل هذا الآن؟ ماذا
00:16:24تعني تغييرات كهذه أو تغييرات مثل منشور X هذا حيث تقوم Anthropic بإجراء اختبارات لسحب Cloud Code
00:16:32من الخطط الأرخص، ماذا يعني كل هذا بالنسبة لنا؟ أعتقد أنه واضح جداً، سنرى قيوداً أكثر صرامة في المستقبل
00:16:38وبالتالي بالطبع قد نصل إلى نقطة حيث لا يبدو أن الاشتراكات تستحق العناء بعد الآن
00:16:42وأعتقد أن تلك ستكون النقطة التي سنرى فيها
00:16:48أسعاراً أعلى، ليس من غير المعقول أن نعتقد أن اشتراكات البرمجة هذه أو عموماً
00:16:55اشتراكات الاستخدام الوكيل (Agentic usage) هذه ستكلف آلاف الدولارات شهرياً في مرحلة ما، ليس
00:17:03هذا العام على الأرجح، ولكن في مرحلة ما، لأنه بالطبع قد تبدأ الشركات في مقارنة تكلفة
00:17:10هذه الاشتراكات مقابل تكلفة الموظفين، نعم، وهذا بالطبع ليس خبراً رائعاً، وقد
00:17:17يكون خاطئاً تماماً، ولكنه بالتأكيد ما أعتقد أنه سيحدث، وبالطبع عندما تقوم
00:17:23بهذه المقارنة، هناك مجال كبير لهذه الاشتراكات لتصبح أكثر تكلفة بكثير
00:17:30بوضوح، الاشتراكات بعد ذلك لن تكون للأشخاص العاديين بعد الآن، لذا أعتقد أننا سنرى أيضاً
00:17:35عروض اشتراك جديدة لهم، والتي ببساطة لديها قيود استخدام أكثر صرامة، والتي تكفي
00:17:41لـ ChatGPT ولكنها لا تكفي لسير العمل الوكيل، ولكن للاستخدام المهني، لسير العمل
00:17:47الوكيل، سنرى قيوداً أكثر صرامة وأسعاراً أعلى، لست متأكداً متى لأنك تعلم، الحصة السوقية
00:17:52صحيح؟ لذا ما ذكرته من قبل، ولكن في النهاية سنرى ذلك، لأنه في النهاية
00:17:58كما ذكرنا، OpenAI لديها حوالي 18 شهراً من الميزانية التشغيلية، من المحتمل أنهم يريدون البقاء في العمل
00:18:03ونفس الشيء لـ Anthropic، ولذلك هذا هو ما أعتقد أننا سنراه هنا خلال عام أو نحو ذلك، لا أعرف.