اشتراكات الذكاء الاصطناعي تفقد جاذبيتها

MMaximilian Schwarzmüller
Computing/SoftwareSmall Business/StartupsBusiness News

Transcript

00:00:00في هذا الصباح استيقظت لأرى هذا المنشور على منصة X والذي يذكر أن شركة Anthropic قامت على ما يبدو بسحب
00:00:09ميزة "Cloud Code" من خطة المحترفين (Pro)، بحيث أصبحت بحاجة إلى اشتراكات أكثر تكلفة
00:00:17لكي تتمكن من استخدام Cloud Code أو استخدام اشتراكك داخل Cloud Code.
00:00:22والآن، سارعت شركة Anthropic بالتعليق على هذا الأمر، ذاكرين أن هذا مجرد اختبار صغير
00:00:27يقومون بإجرائه على 2% فقط من المشتركين الجدد في خطة المحترفين.
00:00:32أجد أنه من الغريب إجراء هذا النوع من الاختبارات، وأعتقد أيضاً أن Anthropic كان بإمكانها
00:00:40توقع ما سيحدث عند إجراء اختبار كهذا، والأثر الذي سيتركه هذا الاختبار
00:00:47على صورتهم الذهنية وما قد يعتقده الناس، لأن هذا يتناسب بالطبع مع السردية
00:00:53التي نشهدها بالفعل حيث نحصل على استخدام أقل لاشتراكاتنا، ونرى
00:00:59قيوداً أقوى أو أكثر صرامة، ونرى تدهوراً في أداء النماذج، حيث يبدو أن كل هذه
00:01:08الأمور كانت تحدث خلال الأسبوعين الماضيين. أعني أن Anthropic ضيقت بشكل كبير
00:01:14استخدام اشتراكاتهم خارج نطاق Cloud Code. إذا أردت استخدامه مع Open Cloud
00:01:21على سبيل المثال، فقد قيدوا ذلك، لذا فكل هذا يعطينا صورة أوضح وأكبر.
00:01:28وما يتناسب مع هذه الصورة أو السردية هو المقال الإخباري الذي نشره GitHub قبل بضعة
00:01:37أيام حيث أوضحوا أنهم سيوقفون مؤقتاً الاشتراكات الجديدة في خطط GitHub Copilot Pro،
00:01:43وPro Plus وخطط الطلاب، وأنهم يشددون قيود الاستخدام للخطط الفردية،
00:01:49والأهم من ذلك أن نماذج Opus لم تعد متاحة في خطط Pro، وكل ذلك
00:01:56بالطبع يبدو منطقياً، لكن علينا التعمق قليلاً في اقتصاديات ما يحدث
00:02:02لفهم سبب حدوث ذلك، والأهم من ذلك، ما يعنيه هذا بالنسبة لنا أيضاً في
00:02:07المستقبل. إنه يعني بوضوح أن أيام الاستخدام غير المحدود والدعم المكثف قد ولت، وللفهم
00:02:17علينا فهم اقتصاديات هذه الاشتراكات واستهلاك الرموز (Tokens) إن جاز التعبير، أو
00:02:25استهلاك الرموز، لأنه بالطبع نماذج الاشتراكات هذه التي تقدمها Anthropic، و
00:02:34OpenAI، وGitHub، لا تعمل حقاً إلا إذا كانت غالبية المستخدمين لا يستهلكون فعلياً كل
00:02:43الاستخدام المتاح لهم. هذا هو الحال تقريباً لأي خدمة اشتراك موجودة
00:02:49ليس فقط لاشتراكات الذكاء الاصطناعي هذه. إذا كان لديك اشتراك في Netflix وقضيت 24/7 في مشاهدة
00:02:56Netflix، فمن المحتمل جداً ألا تكون عميلاً مربحاً جداً بالنسبة لهم، لكن معظم الناس
00:03:02لا يفعلون ذلك، وهذه هي الطريقة التي يمكن لهذه الشركات من خلالها تحقيق الربح. هذا صحيح لجميع الاشتراكات
00:03:10بوضوح. الآن يمكننا رؤية السعر الحقيقي أو سعر أقرب إلى السعر الحقيقي لطلبات الذكاء الاصطناعي الخاصة بنا
00:03:19إذا ألقينا نظرة على صفحات أسعار واجهة برمجة التطبيقات (API) الخاصة بهذه الشركات، فهناك على سبيل المثال يمكننا أن نرى
00:03:26أن أحدث نموذج من Anthropic، وهو Claude Opus 3.7، لديه سعر رموز إدخال يبلغ خمسة دولارات لكل
00:03:35مليون رمز، وسعر رموز إخراج يبلغ 25 دولاراً لكل مليون رمز، ويمكننا وضع ذلك
00:03:42في علاقة مع النماذج الأخرى التي لديهم، ويمكننا بالطبع أيضاً وضعه في علاقة مع ما تقدمه OpenAI
00:03:47على سبيل المثال. هناك نرى أن GPT-4o، الذي ربما يستخدمه معظم مستخدمي Codex في الوقت الحالي، لديه
00:03:54سعر إدخال يبلغ دولارين وخمسين سنتاً لكل مليون رمز، أي نصف ما كان لدينا لنموذج Opus 3.7.
00:04:03ولدينا سعر إخراج يبلغ 22.50 دولاراً، أي أقل قليلاً مما رأيناه لنموذج Opus. الآن،
00:04:11من العدل افتراض أن أسعار واجهة برمجة التطبيقات (API) هذه هي أسعار تترك هذه الشركات
00:04:20عند نقطة التعادل أو ربح صغير فيما يتعلق بهامش الربح الإجمالي، لذا إذا نظرنا فقط إلى
00:04:29تكلفة الاستدلال (Inference) تحديداً، يمكننا على الأرجح افتراض أنهم سيحققون ربحاً إذا استخدمت
00:04:36واجهات برمجة التطبيقات الخاصة بهم. الآن بالطبع من المهم أن نفهم أن تكلفة تشغيل نماذج الذكاء الاصطناعي
00:04:43تعتمد في النهاية على عاملين رئيسيين: تدريب نماذج الذكاء الاصطناعي الذي يكلف المال،
00:04:53والاستدلال (Inference) بالطبع، لذا لدينا هذان العاملان اللذان يدخلان في الاعتبار لهذه
00:04:59شركات الذكاء الاصطناعي. الآن بالطبع، تكلفة التدريب هي أمر يحدث لمرة واحدة، أليس كذلك؟ فأنت تدرب نموذجاً مرة واحدة
00:05:06وهذا مكلف للغاية، ولكن من الواضح أنه أمر يحدث لمرة واحدة، وبالطبع تقوم هذه الشركات بعد ذلك
00:05:12بتدريب المزيد والمزيد من النماذج، وهي تكلفة جديدة لمرة واحدة لكل نموذج، ولكن بمجرد تدريب نموذج
00:05:18فإنه لم يعد يتكبد أي تكلفة تدريب باستثناء ربما لجولات الضبط الدقيق (Fine-tuning) الإضافية أو النماذج المشتقة
00:05:25من ذلك النموذج الأساسي، ولكن نعم، الجزء الأكبر من التكلفة يحدث مرة واحدة فقط. الآن بالنسبة للاستدلال
00:05:33بطبيعة الحال الأمر مختلف، فهذه تكلفة مستمرة، وهي لكل طلب في النهاية، لأنه بالطبع
00:05:41الاستدلال هو عملية إنتاج المخرجات الملموسة لمطالبتك، لمهمتك التي ترسلها
00:05:48إلى مزود النموذج، والاستدلال هو بالطبع ما يحدث طوال الوقت عندما تستخدم
00:05:53Cloud Code، عندما تستخدم Codex، ولكن أيضاً بالطبع عندما ترسل مطالبة على ChatGPT أو في
00:05:58أي طريقة أخرى. الآن هذا بالطبع هو المكان الذي تريد فيه على الأقل تحقيق التعادل مع تسعير واجهة برمجة التطبيقات الخاص بك
00:06:07لأنه بخلاف ذلك فهذا يعني أنك تخسر المال في كل طلب تتلقاه، وبينما يمكنك بالطبع
00:06:13أن تفعل ذلك لتنمية حصتك في السوق، وبينما لن أستبعد أن الشركات
00:06:19تفعل ذلك أحياناً، فإن القيام بذلك على المدى الطويل لن يكون قابلاً للاستمرار لأنك ستخرج
00:06:25من العمل. الآن بطبيعة الحال تحتاج أيضاً إلى كسب تكلفة التدريب في مرحلة ما، لذا من الناحية المثالية
00:06:34تمنحك هذه الطلبات الواردة التي يرسلها المستخدمون إليك هامش ربح إجمالي كافياً من
00:06:41تكلفة الاستدلال بحيث يغطي هذا الهامش أيضاً تكلفة التدريب، وتكلفة الموظفين، وما إلى ذلك. لذا بالطبع
00:06:48هذه هي اقتصاديات كيفية تشغيل واستخدام نماذج الذكاء الاصطناعي هذه. الآن كما ذكرنا،
00:06:57تسعير واجهة برمجة التطبيقات هو على الأرجح الجزء الذي لا تخسر فيه هذه الشركات مبالغ طائلة من
00:07:02المال، ولكن بالطبع كمستهلك كعميل، أنت تخسر إذا كنت ستشغل Cloud Code بهذه
00:07:10الأسعار عند الطلب لنموذج Opus، ستدفع أكثر بكثير مما لو كنت تستخدم اشتراكاتهم
00:07:18لأنك بالطبع مع اشتراك Max على سبيل المثال، مقابل 200 دولار فقط، أنت تحصل على
00:07:26الكثير من الاستخدام من هذه الخطة، ستحصل على ملايين الرموز من هذه الخطة، وإذا
00:07:34ألقيت نظرة على ما ستكلفك رموز الإخراج عادةً لكل مليون رمز، يمكنك أن ترى أن
00:07:39عادةً، إذا تجاهلت رموز الإدخال التي يجب ألا تتجاهلها، ولكن إذا تجاهلتها مقابل هذه
00:07:44المائتي دولار، فلا يجب أن تحصل حتى على 10 ملايين رمز إخراج، أليس كذلك؟ لأن مليون رمز
00:07:51يكلفنا 25 دولاراً، لذا يجب أن نحصل فقط على 8 ملايين رمز إخراج، وإذا أخذت في الاعتبار
00:07:56رموز الإدخال فسيكون الأمر أقل من ذلك، ومن الواضح أنه إذا كان لديك أي جلسات طويلة الأمد، إذا كنت تستخدم
00:08:02Cloud Code على سبيل المثال لمدة أسبوع وتتتبع استهلاكك للرموز، فسترى أنك
00:08:08يمكنك تجاوز هذا الحد، وبالتأكيد كان بإمكانك القيام بذلك في الماضي، وهذا يجعل من الواضح لماذا
00:08:14تحاول الشركات نوعاً ما تقييد مقدار الاستخدام الذي يمكنك الحصول عليه من اشتراكاتك
00:08:19ولماذا أعتقد أننا سنرى أسعار اشتراكات أعلى بالتأكيد في المستقبل، ربما بالفعل
00:08:25في المستقبل القريب. الآن بالطبع ليس من السهل جداً على هذه الشركات زيادة أسعارها
00:08:30لأن الحصة السوقية، من الواضح أن جميع هذه الشركات تريد الاستحواذ بقوة على الحصة السوقية
00:08:37والسبب هو أنه إذا كنت الشركة الرئيسية التي تم ترسيخها كمزود لوكيل البرمجة في
00:08:45الكثير من الشركات، والكثير من المؤسسات، فمن المحتمل أن يدفعوا أسعار اشتراك أعلى
00:08:51في المستقبل، لذا فأنت لا تريد البدء في زيادة أسعارك في وقت مبكر جداً لأن ذلك قد
00:08:57يدفع بعض عملائك إلى منافسيك، وهو أمر لا تريده بالطبع. من ناحية أخرى
00:09:02أنت لا تريد الإفلاس، أعني على سبيل المثال، OpenAI جمعت مؤخراً 122 مليار دولار
00:09:09لتسريع المرحلة التالية من الذكاء الاصطناعي، ويمكنك قراءة أن هذا سيعطيهم فقط
00:09:17حوالي 18 شهراً من الميزانية التشغيلية (Runway)، لذا 18 شهراً حتى يحتاجوا إلى جمع أموال مرة أخرى، فمن الواضح أنك لا تستطيع
00:09:26الاستمرار في دعم كل هذا الاستخدام إلى الأبد، لأنك إذا خرجت من العمل، فإن جميع عملائك
00:09:32سيذهبون إلى منافسيك على أي حال، لذا هناك مقايضة هنا، وهذا بالطبع هو بالضبط
00:09:39الموقف الصعب الذي تواجهه هذه الشركات الآن، تلك هي الاقتصاديات هنا. الآن بالطبع كما
00:09:44قرأت على الأرجح وشعرت أيضاً إذا كنت لاعباً (Gamer) على سبيل المثال، نحن في نقطة زمنية حيث بسبب
00:09:52كل أشياء الذكاء الاصطناعي التي تحدث، نحن نواجه ندرة كبيرة في الحوسبة وأزمة وأسعاراً مرتفعة للذاكرة
00:10:01وكل ما يتعلق بما تحتاجه نماذج الذكاء الاصطناعي ومراكز بيانات الذكاء الاصطناعي هذه، لذا
00:10:08الذاكرة باهظة الثمن لأن الاستدلال يحتاج إلى الكثير من الذاكرة، إذا حاولت تشغيل النماذج
00:10:13محلياً على نظامك، فأنت تعلم أنك تحتاج إلى الكثير من الذاكرة لذلك، لذا ارتفعت أسعار الذاكرة
00:10:19ولكن ليس فقط الذاكرة، بل أيضاً معدات الشبكات، لأنك بالطبع تشغل كلاً من التدريب
00:10:25والاستدلال ليس على شريحة واحدة، بل على رفوف ومجموعات ضخمة من الرقائق، وكل هذه
00:10:31المجموعات تحتاج إلى اتصالات بين المجموعات وبين الرقائق حتى تتمكن من بناء سوبر
00:10:36وحدة معالجة رسومات (GPU)، إذا جاز التعبير، وهذه المعدات الشبكية مطلوبة بشدة وبالتالي فهي باهظة الثمن، ثم بالطبع
00:10:43لدينا أيضاً الطاقة ومراكز البيانات، نحن بحاجة لكليهما، نحن بحاجة إلى مراكز بيانات لوضع تلك الرقائق، وهذا هو
00:10:52سبب حدوث الكثير من الإنشاءات هناك، ولكن بعد ذلك تحتاج مراكز البيانات هذه إلى طاقة، أليس كذلك؟ وأنت
00:10:58سمعت عن ذلك أيضاً، الطاقة مشكلة كبيرة أخرى، لا يمكنك الحصول عليها من الشبكة، فهي ببساطة غير
00:11:05مصممة لذلك، ليس هناك ما يكفي من الطاقة المتاحة هناك، ولهذا السبب فإن جميع مراكز البيانات الجديدة هذه
00:11:12تنتقل إلى حلول خارج الشبكة، حيث يتم إنتاج الطاقة بجوار مركز البيانات باستخدام توربينات الغاز
00:11:21أو الطاقة النووية، لكن ذلك بالطبع يستغرق وقتاً ويحتاج أيضاً إلى مكونات، وليس هناك
00:11:28عدد لا نهائي من الشركات التي يمكنها بناء محطات الطاقة هذه، وليس هناك عدد لا نهائي من
00:11:35المكونات التي تحتاجها لبناء محطات الطاقة هذه، لذا فكل هذا يحد من كمية
00:11:42الحوسبة التي يمكن أن تصبح متاحة عبر الإنترنت، والتي بدورها مفقودة للاستدلال وبالطبع أيضاً للتدريب.
00:11:48الآن تاريخياً، وأعني بذلك قبل عام أو عامين فقط، كان الحافز لهذه الشركات هو
00:11:54تكريس الكثير من موارد الحوسبة نحو التدريب، لأن ذلك يمنحك
00:12:00نماذج أفضل تتيح لك البقاء في المقدمة أو التقدم في سباق الذكاء الاصطناعي، ولا يزال هذا الحافز موجوداً، ولكن
00:12:07في الوقت الحاضر بالطبع، هناك أيضاً حافز أكبر وأهمية أعلى هنا على جزء الاستدلال
00:12:14لأنه جزء الاستدلال هو الذي يمنحك عملاء، وهو الذي يمنحك الرؤية في السوق
00:12:19لأنه إذا لم يتمكن أحد من استخدام نماذجك، فمن الرائع أن يكون لديك نماذج جيدة، ولكنك
00:12:25لا تكتسب أي حصة في السوق، لذا فأنت بحاجة إلى استدلال أصبح أكثر أهمية بكثير، لذا يجب على الشركات
00:12:30تقسيم موارد الحوسبة الشحيحة وقدرات مراكز البيانات بين هذين الطرفين، وبالطبع
00:12:38خاصة منذ بداية هذا العام، نحن نرى أيضاً تغيرات في سلوك استخدام العملاء.
00:12:45المقال الإخباري الخاص بـ GitHub هنا منفتح حقاً بشأن هذا، سير العمل الوكيل (Agentic workflows) قد
00:12:51غير بشكل جذري متطلبات الحوسبة لـ Copilot، الجلسات طويلة الأمد والمتوازية الآن
00:12:57تستهلك موارد أكثر بكثير مما تم تصميم هيكل الخطة الأصلي لدعمه، وهو نفس الأمر
00:13:04بالطبع بالنسبة لـ Anthropic وOpenAI في الماضي، ومرة أخرى، هذا يعني فقط منذ عام أو نحو ذلك
00:13:10لم تركز هذه الشركات بشكل أساسي، ولكن إلى حد كبير، إلا على جلسات الدردشة العرضية، مستخدم
00:13:20أو عميل يأتي أحياناً ويسأل ChatGPT أو Claude سؤالاً، وبالطبع
00:13:27يمكن أن يكون ذلك عدة مرات في اليوم، لكنه كان مجرد بضعة أسئلة، مجرد بضع إجابات،
00:13:33بضعة أسئلة متابعة، بالطبع رموز أقل بكثير من كل سير العمل الوكيل (Agentic workflows) طويلة الأمد هذه
00:13:39والجلسات البرمجية التي تقوم بتشغيلها، في تلك الجلسات البرمجية أو أياً كانت سير العمل الوكيل التي
00:13:44تقوم بتشغيلها، أنت تحرق مئات الآلاف وملايين الرموز بسرعة، بسرعة كبيرة جداً، أسرع بكثير
00:13:51مما يمكنك فعله بجلسة الدردشة العرضية الخاصة بك فقط. الآن نظراً لحقيقة أن كل
00:13:58النماذج الحديثة التي نتعامل معها هي نماذج تفكير (Thinking models)، عادةً كمية الرموز أصبحت أيضاً
00:14:05أعلى مقارنة بعام أو عامين مضيا، لأن الاستجابة ببساطة تتطلب رموزاً أكثر بسبب عملية
00:14:12التفكير تلك، والتي بالطبع لا تزال رموزاً حتى لو لم ترها في الاستجابة النهائية
00:14:17ربما، ولذلك فإن كمية الرموز المستهلكة أصبحت أكبر بكثير الآن مما كانت عليه قبل عام أو عامين
00:14:24مضيا، مما يعيدنا إلى النقطة التي أصبح فيها الاستدلال أكثر أهمية لأنك تحتاج إلى استدلال أكثر بكثير
00:14:29للتعامل مع كل ذلك التوليد للرموز الذي يحدث، وذلك هو السبب في أن كل
00:14:37هذه النماذج الجديدة باهظة الثمن جداً عند استخدامها من خلال واجهة برمجة التطبيقات، ولكن الأهم من ذلك، لماذا
00:14:43هذه الاشتراكات صعبة جداً على هذه الشركات في الوقت الحالي، لقد قدموا تلك
00:14:49الاشتراكات في الماضي عندما كان يتم استهلاك رموز أقل بكثير، وهم الآن في نقطة
00:14:56حيث مقابل نفس سعر الاشتراك، يستخدم الناس الآن رموزاً أكثر بكثير، هذه هي الصعوبة.
00:15:03الآن خاصة بالنسبة لـ Anthropic على سبيل المثال، يمكنني أن أتخيل أنهم يشعرون بالألم أكثر قليلاً
00:15:09من OpenAI، ليس فقط لأن نماذجهم تبدو أكثر تكلفة في التشغيل إذا ألقيت نظرة فقط
00:15:16على تسعير واجهة برمجة التطبيقات، ولكن أيضاً بالطبع لأن Anthropic تاريخياً، حتى قبل عام،
00:15:22كان لديها المزيد من العملاء من الشركات والمؤسسات، وهو أمر جيد بالنسبة لهم إلى حد ما، فهي قاعدة إيرادات مستقرة
00:15:29وChatGPT أو OpenAI كانت تعتمد أكثر على المستهلكين، كان لديهم المزيد من الناس العاديين، البشر العاديين
00:15:38كعملاء، والآن ينتقلون أيضاً أكثر نحو الأعمال، ولكن تاريخياً بسبب أنهم
00:15:43كان لديهم لحظة ChatGPT، كان لديهم المزيد من الأشخاص العاديين كعملاء، الجانب السلبي لـ Anthropic الآن
00:15:50بالطبع هو أن عملاء الأعمال هؤلاء هم بالضبط العملاء الذين يقومون بتشغيل سير العمل الوكيل (Agentic workflows)
00:15:55أو الذين يميلون إلى تشغيل سير العمل الوكيل، أعني أمك وأباك إذا كانوا
00:16:00يدفعون مقابل ChatGPT على الإطلاق، وهو ما يرجح أنهم لا يفعلون، فهم لا يقومون بتشغيل سير العمل الوكيل
00:16:06ولكن أنت تقوم بذلك، شركتك تقوم بذلك، وهذا بالطبع يجعل الاشتراك أكثر صعوبة بالنسبة لـ
00:16:11Anthropic، كما أتخيل، من OpenAI حيث لا يزال هناك الكثير من الأشخاص العاديين في الاشتراك
00:16:18أود أن أخمّن، بالتأكيد هم يشعرون بالألم أيضاً، وماذا يعني كل هذا الآن؟ ماذا
00:16:24تعني تغييرات كهذه أو تغييرات مثل منشور X هذا حيث تقوم Anthropic بإجراء اختبارات لسحب Cloud Code
00:16:32من الخطط الأرخص، ماذا يعني كل هذا بالنسبة لنا؟ أعتقد أنه واضح جداً، سنرى قيوداً أكثر صرامة في المستقبل
00:16:38وبالتالي بالطبع قد نصل إلى نقطة حيث لا يبدو أن الاشتراكات تستحق العناء بعد الآن
00:16:42وأعتقد أن تلك ستكون النقطة التي سنرى فيها
00:16:48أسعاراً أعلى، ليس من غير المعقول أن نعتقد أن اشتراكات البرمجة هذه أو عموماً
00:16:55اشتراكات الاستخدام الوكيل (Agentic usage) هذه ستكلف آلاف الدولارات شهرياً في مرحلة ما، ليس
00:17:03هذا العام على الأرجح، ولكن في مرحلة ما، لأنه بالطبع قد تبدأ الشركات في مقارنة تكلفة
00:17:10هذه الاشتراكات مقابل تكلفة الموظفين، نعم، وهذا بالطبع ليس خبراً رائعاً، وقد
00:17:17يكون خاطئاً تماماً، ولكنه بالتأكيد ما أعتقد أنه سيحدث، وبالطبع عندما تقوم
00:17:23بهذه المقارنة، هناك مجال كبير لهذه الاشتراكات لتصبح أكثر تكلفة بكثير
00:17:30بوضوح، الاشتراكات بعد ذلك لن تكون للأشخاص العاديين بعد الآن، لذا أعتقد أننا سنرى أيضاً
00:17:35عروض اشتراك جديدة لهم، والتي ببساطة لديها قيود استخدام أكثر صرامة، والتي تكفي
00:17:41لـ ChatGPT ولكنها لا تكفي لسير العمل الوكيل، ولكن للاستخدام المهني، لسير العمل
00:17:47الوكيل، سنرى قيوداً أكثر صرامة وأسعاراً أعلى، لست متأكداً متى لأنك تعلم، الحصة السوقية
00:17:52صحيح؟ لذا ما ذكرته من قبل، ولكن في النهاية سنرى ذلك، لأنه في النهاية
00:17:58كما ذكرنا، OpenAI لديها حوالي 18 شهراً من الميزانية التشغيلية، من المحتمل أنهم يريدون البقاء في العمل
00:18:03ونفس الشيء لـ Anthropic، ولذلك هذا هو ما أعتقد أننا سنراه هنا خلال عام أو نحو ذلك، لا أعرف.

Key Takeaway

تتجه نماذج اشتراكات الذكاء الاصطناعي نحو فرض قيود أكثر صرامة ورفع الأسعار، نتيجة التكلفة العالية للاستدلال في ظل التحول نحو سير العمل الوكيل (Agentic workflows) الذي يستهلك موارد حوسبة أكبر بكثير من الاستخدام العرضي.

Highlights

قامت شركة Anthropic بإجراء اختبار على 2% من مشتركي خطة Pro لتقييد ميزة Cloud Code، مما يفرض قيوداً أكبر على الاستخدام.

أوقف GitHub مؤقتاً الاشتراكات الجديدة في خطط Copilot Pro وPro Plus، مع إزالة نماذج Opus من هذه الخطط.

تبلغ تكلفة نموذج Claude 3.7 Opus عبر واجهة برمجة التطبيقات (API) 5 دولارات لكل مليون رمز إدخال و25 دولاراً لكل مليون رمز إخراج.

تعتمد ربحية شركات الذكاء الاصطناعي حالياً على عدم استهلاك غالبية المستخدمين للحد الأقصى المتاح من اشتراكاتهم.

تتطلب سير العمل الوكيل (Agentic workflows) استهلاكاً للرموز أسرع بكثير من جلسات الدردشة العرضية التقليدية التي بُنيت عليها نماذج الاشتراك الأصلية.

تُقدّر الميزانية التشغيلية لشركة OpenAI بنحو 18 شهراً، مما يضغط على الشركات لزيادة الإيرادات أو رفع أسعار الاشتراكات.

تواجه مراكز البيانات ندرة في الطاقة ومعدات الشبكات، مما يحد من كمية الحوسبة المتاحة للاستدلال والتدريب.

Timeline

تدهور مزايا الاشتراكات

  • اختبرت Anthropic تقييد ميزة Cloud Code لخطط المحترفين.
  • أوقف GitHub الاشتراكات الجديدة في خطط Copilot Pro ونقل نماذج Opus خارج الخطط الفردية.
  • تتزايد قيود الاستخدام وتدهور أداء النماذج في الاشتراكات الحالية.

بدأت شركات الذكاء الاصطناعي في تضييق الوصول إلى الميزات المتقدمة وتقليل الاعتماد على النماذج القوية في الخطط الفردية. هذه الإجراءات تأتي استجابةً للضغط على الموارد وتكلفة التشغيل، مما يشير إلى نهاية عصر الاستخدام غير المحدود والدعم المكثف للمشتركين.

اقتصاديات النماذج وتكاليف الاستدلال

  • تعتمد الربحية على عدم استهلاك المستخدمين لكل الرموز المتاحة في اشتراكاتهم.
  • تبلغ تكلفة مخرجات Claude 3.7 Opus عبر واجهة البرمجة 25 دولاراً لكل مليون رمز.
  • تعتبر تكلفة الاستدلال تكلفة مستمرة لكل طلب، بينما تكلفة التدريب هي تكلفة لمرة واحدة.

تعمل نماذج الاشتراكات بنفس آلية خدمات الترفيه، حيث تعتمد على وجود فجوة بين ما يدفعه المشترك وما يستهلكه فعلياً. عند مقارنة تكلفة الاستدلال عبر واجهة برمجة التطبيقات مع سعر الاشتراك، يتضح أن الاستخدام المكثف، خاصة مع النماذج الحديثة، يجعل المشتركين "غير مربحين" للشركات.

تحديات الحوسبة والنمو

  • تتطلب عمليات الذكاء الاصطناعي موارد ضخمة من الذاكرة، طاقة الكهرباء، ومعدات الشبكات.
  • تواجه مراكز البيانات أزمات طاقة تدفعها نحو حلول خارج الشبكة مثل توربينات الغاز.
  • تتوزع موارد الحوسبة المحدودة بين تكاليف التدريب المستمر والاستدلال الموجه للعملاء.

تتطلب النماذج الحديثة بنية تحتية معقدة ومكلفة، حيث ترتفع أسعار الذاكرة ومعدات الاتصال بين الشرائح. بالإضافة إلى ذلك، تواجه مراكز البيانات قيوداً في توفر الطاقة، مما يفرض قيوداً مادية على كمية الحوسبة التي يمكن توفيرها للاستدلال والتدريب.

تحول سلوك المستخدم والآفاق المستقبلية

  • غيرت سير العمل الوكيل (Agentic workflows) متطلبات الحوسبة مقارنة بجلسات الدردشة العرضية.
  • تستهلك نماذج التفكير (Thinking models) كميات أكبر من الرموز مقارنة بالنماذج القديمة.
  • من المرجح أن ترتفع أسعار الاشتراكات لتصل إلى آلاف الدولارات للمستخدمين المحترفين في المستقبل.

أدى الانتقال من الدردشة البسيطة إلى سير العمل الوكيل إلى زيادة استهلاك الرموز بشكل كبير، مما وضع ضغوطاً مالية على الشركات. في ظل احتياج الشركات للاستدامة المالية، من المتوقع فرض قيود صارمة على الاستخدام المهني وتطوير فئات اشتراكات بأسعار مرتفعة تتناسب مع القيمة البرمجية المقدمة.

Community Posts

View all posts