بعد التسبب في صدمة مع نموذج الذكاء الاصطناعى مع إمكانات تنافس إبداعات Google و Openai ، تواجه Deepseek الصين أسئلة حول ما إذا كانت مطالباتها الجريئة تقف إلى الوجه.
إن إعلان بدء التشغيل المقيم في Hangzhou بأنه طور R1 بتكلفة من تكلفة أحدث نماذج وادي السيليكون على الفور ، ودعت على الفور افتراضات التشكيك حول هيمنة الولايات المتحدة في الذكاء الاصطناعي وتقييمات السوق العليا في أهم شركات التكنولوجيا.
ومع ذلك ، فإن بعض المتشككين قد تحدوا من رواية ديبسيك للعمل على ميزانية متوقعة ، مما يشير إلى أن الشركة من المحتمل أن تمكنت من الوصول إلى رقائق أكثر تقدماً وتمويلًا أكثر مما اعترفت.
“إنه سؤال مفتوح إلى حد كبير ما إذا كان يمكن اتخاذ مطالبات Deepseek بالقيمة الاسمية. وقال بيدرو دومينغوس ، أستاذ فخري في علوم الكمبيوتر وهندسته بجامعة واشنطن ، إن مجتمع الذكاء الاصطناعي سيحفر فيها وسنكتشف ذلك.
وأضاف دومينغوس: “من المعقول بالنسبة لي أن يتمكنوا من تدريب نموذج بمبلغ 6 ملايين دولار”.
“لكن من الممكن أيضًا أن تكون هذه مجرد تكلفة صقل نماذج ما بعد المعالجة التي تكلفها أكثر من ذلك ، ولم يكن من الممكن أن يفعل Deepseek ذلك دون البناء على نماذج أكثر تكلفة من قبل الآخرين.”
في ورقة بحثية صدرت الأسبوع الماضي ، قال فريق Deepseek Development إنهم استخدموا 2000 NVIDIA H800 GPU – وهي شريحة أقل تقدماً مصممة أصلاً للامتثال لضوابط التصدير الأمريكية – وأنفقت 5.6 مليون دولار لتدريب الطراز التأسيسي لـ R1 ، V3.
صرح Sam Altman ، الرئيس التنفيذي لشركة Openai ، أنه يكلف أكثر من 100 مليون دولار لتدريب chatbot GPT-4 ، بينما قدّر المحللون أن النموذج استخدم ما يصل إلى 25000 من وحدات معالجة الرسومات H100 المتقدمة.
إن إعلان ديبسيك ، الذي تأسست في أواخر عام 2023 من قبل رائد الأعمال التسلسلي ليانغ وينفينج ، قد رفع الاعتقاد على نطاق واسع بأن الشركات التي تسعى إلى أن تكون في طليعة الذكاء الاصطناعي تحتاج إلى استثمار مليارات الدولارات في مراكز البيانات وكميات كبيرة من الرقائق الراقية المكلفة.
كما أثار تساؤلات حول فعالية جهود واشنطن لتقييد قطاع الذكاء الاصطناعي في الصين من خلال حظر صادرات الرقائق الأكثر تقدماً.
أسهم NVIDIA ومقرها كاليفورنيا ، والتي تحمل ما يقرب من الاحتكاك لتزويد وحدات معالجة الرسومات التي تولد من الذكاء الاصطناعي ، يوم الاثنين ، انخفضت يوم الاثنين بنسبة 17 في المائة ، مما أدى إلى مسح ما يقرب من 593 مليار دولار من القيمة السوقية لشركة رقائق العملاق-وهو رقم مماثل للمنتج المحلي الإجمالي (الناتج المحلي الإجمالي (الناتج المحلي الإجمالي ( ) من السويد.
في حين أن هناك إجماعًا واسعًا على أن إطلاق Deepseek لـ R1 على الأقل يمثل إنجازًا كبيرًا ، فقد حذر بعض المراقبين البارزين من أخذ مطالباتها بالقيمة الاسمية.
Palmer Luckey ، مؤسس شركة الواقع الظاهري Oculus VR ، يوم الأربعاء وصفت بميزانية Deepseek بأنها “وهمية” واتهم الكثير من “البلهاء المفيدين” بالخروج من أجل “الدعاية الصينية”.
وقال لوكي في منشور على X.
“أمريكا هي سرير خصبة لـ Psyops مثل هذا لأن جهازنا الإعلامي يكره شركات التكنولوجيا لدينا ويريد أن يرى الرئيس ترامب فشل”.
في مقابلة مع CNBC الأسبوع الماضي ، ألقت Alexandr Wang ، الرئيس التنفيذي لشركة Scale AI ، شكوكًا على حساب Deepseek ، قائلاً إنه “فهمه” يمكنه الوصول إلى 50000 من رقائق H100 المتقدمة التي لا يمكن التحدث عنها بسبب التصدير الأمريكي الضوابط.
لم يقدم وانغ دليلًا على ادعائه.
أيد الملياردير الفني إيلون موسك ، أحد أقرب المقربين للرئيس الأمريكي دونالد ترامب ، متشككين في ديبسيك ، وكتب “من الواضح” على X تحت وظيفة حول مطالبة وانغ.
لم يستجب Deepseek لطلبات التعليق.
لكن زيهان وانغ ، مرشح الدكتوراه الذي عمل على نموذج في وقت سابق ديبسيك ، عاد إلى منتقدي الشركات الناشئة ، قائلاً: “الحديث رخيص”.
“من السهل الانتقاد” ، قال في X رداً على أسئلة من الجزيرة حول الاقتراح بأنه لا ينبغي أن تؤخذ مطالبات ديبسيك بالقيمة الاسمية.
وقال زيهان وانغ: “إذا كانوا يقضون وقتًا أطول في العمل على الكود وإعادة إنتاج فكرة Deepseek بأنفسهم ، فسيكون ذلك أفضل من التحدث على الورقة”.
لم يرد مباشرة على سؤال حول ما إذا كان يعتقد أن ديبسيك قد أنفق أقل من 6 ملايين دولار واستخدم رقائق أقل تقدما لتدريب النموذج الأساسي لـ R1.
في مقابلة عام 2023 مع أمواج وسائل الإعلام الصينية ، قال ليانغ إن شركته قد قامت بتخزين 10،000 من رقائق A100 في NVIDIA-والتي يبلغ عمرها أكبر من H800-قبل أن يحظر إدارة رئيس الولايات المتحدة آنذاك تصديرها.
يشير مستخدمو R1 أيضًا إلى القيود التي يواجهها بسبب أصولها في الصين ، وهي الرقابة على المواضيع التي تعتبرها بكين حساسة ، بما في ذلك مذبحة عام 1989 في ميدان تيانانمن وحالة تايوان.
في علامة على أن الذعر الأولي حول تأثير ديبسيك المحتمل على قطاع التكنولوجيا الأمريكي قد بدأ في التراجع ، انتعش سعر سهم Nvidia يوم الثلاثاء حوالي 9 في المائة.
ارتفع NASDAQ 100 في التكنولوجيا بنسبة 1.59 في المئة بعد انخفاض أكثر من 3 في المئة في اليوم السابق.
قال تيم ميلر ، الأستاذ المتخصص في الذكاء الاصطناعي بجامعة كوينزلاند ، إنه كان من الصعب تحديد مقدار المخزون الذي ينبغي وضعه في مطالبات ديبسيك.
وقال ميلر لصحيفة الجزيرة: “النموذج نفسه يعطي بعض التفاصيل حول كيفية عمله ، لكن تكاليف التغييرات الرئيسية التي يزعمون – أنني أفهمها – لا تظهر في النموذج نفسه كثيرًا”.
قال ميلر إنه لم ير أي “أجراس إنذار” ولكن هناك حجج معقولة على حد سواء مع الوثوق في ورقة البحث.
“الاختراق أمر لا يصدق – تقريبا” جيد جدا ليكون حقيقيا “. وقال ميلر: “إن انهيار التكاليف غير واضح”.
من ناحية أخرى ، قال إن الاختراقات تحدث من حين لآخر في علوم الكمبيوتر.
وقال ميلر: “هذه النماذج الضخمة هي ظاهرة حديثة للغاية ، لذلك لا بد من العثور على الكفاءة”.
“بالنظر إلى أنهم يعلمون أن هذا سيكون واضحًا بشكل معقول للآخرين لإعادة إنتاجه ، فقد عرفوا أنهم سيبدوون أغبياء إذا كانوا الجميع. هناك فريق ملتزم بالفعل بمحاولة إعادة إنتاج العمل “.
انخفاض التكاليف
وقال لوكاس هانسن ، المؤسس المشارك لـ Civai غير الربحية ، في حين أنه كان من الصعب معرفة ما إذا كان Deepseek قد تحايل على ضوابط التصدير الأمريكية ، فإن ميزانية التدريب المدعومة من شركة Startup المشار إليها ، والتي تعادل تقريبًا GPT-4 من Openai ، وليس R1 نفسها.
“انتهى GPT-4 من التدريب في أواخر عام 2022. كان هناك الكثير من تحسينات الخوارزمية والأجهزة منذ عام 2022 ، مما دفع تكلفة تدريب نموذج فئة GPT-4. حدث موقف مماثل لـ GPT-2. في ذلك الوقت ، كان الأمر بمثابة تعهد خطير للتدريب ، ولكن يمكنك الآن تدريبه مقابل 20 دولارًا في 90 دقيقة “.
وأضاف هانسن: “صنع Deepseek R1 من خلال أخذ نموذج أساسي – في هذه الحالة ، V3 – وتطبيق بعض الأساليب الذكية لتعليم هذا النموذج الأساسي للتفكير بعناية أكثر”.
“عملية التدريس هذه رخيصة نسبيًا بالمقارنة مع سعر تدريب النموذج الأساسي. الآن بعد أن نشر Deepseek تفاصيل حول كيفية الحصول على نموذج أساسي في نموذج التفكير ، سنرى عددًا كبيرًا من نماذج التفكير الجديدة. “