لماذا يمكن أن يغير ديبسيك ما يؤمن به وادي السيليكون حول الذكاء الاصطناعي

إن اختراق الذكاء الاصطناعي الذي يرسل موجات صدمة من خلال أسواق الأسهم ، وتوصل عمالقة وادي السيليكون ، وتوليد أنفاس إلى نهاية الهيمنة التكنولوجية لأمريكا ، بلقب متكافئ ومتواضع: “تحفيز قدرة التفكير في LLMS عبر التعلم التعزيز”.
الورقة المكونة من 22 صفحة ، التي صدرت الأسبوع الماضي من قِبل شركة صينية صينية من الذكاء الاصطناعي تسمى Deepseek ، لم تنفجر على الفور أجراس الإنذار. استغرق الأمر بضعة أيام للباحثين لهضم مطالبات الورقة ، والآثار المترتبة على ما وصفه. أنشأت الشركة نموذجًا جديدًا لمنظمة العفو الدولية يسمى Deepseek-R1 ، تم بناؤه من قبل فريق من الباحثين الذين ادعوا أنهم استخدموا عددًا متواضعًا من رقائق الذكاء الاصطناعى من الدرجة الثانية لتتناسب مع أداء نماذج AI الأمريكية الرائدة في جزء صغير من التكلفة.
قال Deepseek إنه قد فعل ذلك باستخدام الهندسة الذكية لاستبدال قوة الحوسبة الخام. وقد فعلت ذلك في الصين ، وهو بلد اعتقد العديد من الخبراء أنه في المركز الثاني البعيد في سباق الذكاء الاصطناعى العالمي.
كان رد فعل بعض مراقبي الصناعة في البداية على اختراق ديبسيك مع الكفر. بالتأكيد ، اعتقدوا أن Deepseek قد خدع لتحقيق نتائج R1 ، أو قاموا بتخليص أعدادهم لجعل نموذجهم يبدو أكثر إثارة للإعجاب مما كان عليه. ربما كانت الحكومة الصينية تروج للدعاية لتقويض سرد هيمنة الذكاء الاصطناعي الأمريكي. ربما كان Deepseek يخفي مجموعة من رقائق Nvidia H100 غير المشروعة ، محظورة بموجب ضوابط التصدير الأمريكية ، والكذب عليها. ربما كان R1 في الواقع مجرد إعادة بيع ذكية لنماذج الذكاء الاصطناعى الأمريكية التي لم تمثل الكثير في طريق التقدم الحقيقي.
في نهاية المطاف ، نظرًا لأن المزيد من الأشخاص حفروا تفاصيل Deepseek-R1-والتي ، على عكس معظم طرز الذكاء الاصطناعى ، تم إصدارها كبرنامج مفتوح المصدر ، مما يسمح للغرباء بفحص أعماله الداخلية بشكل أوثق-تحولت شكوكهم إلى القلق.
وفي أواخر الأسبوع الماضي ، عندما بدأ الكثير من الأميركيين في استخدام نماذج Deepseek لأنفسهم ، وضرب تطبيق Deepseek Mobile إلى المركز الأول في متجر تطبيقات Apple ، فقد كان يميل إلى الذعر الكامل.
أنا متشكك في أكثر ما يأخذها دراماتيكية التي رأيتها على مدار الأيام القليلة الماضية – مثل المطالبة التي قدمها مستثمر واحد من سيليكون فالي ، أن ديبسيك هي مؤامرة معقدة من قبل الحكومة الصينية لتدمير صناعة التكنولوجيا الأمريكية. أعتقد أيضًا أنه من المعقول أن تكون ميزانية الشركة المفرطة في الشركة مبالغ فيها بشكل سيء ، أو أنها تعرضت للخطر على التطورات التي قدمتها شركات الذكاء الاصطناعى الأمريكيين بطرق لم يتم الكشف عنها.
لكنني أعتقد أن اختراق R1 الخاص بـ Deepseek كان حقيقيًا. استنادًا إلى المحادثات التي أجريتها مع المطلعين على الصناعة ، وخبراء يتجولون لمدة أسبوع يتجولون ويختبرون نتائج الورقة لأنفسهم ، يبدو أنه يشكك في العديد من الافتراضات الرئيسية التي تثيرها صناعة التكنولوجيا الأمريكية.
الأول هو الافتراض بأنه من أجل بناء نماذج من الذكاء الاصطناعى المتطور ، تحتاج إلى إنفاق مبالغ ضخمة من المال على رقائق البيانات القوية ومراكز البيانات.
من الصعب المبالغة في المبالغة في مدى تأسيس هذه العقيدة. لقد أنفقت شركات مثل Microsoft و Meta و Google بالفعل عشرات المليارات من الدولارات في بناء البنية التحتية التي اعتقدوا أنها ضرورية لبناء وتشغيل نماذج الذكاء الاصطناعي من الجيل التالي. يخططون لإنفاق عشرات المليارات – أو ، في حالة Openai ، ما يصل إلى 500 مليار دولار من خلال مشروع مشترك مع Oracle و SoftBank تم الإعلان عنه الأسبوع الماضي.
يبدو أن ديبسيك قد أمضى جزءًا صغيرًا من هذا المبنى R1. لا نعرف التكلفة الدقيقة ، وهناك الكثير من التحذيرات التي يجب القيام بها حول الأرقام التي أصدروها حتى الآن. من المؤكد أنه أعلى من 5.5 مليون دولار ، والرقم الذي تدعي الشركة أنها أنفقت تدريب نموذج سابق.
ولكن حتى إذا تكلف R1 10 مرات لتدريب أكثر من مطالبات Deepseek ، وحتى إذا كنت تعامل في التكاليف الأخرى ، فقد تستبعدها ، مثل رواتب المهندسين أو تكاليف إجراء الأبحاث الأساسية ، فسيظل الأمر أقل من حجم الذكاء الاصطناعي الشركات تنفق على تطوير نماذجها الأكثر قدرة.
الاستنتاج الواضح للرسم ليس أن عمالقة التكنولوجيا الأمريكية يضيعون أموالهم. لا يزال من المفيد تشغيل نماذج AI قوية بمجرد تدريبها ، وهناك أسباب للاعتقاد بأن إنفاق مئات المليارات من الدولارات سيظل منطقيًا على شركات مثل Openai و Google ، والتي يمكن أن تدفع غالياً للبقاء على رأسه العبوة.
لكن تقدم Deepseek في تحديات التكلفة ، فإن السرد “الأكبر” أفضل “دفع سباق AI Arms في السنوات الأخيرة من خلال إظهار أن النماذج الصغيرة نسبيًا ، عندما يتم تدريبها بشكل صحيح ، يمكن أن تتجاوز أو يتجاوز أداء النماذج الأكبر بكثير.
وهذا بدوره يعني أن شركات الذكاء الاصطناعى قد تكون قادرة على تحقيق قدرات قوية للغاية مع استثمار أقل بكثير مما كان يعتقد سابقًا. ويشير إلى أننا قد نرى قريبًا طوفان من الاستثمار في الشركات الناشئة الأصغر من الذكاء الاصطناعى ، والمزيد من المنافسة على عمالقة وادي السيليكون. (والتي ، بسبب التكاليف الهائلة لتدريب نماذجها ، كانت في الغالب تتنافس مع بعضها البعض حتى الآن.)
هناك أسباب أخرى أكثر تقنية لأن كل شخص في وادي السيليكون ينتبهون إلى Deepseek. في ورقة البحث ، تكشف الشركة عن بعض التفاصيل حول كيفية بناء R1 بالفعل ، والتي تشمل بعض التقنيات المتطورة في تقطير النموذج. (في الأساس ، هذا يعني ضغط نماذج منظمة العفو الدولية الكبيرة إلى نماذج أصغر ، مما يجعلها أرخص في الركض دون أن تخسر الكثير في طريقة الأداء.)
تضمنت Deepseek أيضًا تفاصيل تشير إلى أنه لم يكن صعبًا كما كان يعتقد سابقًا لتحويل نموذج لغة “الفانيليا” إلى نموذج تفكير أكثر تطوراً ، من خلال تطبيق تقنية تعرف باسم التعلم التعزيز فوقه. (لا تقلق إذا كانت هذه المصطلحات تتجاوز رأسك – ما يهم هو أن طرق تحسين أنظمة الذكاء الاصطناعى التي كانت تحرسها شركات التكنولوجيا الأمريكية في السابق موجودة الآن على شبكة الإنترنت ، مجانًا لأي شخص أن يأخذها وتكرارها.)
حتى لو تعافى أسعار أسهم عمالقة التكنولوجيا الأمريكية في الأيام المقبلة ، فإن نجاح Deepseek يثير أسئلة مهمة حول استراتيجيات الذكاء الاصطناعى على المدى الطويل. إذا كانت شركة صينية قادرة على بناء نماذج رخيصة مفتوحة المصدر تتطابق مع أداء النماذج الأمريكية باهظة الثمن ، فلماذا يدفع أي شخص مقابل لنا؟ وإذا كنت Meta-عملاق التكنولوجيا الأمريكي الوحيد الذي يطلق نماذجه كبرنامج مجاني مفتوح المصدر-ما يمنع Deepseek أو بدء تشغيل آخر من مجرد أخذ النماذج الخاصة بك ، والتي أنفقت عليها مليارات الدولارات ، وتقطيعها إلى أصغر ، نماذج أرخص يمكنهم تقديمها للبنسات؟
كما أن اختراق Deepseek يقوض بعض الافتراضات الجيوسياسية التي كان العديد من الخبراء الأمريكيين يقومون بها حول منصب الصين في سباق الذكاء الاصطناعي.
أولاً ، يتحدى السرد أن الصين تقف وراء الحدود بشكل مفيد ، عندما يتعلق الأمر ببناء نماذج قوية من الذكاء الاصطناعي. لسنوات ، افترض العديد من خبراء الذكاء الاصطناعى (وصانعي السياسات الذين يستمعون إليهم) أن الولايات المتحدة كانت تقدم في عدة سنوات على الأقل ، وأن نسخ التطورات التي قدمتها شركات التكنولوجيا الأمريكية كان من الصعب على الشركات الصينية القيام بها بسرعة.
لكن نتائج Deepseek تظهر أن الصين لديها قدرات منظمة العفو الدولية المتقدمة التي يمكن أن تتطابق أو تتجاوز النماذج من شركة Openai وشركات AI الأمريكية الأخرى ، وقد تكون عمليات الاختراق التي اتخذتها الشركات الأمريكية سهلة للغاية للشركات الصينية – أو ، على الأقل ، شركة صينية واحدة – لتكرارها في غضون أسابيع.
(رفعت صحيفة نيويورك تايمز دعوى قضائية ضد Openai وشريكها ، Microsoft ، متهمينهم بانتهاك حقوق الطبع والنشر لمحتوى الأخبار المتعلقة بأنظمة الذكاء الاصطناعى. نفى Openai و Microsoft هذه المطالبات.)
تثير النتائج أيضًا أسئلة حول ما إذا كانت الخطوات التي اتخذتها حكومة الولايات المتحدة تتخذها للحد من انتشار أنظمة الذكاء الاصطناعى القوية إلى خصومنا – أي ضوابط التصدير المستخدمة لمنع رقائق الذكاء الاصطناعى القوية من السقوط في أيدي الصين – ما إذا كانت هذه اللوائح بحاجة إلى التكيف مع الأخذ في الاعتبار طرق جديدة وأكثر كفاءة لنماذج التدريب.
وبالطبع ، هناك مخاوف بشأن ما يعنيه ذلك بالنسبة للخصوصية والرقابة إذا اتخذت الصين زمام المبادرة في بناء أنظمة AI قوية تستخدمها ملايين الأميركيين. لاحظ مستخدمو نماذج Deepseek أنهم يرفضون بشكل روتيني الرد على أسئلة حول الموضوعات الحساسة داخل الصين ، مثل مذبحة Tiananmen Square ومعسكرات Uyghur. إذا كان المطورون الآخرون يبنون على قمة نماذج Deepseek ، كما هو شائع في البرمجيات مفتوحة المصدر ، فقد يتم تضمين تدابير الرقابة هذه في جميع أنحاء الصناعة.
أثار خبراء الخصوصية أيضًا مخاوف بشأن حقيقة أن البيانات المشتركة مع نماذج Deepseek قد تكون متاحة من قبل الحكومة الصينية. إذا كنت قلقًا من استخدام Tiktok كأداة للمراقبة والدعاية ، فإن صعود Deepseek يجب أن يقلقك أيضًا.
ما زلت غير متأكد من التأثير الكامل لإنجاز Deepseek ، أو ما إذا كنا سننظر في إصدار R1 “لحظة Sputnik” لصناعة الذكاء الاصطناعي ، كما ادعى البعض.
ولكن يبدو من الحكمة أن نأخذ على محمل الجد احتمال أن نكون في عصر جديد من حافة الهاوية الذكرية الآن – أن أكبر وأغنى شركات التكنولوجيا الأمريكية قد لم تعد تفوز افتراضيًا ، وأن احتواء انتشار أنظمة الذكاء الاصطناع اعتقدنا.
على الأقل ، أظهر Deepseek أن سباق AI Arms في AI يعمل حقًا ، وأنه بعد عدة سنوات من التقدم المذهل ، لا تزال هناك المزيد من المفاجآت المتبقية في المتجر.