دستور نيوز
بدأت شركة DeepSeek الصينية عام 2026 بنشر ورقة بحثية تقنية جديدة، شارك في تأليفها مؤسس الشركة Liang Wenfeng، مما يشير إلى توجه الشركة نحو إعادة تصميم البنية التحتية لتدريب نماذج الذكاء الاصطناعي الكبيرة بهدف تقليل التكاليف مع الحفاظ على القدرة التنافسية.
وتم نشر الورقة البحثية على منصة arXiv المفتوحة، وعرضت منهجية جديدة تسمى Manifold-Constrained Hyper-Connections (mHC)، كجزء من جهود الشركة لجعل نماذج التدريب الأساسية أكثر كفاءة في ظل المنافسة الشرسة مع الشركات الأمريكية التي لديها قدرات حوسبة وتمويل أكبر.
اختبر DeepSeek المنهجية الجديدة على النماذج ذات المعلمات 3B و9B و27B، وأظهرت النتائج أن البنية الجديدة تتوسع بسلاسة دون زيادة ملحوظة في الحمل الحسابي، حسبما أفاد SCMP. وأكد الباحثون أن mHC يسمح بتدريب واسع النطاق ومستقر مع قابلية توسعة أفضل مقارنة بالحلول التقليدية القائمة على الاتصالات الفائقة، مشيرين إلى أن التحسينات جاءت بفضل التعديلات الذكية على مستوى البنية التحتية، مما جعل التكلفة الإضافية معدومة تقريبًا.
وتعتمد الفكرة على مفهوم Hyper-Connections الذي قدمه باحثو ByteDance في سبتمبر 2024 كتحسين على بنية ResNet الشهيرة، والمستخدمة كأساس للعديد من نماذج الذكاء الاصطناعي الحديثة، بما في ذلك نماذج GPT الخاصة بـ OpenAI ونظام AlphaFold من Google DeepMind. لكن Deep Sec ترى أن النهج السابق لم يأخذ في الاعتبار الارتفاع السريع في تكاليف الذاكرة، مما يحد من قابليتها للاستخدام العملي لتدريب النماذج الكبيرة، وهنا يأتي دور MHC، الذي يضيف قيودًا رياضية (Manifold Constraints) لضمان كفاءة أكبر في استهلاك الموارد.
غالبًا ما تُعتبر الأوراق البحثية لشركة DeepSeek مؤشرًا مبكرًا للتوجهات الهندسية التي ستعتمدها الشركة في نماذجها القادمة. ووفقا للباحث الألماني فلوريان براند، المتخصص في نظام الذكاء الاصطناعي الصيني، فإن منشورات القطاع العميق غالبا ما تسبق الإعلانات الرئيسية عن النماذج الجديدة. وتتزايد التوقعات بأن الشركة ستطلق طرازها القادم قبل عطلة رأس السنة الصينية في منتصف شهر فبراير، بعد أن سبق أن كشفت عن طراز R1 قبل عطلة وطنية مماثلة العام الماضي.
تعكس الورقة أيضًا أن Liang Wenfeng يواصل لعب دور مباشر في الأبحاث الأساسية للشركة، على الرغم من ظهوره الإعلامي المحدود، ويشير إدراجه كمؤلف نهائي إلى مشاركته الوثيقة في الاتجاهات التقنية العميقة. وفي نهاية المطاف، تؤكد خطوة Deep Sec أن سباق الذكاء الاصطناعي في عام 2026 لن يقتصر على من يملك القوة الحاسوبية الأكبر، بل على من يستطيع بناء نماذج أكثر ذكاءً وكفاءة وبتكلفة أقل.
تستعد شركة “Deep Sec” لإحداث تغيير جذري في سوق الذكاء الاصطناعي من جديد
– الدستور نيوز
