شكراً GPT-4o من OpenAI والمايك الأن مع DeepSeek-V3 من شركة DeepSeek AI يا مرحباً بالتنين الأحمر
هل ينزع DeepSeek-V3 البساط من تحت GPT-4o
ستجد فى هذا المقال
شكراً GPT-4o من OpenAI والمايك الأن مع DeepSeek-V3 من شركة DeepSeek AI يا مرحباً بالتنين الأحمر
شكراً GPT-4o من OpenAI والمايك الأن مع DeepSeek-V3 من شركة DeepSeek AI يا مرحباً بالتنين الأحمر
أطلقت شركة DeepSeek AI الصينية، الرائدة في مجال الذكاء الاصطناعي، أحدث ابتكاراتها: نموذج DeepSeek-V3. يُصنف هذا النموذج كواحد من أقوى النماذج مفتوحة المصدر على مستوى العالم، مما يمثل نقلة نوعية في هذا المجال.
يعتمد DeepSeek-V3 على تقنية “مزيج الخبراء” (Mixture-of-Experts أو MoE)، وهي بنية متطورة تُمكّنه من تحقيق أداء فائق. يتكون النموذج من 671 مليار مُعَلّمة (Parameter)، مع تفعيل 37 مليار مُعَلّمة لكل مُدخل نصي. وتُعتبر المُعَلّمات مقياسًا حاسمًا لقوة النموذج وكفاءته في معالجة البيانات واستخلاص الأنماط المعقدة.
يمثل DeepSeek-V3 قمة التطور في نماذج الذكاء الاصطناعي مفتوحة المصدر، بفضل بنيته المبتكرة وتقنياته المتطورة.
DeepSeek-V3: قفزة نوعية في عالم نماذج الذكاء الاصطناعي مفتوحة المصدر
أطلقت شركة DeepSeek AI الصينية، الرائدة في مجال الذكاء الاصطناعي، أحدث ابتكاراتها: نموذج DeepSeek-V3. يُصنف هذا النموذج كواحد من أقوى النماذج مفتوحة المصدر على مستوى العالم، مما يمثل نقلة نوعية في هذا المجال.
يعتمد DeepSeek-V3 على تقنية “مزيج الخبراء” (Mixture-of-Experts أو MoE)، وهي بنية متطورة تُمكّنه من تحقيق أداء فائق. يتكون النموذج من 671 مليار مُعَلّمة (Parameter)، مع تفعيل 37 مليار مُعَلّمة لكل مُدخل نصي. وتُعتبر المُعَلّمات مقياسًا حاسمًا لقوة النموذج وكفاءته في معالجة البيانات واستخلاص الأنماط المعقدة.
يمثل DeepSeek-V3 قمة التطور في نماذج الذكاء الاصطناعي مفتوحة المصدر، بفضل بنيته المبتكرة وتقنياته المتطورة.
إضافةً إلى ما سبق
يتميز DeepSeek-V3 بكفاءة تشغيلية ملحوظة، حيث يُقدّم تكلفة إدخال أقل بعشر مرات مقارنةً بالنماذج الرائدة الأخرى، مثل تلك التي تطورها OpenAI. هذه الكفاءة تُعتبر ميزة تنافسية هامة، إذ تُساهم في خفض تكاليف استخدام النموذج على نطاق واسع.
وقد عبّر فريق DeepSeek عن حماسه لهذا الإنجاز في بيان نشره على منصة X (تويتر سابقًا)، مُشيرًا إلى أن DeepSeek-V3 يُعدّ خطوة جادة نحو تضييق الفجوة بين نماذج الذكاء الاصطناعي مفتوحة المصدر وتلك المُحتكرة من قبل الشركات الكبرى. هذا التصريح يُبرز التزام الشركة بتطوير نماذج قوية ومتاحة للجميع.
أصبح نموذج DeepSeek-V3 مُتاحًا للتنزيل عبر منصتي GitHub و Hugging Face، وهما منصتان شهيرتان لمشاركة المشاريع مفتوحة المصدر. هذه الإتاحة تُسهّل على الباحثين والمطورين والمهتمين بالذكاء الاصطناعي الوصول إلى هذا النموذج المتقدم واستخدامه في تطبيقاتهم وأبحاثهم.
باختصار
يُعتبر إطلاق DeepSeek-V3 خطوة مهمة نحو دمقرطة الوصول إلى تقنيات الذكاء الاصطناعي المتقدمة، حيث يُتيح للجميع الاستفادة من هذه التقنيات دون اقتصارها على شركات أو دول مُحددة. الجمع بين الأداء القوي والتكلفة المنخفضة والإتاحة العامة يجعل من DeepSeek-V3 إضافة قيّمة لمجتمع الذكاء الاصطناعي.
بعض النقاط الإضافية التي قد تكون مفيدة:
- مقارنة التكلفة: يُمكن توضيح أهمية انخفاض التكلفة بعشر مرات بإعطاء أمثلة رقمية، إذا توفرت، لمقارنة تكلفة استخدام DeepSeek-V3 مع نماذج أخرى في سيناريوهات واقعية.
- أهمية الإتاحة على GitHub و Hugging Face: يُمكن شرح أهمية هذه المنصات في تسهيل التعاون والمشاركة بين المطورين والباحثين، وكيف تُساهم في تسريع وتيرة تطور الذكاء الاصطناعي.
- التأثير المُحتمل على السوق: يُمكن التكهن بالتأثير المُحتمل لإطلاق DeepSeek-V3 على سوق نماذج الذكاء الاصطناعي، وكيف يُمكن أن يُشجع ذلك على تطوير المزيد من النماذج مفتوحة المصدر.
DeepSeek-V3: ريادة جديدة في عالم نماذج الذكاء الاصطناعي مفتوحة المصدر
تتصدر شركة DeepSeek AI، المختبر الصيني المتخصص في أبحاث الذكاء الاصطناعي، المشهد في مجال النماذج مفتوحة المصدر. أطلقت الشركة مؤخرًا نموذج DeepSeek-V3، وهو نموذج لغوي ضخم يعتمد على بنية “مزيج الخبراء” (Mixture-of-Experts أو MoE). يتميز هذا النموذج بحجمه الهائل، حيث يضم 671 مليار مُعَلّمة إجمالية، مع تفعيل 37 مليار مُعَلّمة لكل مُدخل نصي (token).
كما يتضح من الجدول أعلاه، حقق نموذج DeepSeek-V3 نتائج فائقة في تسعة معايير قياسية، وهو أعلى رقم يحققه أي نموذج مماثل من حيث الحجم. على الرغم من أدائه الممتاز في المعايير الرئيسية، يتطلب تدريب DeepSeek-V3 الكامل 2.788 مليون ساعة من وحدات معالجة الرسوميات H800 وتكلفة تدريب تبلغ حوالي 5.6 مليون دولار. للمقارنة، يتطلب نموذج Llama 3 405B مفتوح المصدر المكافئ 30.8 مليون ساعة من وحدات معالجة الرسوميات للتدريب. يُعزى توفير التكلفة في DeepSeek-V3 إلى دعم تدريب FP8 والتحسينات الهندسية العميقة.
شرح إضافي وتوضيح للمصطلحات:
- النتائج الفائقة (State-of-the-art results): تعني تحقيق أفضل النتائج الممكنة حتى تاريخه في مجال معين.
- المعايير القياسية (Benchmarks): هي اختبارات موحدة تُستخدم لتقييم أداء النماذج ومقارنتها ببعضها البعض.
- وحدات معالجة الرسوميات H800 (H800 GPU hours): تشير إلى عدد الساعات التي استغرقتها وحدات معالجة الرسوميات من نوع H800 في عملية التدريب. وحدات معالجة الرسوميات تُستخدم لتسريع عمليات الحساب المعقدة في تدريب نماذج الذكاء الاصطناعي.
- نموذج Llama 3 405B: هو نموذج لغوي كبير آخر مفتوح المصدر يُستخدم للمقارنة. يشير الرقم 405B إلى عدد المُعَلّمات (Parameters) في النموذج.
- تدريب FP8 (FP8 training): يشير إلى استخدام تنسيق FP8 (نقطة عائمة 8 بت) في عملية التدريب، وهو تنسيق بيانات يُساعد على تقليل استهلاك الذاكرة وتسريع عملية التدريب.
- التحسينات الهندسية العميقة (Deep engineering optimizations): تشير إلى التعديلات والتحسينات التقنية التي تم إدخالها على بنية النموذج وعملية التدريب لتحسين الكفاءة والأداء.
اخيراً
يُظهر النص أن DeepSeek-V3 لا يُقدم أداءً ممتازًا فحسب، بل يتميز أيضًا بكفاءة عالية من حيث تكلفة التدريب والموارد المطلوبة مقارنةً بالنماذج الأخرى المماثلة، وذلك بفضل التقنيات المُستخدمة والتحسينات الهندسية.
والى هنا إخوانى وأخواتى الأعزاء نكون قد أتممنا المهمة بنجاح ✌
لاتنسوا إخواننا فى فلسطين من دعائكم📌
وتقبلوا تحيات فريق #Ezznology #عز_التقنية
كما يمكنكم الإطلاع على منتجات متجرنا من هنا 👈#متجرنا 🌷او هنا
وللإنضمام الى اسرتنا على جروب التليجرام من👈هنا
وكذلك جروب الفيس بوك والذى نقوم بمشاركة المعلومات عليه ومساعدة الأعاء من👈هنا
اهتم الأخرون أيضاً بـــ :
والأن مع المفاجآة الكبرى شات جى بى تى لكل المستخدمين على نظام ويندوز مجاناً
IOS 19 ومزاياه المتوقعة التى ينتظرها الكثيرون هل انت متفائل ؟
جوجل كروم مع الذكاء الإصطناعى الحائط الجديد للتصدى للهجمات السيبرانية Chrome Canary
لا تغرنك الألوان الجذابة ولا الميزات الرهيبة فى نسخ الواتساب
مع هذا البرنامج سيطول عمر جهازك أضعاف وسيكون سهل الإستخدام Lenovo Vantage
افكار لمتاجر الكترونية اذا تم تنفيذها بطريقة صحيحة ستحقق ملايين المبيعات
خطوات ستساعدك فى حل جميع مشاكل الأوتلوك الشائعة How to Fix Common Outlook Problems
اشياء احذر ان تفعلها على تطبيق واتساب للحفاظ على الأمان والخصوصية
Quishing قد يكون الأخطر على الإطلاق لؤلائك الذين يفضلون مسح رموز الQR
لأول مرة Xiaomi 15 series مع معالج Snapdragon 8 يستحق الإقتناء
حل مشكلة عدم قيام النظام الوهمي في برنامج how to resolve intel VT-x is disabled issue – VMware
ميزة تنظيم رسائل الواتساب طبقاً للقوائم المنفصلة
مجموعة حواسب محمولة بمعالجات Snapdragon X تعلن عنها مايكروسوفت مع تقنية الذكاء الاصطناعي Copilot
ابل تقوم بدمج الذكاء الإصطناعى على أنظمتها المختلفة Apple Intelligence
طريقة إنشاء سيرتك الذاتية على ويكيبيديا
اهم 6 طرق و نصائح لإدارة التغيير بفعالية
طريقة إنشاء صفحة باسمك او باسم نشاطك على ويكيبيديا لتحقيق الشهرة
ماهى إدارة التغيير | Change Management
ماذا تعنى ال الـ Clustering Servers ؟