شكراً GPT-4o من OpenAI والمايك الأن مع DeepSeek-V3 من شركة DeepSeek AI يا مرحباً بالتنين الأحمر

هل ينزع DeepSeek-V3 البساط من تحت GPT-4o

ستجد فى هذا المقال

شكراً GPT-4o من OpenAI والمايك الأن مع DeepSeek-V3 من شركة DeepSeek AI يا مرحباً بالتنين الأحمر

شكراً GPT-4o من OpenAI والمايك الأن مع DeepSeek-V3 من شركة DeepSeek AI يا مرحباً بالتنين الأحمر

 

شكراً GPT-4o من OpenAI والمايك الأن مع DeepSeek-V3 من شركة DeepSeek AI يا مرحباً بالتنين الأحمر

أطلقت شركة DeepSeek AI الصينية، الرائدة في مجال الذكاء الاصطناعي، أحدث ابتكاراتها: نموذج DeepSeek-V3. يُصنف هذا النموذج كواحد من أقوى النماذج مفتوحة المصدر على مستوى العالم، مما يمثل نقلة نوعية في هذا المجال.

يعتمد DeepSeek-V3 على تقنية “مزيج الخبراء” (Mixture-of-Experts أو MoE)، وهي بنية متطورة تُمكّنه من تحقيق أداء فائق. يتكون النموذج من 671 مليار مُعَلّمة (Parameter)، مع تفعيل 37 مليار مُعَلّمة لكل مُدخل نصي. وتُعتبر المُعَلّمات مقياسًا حاسمًا لقوة النموذج وكفاءته في معالجة البيانات واستخلاص الأنماط المعقدة.

يمثل DeepSeek-V3 قمة التطور في نماذج الذكاء الاصطناعي مفتوحة المصدر، بفضل بنيته المبتكرة وتقنياته المتطورة.

DeepSeek-V3: قفزة نوعية في عالم نماذج الذكاء الاصطناعي مفتوحة المصدر

أطلقت شركة DeepSeek AI الصينية، الرائدة في مجال الذكاء الاصطناعي، أحدث ابتكاراتها: نموذج DeepSeek-V3. يُصنف هذا النموذج كواحد من أقوى النماذج مفتوحة المصدر على مستوى العالم، مما يمثل نقلة نوعية في هذا المجال.

يعتمد DeepSeek-V3 على تقنية “مزيج الخبراء” (Mixture-of-Experts أو MoE)، وهي بنية متطورة تُمكّنه من تحقيق أداء فائق. يتكون النموذج من 671 مليار مُعَلّمة (Parameter)، مع تفعيل 37 مليار مُعَلّمة لكل مُدخل نصي. وتُعتبر المُعَلّمات مقياسًا حاسمًا لقوة النموذج وكفاءته في معالجة البيانات واستخلاص الأنماط المعقدة.

 يمثل DeepSeek-V3 قمة التطور في نماذج الذكاء الاصطناعي مفتوحة المصدر، بفضل بنيته المبتكرة وتقنياته المتطورة.

إضافةً إلى ما سبق

يتميز DeepSeek-V3 بكفاءة تشغيلية ملحوظة، حيث يُقدّم تكلفة إدخال أقل بعشر مرات مقارنةً بالنماذج الرائدة الأخرى، مثل تلك التي تطورها OpenAI. هذه الكفاءة تُعتبر ميزة تنافسية هامة، إذ تُساهم في خفض تكاليف استخدام النموذج على نطاق واسع.

وقد عبّر فريق DeepSeek عن حماسه لهذا الإنجاز في بيان نشره على منصة X (تويتر سابقًا)، مُشيرًا إلى أن DeepSeek-V3 يُعدّ خطوة جادة نحو تضييق الفجوة بين نماذج الذكاء الاصطناعي مفتوحة المصدر وتلك المُحتكرة من قبل الشركات الكبرى. هذا التصريح يُبرز التزام الشركة بتطوير نماذج قوية ومتاحة للجميع.

أصبح نموذج DeepSeek-V3 مُتاحًا للتنزيل عبر منصتي GitHub و Hugging Face، وهما منصتان شهيرتان لمشاركة المشاريع مفتوحة المصدر. هذه الإتاحة تُسهّل على الباحثين والمطورين والمهتمين بالذكاء الاصطناعي الوصول إلى هذا النموذج المتقدم واستخدامه في تطبيقاتهم وأبحاثهم.

باختصار

يُعتبر إطلاق DeepSeek-V3 خطوة مهمة نحو دمقرطة الوصول إلى تقنيات الذكاء الاصطناعي المتقدمة، حيث يُتيح للجميع الاستفادة من هذه التقنيات دون اقتصارها على شركات أو دول مُحددة. الجمع بين الأداء القوي والتكلفة المنخفضة والإتاحة العامة يجعل من DeepSeek-V3 إضافة قيّمة لمجتمع الذكاء الاصطناعي.

بعض النقاط الإضافية التي قد تكون مفيدة:

 

DeepSeek-V3: ريادة جديدة في عالم نماذج الذكاء الاصطناعي مفتوحة المصدر

تتصدر شركة DeepSeek AI، المختبر الصيني المتخصص في أبحاث الذكاء الاصطناعي، المشهد في مجال النماذج مفتوحة المصدر. أطلقت الشركة مؤخرًا نموذج DeepSeek-V3، وهو نموذج لغوي ضخم يعتمد على بنية “مزيج الخبراء” (Mixture-of-Experts أو MoE). يتميز هذا النموذج بحجمه الهائل، حيث يضم 671 مليار مُعَلّمة إجمالية، مع تفعيل 37 مليار مُعَلّمة لكل مُدخل نصي (token).

كما يتضح من الجدول أعلاه، حقق نموذج DeepSeek-V3 نتائج فائقة في تسعة معايير قياسية، وهو أعلى رقم يحققه أي نموذج مماثل من حيث الحجم. على الرغم من أدائه الممتاز في المعايير الرئيسية، يتطلب تدريب DeepSeek-V3 الكامل 2.788 مليون ساعة من وحدات معالجة الرسوميات H800 وتكلفة تدريب تبلغ حوالي 5.6 مليون دولار. للمقارنة، يتطلب نموذج Llama 3 405B مفتوح المصدر المكافئ 30.8 مليون ساعة من وحدات معالجة الرسوميات للتدريب. يُعزى توفير التكلفة في DeepSeek-V3 إلى دعم تدريب FP8 والتحسينات الهندسية العميقة.

شرح إضافي وتوضيح للمصطلحات:

  • النتائج الفائقة (State-of-the-art results): تعني تحقيق أفضل النتائج الممكنة حتى تاريخه في مجال معين.
  • المعايير القياسية (Benchmarks): هي اختبارات موحدة تُستخدم لتقييم أداء النماذج ومقارنتها ببعضها البعض.
  • وحدات معالجة الرسوميات H800 (H800 GPU hours): تشير إلى عدد الساعات التي استغرقتها وحدات معالجة الرسوميات من نوع H800 في عملية التدريب. وحدات معالجة الرسوميات تُستخدم لتسريع عمليات الحساب المعقدة في تدريب نماذج الذكاء الاصطناعي.
  • نموذج Llama 3 405B: هو نموذج لغوي كبير آخر مفتوح المصدر يُستخدم للمقارنة. يشير الرقم 405B إلى عدد المُعَلّمات (Parameters) في النموذج.
  • تدريب FP8 (FP8 training): يشير إلى استخدام تنسيق FP8 (نقطة عائمة 8 بت) في عملية التدريب، وهو تنسيق بيانات يُساعد على تقليل استهلاك الذاكرة وتسريع عملية التدريب.
  • التحسينات الهندسية العميقة (Deep engineering optimizations): تشير إلى التعديلات والتحسينات التقنية التي تم إدخالها على بنية النموذج وعملية التدريب لتحسين الكفاءة والأداء.

 

اخيراً

يُظهر النص أن DeepSeek-V3 لا يُقدم أداءً ممتازًا فحسب، بل يتميز أيضًا بكفاءة عالية من حيث تكلفة التدريب والموارد المطلوبة مقارنةً بالنماذج الأخرى المماثلة، وذلك بفضل التقنيات المُستخدمة والتحسينات الهندسية.

والى هنا إخوانى وأخواتى  الأعزاء نكون قد أتممنا المهمة بنجاح ✌

لاتنسوا إخواننا فى فلسطين من دعائكم📌

وتقبلوا تحيات فريق #Ezznology #عز_التقنية

كما يمكنكم الإطلاع على منتجات متجرنا من هنا  👈#متجرنا 🌷او هنا 

 

وللإنضمام الى اسرتنا على  جروب التليجرام من👈هنا

وكذلك جروب الفيس بوك والذى نقوم بمشاركة المعلومات عليه ومساعدة الأعاء من👈هنا 

وللإشتراك فى نشرتنا الإخبارية على اخبار جوجل اضغط هنا✌👇

                                                        او قم بمسح الكود

Ezznology on Google news

 

اهتم الأخرون أيضاً بـــ : 

والأن مع المفاجآة الكبرى شات جى بى تى لكل المستخدمين على نظام ويندوز مجاناً

IOS 19 ومزاياه المتوقعة التى ينتظرها الكثيرون هل انت متفائل ؟

جوجل كروم مع الذكاء الإصطناعى الحائط الجديد للتصدى للهجمات السيبرانية Chrome Canary

لا تغرنك الألوان الجذابة ولا الميزات الرهيبة فى نسخ الواتساب

مع هذا البرنامج سيطول عمر جهازك أضعاف وسيكون سهل الإستخدام Lenovo Vantage

افكار لمتاجر الكترونية اذا تم تنفيذها بطريقة صحيحة ستحقق ملايين المبيعات

خطوات ستساعدك فى حل جميع مشاكل الأوتلوك الشائعة How to Fix Common Outlook Problems

اشياء احذر ان تفعلها على تطبيق واتساب للحفاظ على الأمان والخصوصية

Quishing قد يكون الأخطر على الإطلاق لؤلائك الذين يفضلون مسح رموز الQR

لأول مرة Xiaomi 15 series مع معالج Snapdragon 8 يستحق الإقتناء

حل مشكلة عدم قيام النظام الوهمي في برنامج how to resolve intel VT-x is disabled issue – VMware

ميزة تنظيم رسائل الواتساب طبقاً للقوائم المنفصلة

مجموعة حواسب محمولة بمعالجات Snapdragon X تعلن عنها مايكروسوفت مع تقنية الذكاء الاصطناعي Copilot

ابل تقوم بدمج الذكاء الإصطناعى على أنظمتها المختلفة Apple Intelligence

طريقة إنشاء سيرتك الذاتية على ويكيبيديا

اهم 6 طرق و نصائح لإدارة التغيير بفعالية
طريقة إنشاء صفحة باسمك او باسم نشاطك على ويكيبيديا لتحقيق الشهرة
ماهى إدارة التغيير | Change Management

إعدادات يمكن ضبطها في هواتف آيفون لتحسين عمر البطارية

ماذا تعنى ال الـ Clustering Servers ؟

 

0

تقييم المستخدمون: كن أول المصوتون !
Exit mobile version