أطلقت جوجل الدليل التدريبي للمطورين للجيل السابع من وحدة معالجة Tensor Ironwood، مع شرح مفصل لتحسين الأداء على مستوى النظام

robot
إنشاء الملخص قيد التقدم

أخبار ME News، في 2 أبريل (بتوقيت UTC+8)، أصدرت جوجل مؤخرًا دليل تدريب للمطورين موجه إلى معالج Ironwood TPU من الجيل السابع. يهدف هذا الدليل إلى مساعدة المطورين على الاستفادة الكاملة من الأداء على مستوى النظام لـ Ironwood TPU، من أجل تدريب ونشر نماذج الذكاء الاصطناعي المتقدمة بكفاءة. يُعد Ironwood TPU بنية أساسية مخصصة للذكاء الاصطناعي مصممة لتلبية متطلبات حسابات نماذج ذات تريليونات المعاملات، حيث يستخدم تقنيات مثل الربط بين الشرائح (ICI)، ومفاتيح التبديل الضوئية (OCS)، وشبكة مراكز البيانات (DCN)، وذاكرة عالية النطاق الترددي المجمعة (HBM) لبناء نظام كامل يدعم حتى 9,216 شريحة. يشرح المقال بالتفصيل العديد من استراتيجيات التحسين الرئيسية لهذا العتاد، بما في ذلك: الاستفادة من وحدة الضرب المصفوفي (MXU) لدعم تدريب FP8 بشكل أصلي لزيادة الإنتاجية؛ اعتماد مكتبة نوى JAX المصممة خصيصًا لـ TPU، Tokamax، لمعالجة النصوص الطويلة والنماذج المختلطة باستخدام “الانتباه المتطاير” و"مصفوفة الضرب المجمع Megablox"؛ استغلال النواة المتفرقة من الجيل الرابع (SparseCore) لتحميل عمليات الاتصال الجماعي لإخفاء التأخير؛ تحسين تخصيص ذاكرة SRAM على متن TPU بسرعة (VMEM) بدقة لتقليل توقف الذاكرة؛ واختيار استراتيجية التقسيم المثلى (مثل FSDP، TP، EP) استنادًا إلى حجم النموذج، والهندسة المعمارية، وطول التسلسل. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.27Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • تثبيت