مقامات چینی ظاهراً از DeepSeek خواسته‌اند مدل جدید را روی سخت‌افزار هواوی آموزش دهد

گزارش‌ها نشان می‌دهد که DeepSeek، پس از آموزش موفق مدل R1 بر روی سخت‌افزار انویدیا، تحت فشار مقامات چینی قرار گرفت تا مدل R2 را با استفاده از سخت‌افزار Huawei Ascend توسعه دهد. اما این اقدام با شکست‌های مداوم سخت‌افزاری هواوی مواجه شد که منجر به تأخیر در عرضه R2 گردید. در نتیجه، DeepSeek مجبور شد برای بخش آموزش مدل به تراشه‌های انویدیا بازگردد، در حالی که از سخت‌افزار هواوی برای عملیات استنتاج (inference) استفاده می‌کند.

مشکلات اصلی شامل عملکرد ناپایدار، اتصال کندتر بین تراشه‌ها و محدودیت‌های کیت ابزار نرم‌افزاری CANN هواوی بود. با وجود اعزام مهندسان هواوی، DeepSeek نتوانست آموزش کاملاً موفقی را روی پلتفرم Ascend به دست آورد. این ناتوانی، عامل اصلی تأخیر در عرضه R2 از تاریخ برنامه‌ریزی شده آن در ماه می بود.

این رویکرد ترکیبی، یعنی استفاده از انویدیا برای آموزش و هواوی برای استنتاج، از روی ضرورت و نه ترجیح اتخاذ شده است. با توجه به کمبود شدید پردازنده‌های انویدیا در چین، اطمینان از سازگاری مدل‌های هوش مصنوعی با سخت‌افزار داخلی هواوی برای DeepSeek حیاتی است، زیرا بسیاری از مشتریان این شرکت از R2 بر روی پلتفرم‌های هواوی استفاده خواهند کرد.

پلتفرم هوش مصنوعی DeepSeek به طور خاص برای سخت‌افزار انویدیا بهینه‌سازی شده است. این وابستگی، شرکت را در برابر نوسانات عرضه پردازنده‌های گرافیکی انویدیا آسیب‌پذیر می‌کند. بنابراین، تلاش برای کارآمد کردن عملیات استنتاج R2 بر روی پلتفرم‌های داخلی مانند Ascend هواوی، گامی مهم برای افزایش انعطاف‌پذیری و استقلال DeepSeek در آینده محسوب می‌شود.

جستجو در سایت

سبد خرید

درحال بارگذاری ...
بستن
مقایسه
مقایسه محصولات
لیست مقایسه محصولات شما خالی می باشد!