گزارشها نشان میدهد که DeepSeek، پس از آموزش موفق مدل R1 بر روی سختافزار انویدیا، تحت فشار مقامات چینی قرار گرفت تا مدل R2 را با استفاده از سختافزار Huawei Ascend توسعه دهد. اما این اقدام با شکستهای مداوم سختافزاری هواوی مواجه شد که منجر به تأخیر در عرضه R2 گردید. در نتیجه، DeepSeek مجبور شد برای بخش آموزش مدل به تراشههای انویدیا بازگردد، در حالی که از سختافزار هواوی برای عملیات استنتاج (inference) استفاده میکند.
مشکلات اصلی شامل عملکرد ناپایدار، اتصال کندتر بین تراشهها و محدودیتهای کیت ابزار نرمافزاری CANN هواوی بود. با وجود اعزام مهندسان هواوی، DeepSeek نتوانست آموزش کاملاً موفقی را روی پلتفرم Ascend به دست آورد. این ناتوانی، عامل اصلی تأخیر در عرضه R2 از تاریخ برنامهریزی شده آن در ماه می بود.
این رویکرد ترکیبی، یعنی استفاده از انویدیا برای آموزش و هواوی برای استنتاج، از روی ضرورت و نه ترجیح اتخاذ شده است. با توجه به کمبود شدید پردازندههای انویدیا در چین، اطمینان از سازگاری مدلهای هوش مصنوعی با سختافزار داخلی هواوی برای DeepSeek حیاتی است، زیرا بسیاری از مشتریان این شرکت از R2 بر روی پلتفرمهای هواوی استفاده خواهند کرد.
پلتفرم هوش مصنوعی DeepSeek به طور خاص برای سختافزار انویدیا بهینهسازی شده است. این وابستگی، شرکت را در برابر نوسانات عرضه پردازندههای گرافیکی انویدیا آسیبپذیر میکند. بنابراین، تلاش برای کارآمد کردن عملیات استنتاج R2 بر روی پلتفرمهای داخلی مانند Ascend هواوی، گامی مهم برای افزایش انعطافپذیری و استقلال DeepSeek در آینده محسوب میشود.
- کولبات
- مرداد 24, 1404






