مقامات چینی ظاهراً از DeepSeek خواستهاند مدل جدید را روی سختافزار هواوی آموزش دهد
یک گزارش جدید ادعا میکند که پس از آموزش موفقیتآمیز مدل R1 خود بر روی سختافزار انویدیا، مقامات چینی از DeepSeek خواستهاند تا برای مدل بعدی خود به استفاده از سختافزار مبتنی بر Huawei Ascend روی آورد. با این حال، به گفته فایننشال تایمز، آموزش برای R2 با شکستهای مداوم سختافزاری هواوی مواجه شد که انتشار مدل را به تأخیر انداخت. DeepSeek ظاهراً مجبور شد برای آموزش به تراشههای انویدیا بازگردد در حالی که از تراشههای هواوی برای استنتاج استفاده میکرد.
به دنبال موفقیت R1، مقامات چینی ظاهراً DeepSeek را تشویق کردند تا به جای انویدیا، برای آموزش به پلتفرمهای مبتنی بر Ascend هواوی تکیه کند، این موضوع را سه فرد مطلع از این قضیه که توسط FT نقل شدهاند، بیان کردند. DeepSeek این توصیه را در طول توسعه R2 دنبال کرد، اما این اقدام به سرعت با مجموعهای از مشکلات از جمله عملکرد ناپایدار، اتصال کندتر تراشه به تراشه و محدودیتهای کیت ابزار نرمافزاری CANN هواوی مواجه شد.
DeepSeek ظاهراً مدل R1 خود را بر روی خوشهای متشکل از 50,000 پردازنده گرافیکی سری Hopper — شامل 30,000 واحد HGX H20، 10,000 H800 و 10,000 H100 — که از طریق سرمایهگذار خود، High-Flyer Capital Management، تأمین شده بودند، آموزش داد. به دلایل طبیعی، R2 برای آموزش به خوشهای به مراتب قدرتمندتر نیاز خواهد داشت، بنابراین DeepSeek و حامی آن باید آنها را در جایی تهیه کنند (که با توجه به وجود مراکز داده هوش مصنوعی فراوان در چین، ممکن است چندان دشوار نباشد).
با این حال، ممکن است مشکل دیگری نیز وجود داشته باشد. گزارشها نشان میدهند که پلتفرم هوش مصنوعی DeepSeek به طور خاص برای سختافزار انویدیا تنظیم شده است، که نه تنها شرکت را در برابر در دسترس بودن پردازندههای گرافیکی انویدیا آسیبپذیر میکند، بلکه مشتریان آن را نیز به عرضه شتابدهندههای هوش مصنوعی مانند Nvidia HGX H20 وابسته میسازد. به همین دلیل، برای DeepSeek بسیار مهم است که عملیات استنتاج R2 را روی پلتفرمهای سختافزاری داخلی مانند Ascend هواوی کارآمد کند.
- کولبات
- مرداد 24, 1404
- 52 بازدید






