شرکتهای چینی پس از سرکوب H20 پکن به پردازندههای گرافیکی دست دوم انویدیا روی میآورند
صنعت هوش مصنوعی چین پس از محدودیتهای جدید بر شتابدهنده H20 این شرکت، که مشتریان را برای یافتن جایگزینها به تکاپو انداخت، بیسروصدا به پردازندههای گرافیکی بازسازیشده و دست دوم انویدیا روی آورده است. H20، یک پردازنده گرافیکی مبتنی بر معماری هاپر که به طور خاص برای رعایت محدودیتهای صادراتی ایالات متحده طراحی شده بود، قرار بود انویدیا را در بازار چین نگه دارد. اما این تراشه پس از ازسرگیری صادرات H20 در ماه جولای، عملاً کنار گذاشته شد، زیرا رگولاتورهای چینی نگرانیهای امنیتی دادهها را مطرح کرده و خرید این تراشه را عملاً ممنوع کردند.
بر اساس گزارش اخیر Digitimes، این وضعیت منجر به افزایش تقاضا برای کارتهای قدیمیتر A100 و H100 شده است، زیرا شرکتها آنها را جدا کرده و به سیستمهای استنتاجی سفارشی «کمهزینه و با کارایی بالا» بازپیکربندی میکنند.
چرا سیلیکون دست دوم کارآمد است؟
استنتاج (Inference) نسبت به آموزش (Training) نیاز به محاسبات کمتری دارد. مدلها به دقت کامل ممیز شناور نیاز ندارند و حجم کاری میتواند به طور کارآمد بر روی سختافزاری که اصلاح یا بازپیکربندی شده است، اجرا شود. به همین دلیل، حتی یک A100 که در سال 2020 عرضه شد، در برخی موارد استفاده همچنان ارزشمند است.
A100 بر پایه معماری آمپر انویدیا ساخته شده بود، با حداکثر 80 گیگابایت حافظه HBM2e و پهنای باند 2 ترابایت بر ثانیه. اگرچه فاقد حداکثر توان عملیاتی هاپر است، اما به لطف حافظه بزرگ و اکوسیستم نرمافزاری بالغ CUDA، برای وظایف استنتاجی بسیار مؤثر باقی میماند. برای حجم کاریهایی مانند چتباتها و موتورهای توصیهگر، توسعهدهندگان همچنان میتوانند بدون نیاز به سیلیکون پیشرفته، به نتایج مقرونبهصرفه دست یابند.
H100 که در سال 2022 عرضه شد، عملکرد را به طور قابل توجهی افزایش میدهد، با حافظه HBM3 و تا شش برابر توان عملیاتی آموزش هوش مصنوعی یک A100. در مقابل، H20 برای استنتاج تنظیم شده بود اما به قدری تهاجمی کاهش یافته بود که بین سه تا تقریباً هفت برابر کمتر عملکرد هوش مصنوعی نسبت به یک H100 کامل و بیش از سی برابر کندتر در وظایف ابررایانش FP64 ارائه میدهد. در عمل، این باعث میشود حتی A100های بازسازیشده گزینهای جذابتر برای خریداران چینی نسبت به H20 جدید باشند.
با اکوسیستم CUDA انویدیا که همچنان بیرقیب است، کارتهای قدیمیتر برای توسعهدهندگان همچنان به صورت Plug-and-Play عمل میکنند. و از آنجایی که سختافزار استنتاج میتواند به صورت شبانهروزی با خطر کمتر از دست دادن دقت کار کند، مراکز داده چین آشکارا از پرداخت هزینه برای بردهای بازسازیشده حتی با کاهش قابلیت اطمینان، راضی هستند.
فشار بازار برای انویدیا
این وضعیت انویدیا را در تنگنای عجیبی قرار میدهد. این شرکت 5.5 میلیارد دلار بابت موجودی فروخته نشده H20 خود، زمانی که واشنگتن الزامات مجوز برای صادرات آن به چین را معرفی کرد، کاهش ارزش ثبت کرد. با این حال، به طور متناقض، پردازندههای گرافیکی آن همچنان کاتالیزور رونق مداوم هوش مصنوعی چین هستند. این یک شمشیر دو لبه برای انویدیا است: تراشههای آن همچنان غالب هستند، اما کانالهای بازار خاکستری خطر فرسایش حاشیه سود و کند کردن پذیرش معماریهای جدیدتر را دارند.
بازار خاکستری همچنین برای پکن بسیار مشکلساز است، زیرا این کشور مشتاق است شرکتهای رقیب داخلی خود مانند هواوی و بیرن مقیاسپذیر شوند. هر H100 دست دوم و جدا شده که در یک مرکز داده چینی قرار میگیرد، سیستمی دیگر است که بر روی شتابدهندههای Ascend اجرا نمیشود، که میتواند به طور بالقوه سرمایهگذاریهای داخلی را کند کند.
در نهایت، سیل پردازندههای گرافیکی بازیافتی، پیامدهای ناخواسته تشدید کنترلهای صادراتی را نشان میدهد. سیاستگذاران ایالات متحده امیدوار بودند دسترسی چین به محاسبات پیشرفته را محدود کنند، در حالی که پکن به دنبال تسریع پذیرش سیلیکون بومی بوده است. در عوض، نتیجه یک اقتصاد بازیافتی است که در آن A100ها و H100های دیروز همچنان به استقرار هوش مصنوعی فردا قدرت میبخشند.
در حال حاضر، صنعت هوش مصنوعی چین با عملگرایی کنار میآید و عمر مفید سختافزار قدیمیتر انویدیا را افزایش میدهد، در حالی که منتظر رفع موانع سیاسی و تکنولوژیکی است.
- کولبات
- شهریور 5, 1404
- 40 بازدید






