داستان HGX H20 انویدیا: چگونه یک پردازنده گرافیکی هوش مصنوعی به ابزار سیاسی تبدیل شد
پردازنده گرافیکی هوش مصنوعی HGX H20 انویدیا تنها بخش کوچکی از درآمد این شرکت را تشکیل میدهد، اما تعداد دفعات ذکر آن در رسانههای تجاری بسیار بیشتر از پردازندههای قدرتمندتر و سودآورتر H100 یا B200 این شرکت است. در واقع، این مدل خاص از پردازنده گرافیکی در چند ماه اخیر شهرت زیادی کسب کرده است، زیرا به کانون توجه در جنگ تجاری داغ آمریکا و چین تبدیل شده است.
تا حد زیادی، این اتفاق به این دلیل افتاد که HGX H20 یکی از معدود مدلهای پردازنده گرافیکی برای بارهای کاری هوش مصنوعی بود که دولت بایدن به شرکت اجازه داد بدون هیچ مجوز صادراتی به چین ارسال کند. با این حال، دولت فعلی ترامپ از HGX H20 به عنوان یک ابزار ژئوپلیتیکی استفاده کرده و اکنون آن را به منبع درآمد فدرال تبدیل کرده است.
چرا HGX H20 انویدیا برجسته است
انویدیا اولین نسخههای کاهشیافته از پردازندههای گرافیکی پرچمدار خود، A800 و H800 را در سال 2022 برای بازار چین عرضه کرد. این زمانی بود که دولت جو بایدن ارسال سختافزارهای رده سوپرکامپیوتر را به جمهوری خلق چین به دلایل امنیت ملی محدود کرد. در نتیجه، پهنای باند NVLink در A800 و H800 به ترتیب به 400 گیگابایت بر ثانیه و 450 گیگابایت بر ثانیه کاهش یافت و گزینههای توپولوژی اتصال محدود شد، که مقیاسپذیری چند پردازنده گرافیکی و کارایی آنها را برای سوپرکامپیوترهایی که بارهای کاری سنگین ارتباطی را اجرا میکنند، محدود کرد. از نظر عملکرد، A800 و H800 از قدرت برادران کامل خود چندان عقب نبودند.

تا اواخر سال 2023، مشخص شد که نهادهای مستقر در چین موفق شدهاند محدودیتها را دور بزنند و از H800 برای آموزش هوش مصنوعی بدون هیچ مشکل قابل توجهی استفاده کنند و از عملکرد و کارایی معماری هاپر انویدیا بهرهمند شوند. این سالها جلوتر از هر چیزی بود که توسعهدهندگان چینی میتوانستند ارائه دهند.
به همین منظور، دولت بایدن مقررات اداره صادرات (EAR) را با قوانین 3A090.a (که پردازندههای طراحی یا بازاریابی شده برای استفاده در مراکز داده را پوشش میدهد) و 3A090.b (که پردازندههایی را پوشش میدهد که برای مراکز داده طراحی یا بازاریابی نشدهاند) اعمال کرد که محدودیتهای توان پردازشی کل (TPP) و چگالی عملکرد (PD) را بر تمام سختافزارهای محاسباتی ارسال شده به چین اعمال کرد.
در نتیجه، انویدیا مجبور شد سیلیکونهای GH100، AD102 و AD104 خود را کاهش دهد تا محصولات HGX H20، L20 PCIe و L2 PCIe خود را بسازد که هر دو محدودیت TPP و PD اعمال شده توسط دولت ایالات متحده را برآورده میکردند. در نتیجه، HGX H20 انویدیا در بارهای کاری هوش مصنوعی 3.3 تا 6.69 برابر کندتر از H100 و در بارهای کاری HPC که نیاز به دقت FP64 دارند، 34 تا 67 برابر کندتر از H100 بود. AMD نیز با پردازنده Instinct MI308 همین رویه را دنبال کرد.
اما در حالی که HGX H20 به طور قابل توجهی کندتر از همتای کامل خود یعنی H100 است، این واحد همچنان با پردازندههای هوش مصنوعی طراحی شده در چین کاملاً رقابتی است (حتی با وجود اینکه هوآوی سیستمهای هوش مصنوعی در مقیاس رک دارد که پرچمدار GB200 NVL72 انویدیا را شکست میدهند).
علاوه بر این، از آنجایی که اکثر ارائهدهندگان خدمات ابری هایپراسکیل (CSPs) در چین به پشته نرمافزاری بسیار کارآمد CUDA انویدیا متکی هستند، آنها با اشتیاق میلیاردها دلار پردازنده HGX H20 را برای بارهای کاری خود خریداری کردهاند، زیرا عملکرد واقعی این تراشهها در مقایسه با راهحلهای داخلی بالاتر بود، طبق گزارش SemiAnalysis.
در نتیجه، پردازندههای گرافیکی هوش مصنوعی انویدیا نه تنها بر بخش سختافزار هوش مصنوعی جهانی به طور کلی، بلکه به طور خاص بر بخش سختافزار هوش مصنوعی چین تسلط یافتهاند. این امر این پردازندهها را به ابزارهای ژئوپلیتیکی تبدیل کرده است.
چگونه HGX H20 به عنوان ابزار سیاسی استفاده میشود
اوایل امسال، دولت بایدن سیاست خود را با عنوان قانون انتشار هوش مصنوعی معرفی کرد که صادرات پردازندههای گرافیکی پیشرفته به چین، روسیه و سایر کشورها را ممنوع میکرد، در حالی که قوانین کمی کمتر محدودکننده برای سایر کشورها پیشنهاد شد (حتی اگر به طور قابل توجهی بر عرضه تأثیر میگذاشتند). این قانون قرار بود در 15 می به اجرا درآید.
اگرچه دولت ترامپ قانون انتشار هوش مصنوعی را لغو کرد، اما سختافزار انویدیا و کنترلهای صادراتی مرتبط با آن، ابزار چانهزنی کلیدی در مذاکرات تجاری آمریکا و چین باقی ماندند.

قانون انتشار هوش مصنوعی جهان را به سه رده مجوز تقسیم میکرد. رده اول، متشکل از ایالات متحده و 18 متحد نزدیک، دسترسی نامحدود به تراشههای پیشرفته مانند H100 انویدیا را حفظ میکرد. رده دوم، شامل بیش از 100 کشور (از جمله متحدان نزدیک مانند کشورهای بالتیک، اسرائیل و لهستان)، با محدودیت تقریباً 50,000 پردازنده گرافیکی کلاس H100 در طول چندین سال مواجه میشدند، مگر اینکه تأیید کاربر نهایی تأیید شده (VEU) را دریافت کنند که نیاز به مذاکرات مستقیم با دولت ایالات متحده داشت.
با این حال، خریداران در این کشورهای رده 2 همچنان میتوانستند سالانه تا 1,700 پردازنده هوش مصنوعی رده بالا را بدون نیاز به مجوز وارد کنند، و اینها در سهمیه حساب نمیشدند. رده سوم — که شامل چین، روسیه و ماکائو بود — به دلیل ممنوعیتهای تسلیحاتی موجود، به طور کامل از دستیابی به پردازندههای پیشرفته منع میشدند. تحت این قانون، AMD و انویدیا توانایی فروش پردازندههای گرافیکی HGX H20 و Instinct MI308 را به نهادهای چینی از دست میدادند.
اخیراً، ترامپ اعتراف کرد که از وجود انویدیا بیخبر بوده است تا اینکه در گفتگویی با یک مشاور، کنترل غالب این شرکت بر بازار سختافزار آموزش هوش مصنوعی آشکار شد. در نتیجه، هنگامی که به او گفته شد انویدیا عملاً 100% سهم بازار را در اختیار دارد، او در ابتدا اقدام نظارتی برای تقسیم شرکت را پیشنهاد کرد تا فضایی برای رقبای بالقوه ایجاد شود.
با این حال، به او توصیه شد که حتی اگر ایالات متحده استعدادهای برتر را جمعآوری کرده و شرکتی به اندازه کافی بزرگ برای بقا و رقابت تشکیل دهد، باز هم حداقل یک دهه طول میکشد تا با قابلیتهای انویدیا برابری کند، حتی با فرض مدیریت ضعیف از سوی انویدیا. او همچنین اذعان داشت که برتری فناوری، انویدیا را به یک نیروی غالب در سطح جهانی تبدیل میکند که میتواند در صحنه ژئوپلیتیکی نقش مهمی ایفا کند.
در نتیجه، در حالی که دولت ترامپ قانون انتشار هوش مصنوعی را لغو کرد و به شرکتهای آمریکایی اجازه داد سختافزار خود را به چین ارسال کنند، نتوانست در برابر استفاده از کنترلهای صادراتی بر چندین شرکت پیشرو آمریکایی — از جمله AMD، انویدیا و همچنین سازندگان ابزارهای اتوماسیون طراحی الکترونیکی (EDA) مانند Cadence، Synopsys و Siemens EDA — به عنوان برگ برنده در مذاکرات دولت ترامپ با چین مقاومت کند. در اواسط آوریل، دولت ایالات متحده فروش HGX H20 و Instinct MI308 را به نهادهای چینی ممنوع کرد و در ماه می نیز فروش ابزارهای EDA را به مشتریان چینی ممنوع کرد. در نتیجه ممنوعیت صادرات پردازنده HGX H20 خود برای هوش مصنوعی، انویدیا مجبور شد 4.5 میلیارد دلار موجودی (شامل سیلیکونهای آماده ارسال و تعهدات به شریک تولیدی TSMC) را از ارزش دفتری خود حذف کند، در حالی که AMD 800 میلیون دلار را از ارزش دفتری خود حذف کرد.
با این حال، پس از اینکه چین با امضای یک توافق تجاری با ایالات متحده موافقت کرد و صادرات برخی فلزات خاکی کمیاب را تسهیل کرد، ایالات متحده به شرکتهای EDA اجازه داد با مشتریان چینی کار کنند و اعلام کرد که مجوزهای صادراتی برای پردازندههای HGX H20 و Instinct MI308 را صادر خواهد کرد. هنگامی که تندروهای چینی از این اقدام برای اجازه فروش باقیمانده موجودی H20 انویدیا به مشتریانش در چین انتقاد کردند، هوارد لوتنیک، وزیر بازرگانی، گزارشاً استدلال کرد که پردازندههای تأیید شده در پیوند دادن توسعهدهندگان هوش مصنوعی چینی به اکوسیستم CUDA انویدیا نقش اساسی خواهند داشت.
اما، از آنجایی که H20 نسخه کاهشیافتهای از پردازنده گرافیکی هوش مصنوعی پرچمدار سابق انویدیا است، به نهادهای چینی توانایی توسعه هوش مصنوعی قابل مقایسه با مدلهای ساخته شده در آمریکا را نمیدهد.
پاسخ چین
تلاش دولت ایالات متحده برای استفاده از سختافزارهای پیشرفته — از جمله HGX H20 انویدیا — به عنوان عناصر در مذاکرات ژئوپلیتیکی قطعاً مورد توجه دولت چین قرار گرفت، بنابراین در هفتههای اخیر اداره فضای مجازی چین (CAC) به شرکتهای بزرگ فناوری، از جمله علیبابا، بایتدنس و تنسنت، دستور داد خرید پردازندههای گرافیکی جدید H20 انویدیا را متوقف کنند در حالی که خطرات امنیتی احتمالی را بررسی میکند، با اشاره به نگرانیها از ویژگیهای ردیابی اجباری ایالات متحده و بکدورهای احتمالی، که انویدیا در بیانیهای آن را رد کرد و گفت:
“همانطور که هر دو دولت اذعان دارند، H20 یک محصول نظامی یا برای زیرساختهای دولتی نیست. چین عرضه کافی از تراشههای داخلی برای رفع نیازهای خود را دارد. این کشور هرگز به تراشههای آمریکایی برای عملیات دولتی متکی نبوده و نخواهد بود، درست همانطور که دولت ایالات متحده به تراشههای چینی متکی نخواهد بود. ممنوعیت فروش H20 در چین تنها به رهبری اقتصادی و فناوری ایالات متحده آسیب میرساند و هیچ منفعت امنیت ملی ندارد.”
مراکز داده بزرگ هوش مصنوعی و HPC را میتوان از فضا با استفاده از حسگرهای IR مشاهده کرد، و تقریباً تمام تراشههای موجود در آنجا را میتوان به طور نظری با استفاده از درایورهایشان ردیابی کرد، بنابراین مقامات چینی احتمالاً این موضوع را به یک مسئله سیاسی تبدیل میکنند.
“شما میتوانید مراکز داده را با حسگرهای IR از فضا ببینید،” جان پدی، رئیس Jon Peddie Research، در بیانیهای گفت. “پردازندههای گرافیکی و مرکزی مدتهاست که قابلیتهای تلهمتری از طریق درایور را داشتهاند. احتمالاً این یک مسیر دوطرفه است، که منجر به گمانهزنی چینیها میشود که انویدیا یا دولت ایالات متحده میتوانند تراشهها را از راه دور خاموش کنند. این خودکشی خواهد بود: چه کسی هرگز یک تراشه انویدیا یا هر تراشه آمریکایی را میخرید اگر فکر میکردید که تأمینکننده یا دولت ممکن است آن را خاموش کند؟”
انویدیا هرگونه بکدور یا سوئیچ قطعکننده در سختافزار خود را تکذیب کرده است، اما توقف ارسال H20 ضربهای از سوی مقامات چینی به انویدیا است. این گواهی بر این است که هوش مصنوعی — هم در جبهه سختافزار و هم نرمافزار — نه تنها یک فناوری استراتژیک مهم است، بلکه یک بخش جدید حیاتی از اقتصاد جهانی نیز محسوب میشود.
“امنیت سایبری برای ما بسیار مهم است. انویدیا هیچ ‘بکدوری’ در تراشههای خود ندارد که به کسی راهی برای دسترسی یا کنترل از راه دور آنها بدهد،” در بیانیهای از انویدیا آمده است.
تأثیر اقتصادی H20
از آنجایی که انویدیا دهها میلیارد دلار از سختافزار خود برای مراکز داده هوش مصنوعی درآمد کسب میکند، دولت ایالات متحده سهم خود را از موفقیت انویدیا میخواست. در نتیجه، تنها چند هفته پس از اعلام دولت ایالات متحده مبنی بر اعطای مجوزهای صادراتی برای پردازندههای Instinct MI308 AMD و HGX H20 انویدیا که به چین ارسال میشوند، مشخص شد که دولت ترامپ اساساً مالیات فروش بر این مجوزهای صادراتی اعمال کرده و شرکتها را مجبور کرده است 15% از درآمد خود از چین را با دولت ایالات متحده به اشتراک بگذارند.

پدی ادامه میدهد: “این یک مالیات فروش است، نه چیزی استراتژیک یا فنی.” “این نشاندهنده مالیات مضاعف است، چیزی که جمهوریخواهان قبلاً از آن بسیار ناراحت میشدند. این اکنون راه را برای مالیات فروش بر مجوزهای صادراتی برای همه چیز باز میکند، که خلاف انتظار است، زیرا دولت فعلی قصد دارد تراز تجاری را تغییر دهد.”
اعمال عوارض صادراتی طبق قانون اساسی ایالات متحده غیرقانونی است، اما این مانع از پیشنهاد این معامله توسط رئیس جمهور دونالد ترامپ نشد، و سپس وزارت بازرگانی مبنای قانونی برای آن معرفی کرد. برخی از تندروهای چینی در شاخه قانونگذاری ایالات متحده ادعا کردند که حتی ارسال HGX H20 به چین نیز خطرات امنیت ملی را به همراه دارد، اما نه برای دولت فعلی.
پدی گفت: “این تقریباً نشان میدهد که مسئله امنیت ملی یک انحراف است.” “آیا اگر مالیات قابل جمعآوری باشد، مسئله امنیتی نیست؟”
جالب اینجاست که اندکی پس از اینکه دولت ایالات متحده اعلام کرد مجوزهای صادراتی برای تامین HGX H20 انویدیا به چین را صادر خواهد کرد، منابع غیررسمی نزدیک به این شرکت گفتند که تولید این پردازندهها را از سر نخواهد گرفت، بلکه بر روی چیزی مبتنی بر بلکول تمرکز خواهد کرد. با این حال، انویدیا اندکی پس از آن سفارش دیگری برای 300,000 پردازنده گرافیکی H20 ثبت کرد.
چرخه تولید یک پردازنده کلاس 4 نانومتری در TSMC حدود سه ماه است. سپس، یک پردازنده گرافیکی مرکز داده باید بستهبندی شود که آن نیز زمان میبرد. این بدان معناست که انویدیا میتواند در بهترین حالت، یک محموله جدید از H20ها را در اواسط اکتبر دریافت کند. احتمالاً برای انویدیا منطقی نیست که در این مرحله سیلیکون GH100/H20 بیشتری تولید کند، اگرچه این شرکت احتمالاً به اندازه کافی دایهای GH100/GH200 با نقص دارد که میتوانند برای H20ها بازسازی شوند. اما اینکه آیا انویدیا میتواند آنها را به شرکتهای چینی ارسال کند یا خیر، اکنون یک سوال سیاسی است.
شرکتهای چینی قبلاً حدود 700,000 شتابدهنده هوش مصنوعی HGX H20 را سفارش داده بودند (که گمان میرود قیمت آنها بین 12,000 تا 14,000 دلار برای هر واحد باشد)، و مشخص نیست که آیا این توقف بر این محمولهها تأثیر میگذارد یا خیر، طبق گزارش The Information.
اگر چنین شود، انویدیا بدون بیش از 8.4 میلیارد تا 9.8 میلیارد دلار درآمد (زیرا این شرکت سختافزار مرکز داده زیادی را با پردازندههای گرافیکی خود میفروشد) و دولت ایالات متحده بدون بیش از 1.26 میلیارد یا 1.47 میلیارد دلار درآمد فدرال باقی خواهد ماند.
فراتر از HGX H20: شتابدهندههای هوش مصنوعی مبتنی بر بلکول برای چین؟
انویدیا نمونههایی از یک تراشه بلکول اصلاحشده را برای بازار چین عرضه کرده و در حال توسعه مدل دیگری است که به طور بالقوه سریعتر است و منتظر تأیید صادرات ایالات متحده است. دونالد ترامپ اخیراً تأیید کرد که دولت ایالات متحده ممکن است مجوز صادرات یک پردازنده گرافیکی مبتنی بر بلکول را برای چین صادر کند، که 30% تا 50% از عملکرد کامل آن را کاهش میدهد.

حتی با کاهش عملکرد 30 تا 50 درصدی، پردازندههای گرافیکی B100، B200 یا B300 انویدیا همچنان قدرت بسیار بیشتری نسبت به هر آنچه در چین موجود است، ارائه خواهند داد. در حال حاضر، بهترین گزینه برای شرکتهای چینی H20 HGX است که با 148 ترافلاپس FP16/BF16 و 296 ترافلاپس FP8 رتبهبندی شده است. یک B100 که به نصف کاهش یافته باشد، همچنان حدود 900 ترافلاپس FP16/BF16، 1.75 پتافلاپس PF8 و 3.5 پتافلاپس FP4 ارائه میدهد — که توسط هیچ تراشه هوش مصنوعی داخلی چینی قابل رقابت نیست.
H20 HGX در حال حاضر 3.3 تا 6.69 برابر کندتر از یک H100 کامل است، که عمداً برای رعایت کنترلهای صادراتی دوران بایدن بر پردازندههای گرافیکی پیشرفته هوش مصنوعی و HPC کاهش مقیاس یافته است. با این حال، حتی یک B100 که 50% کاهش یافته باشد، عملکردی نزدیک یا بهتر از H100 ارائه خواهد داد.
توسعه سیلیکون بلکول مخصوص چین ممکن است ایده خوبی برای انویدیا نباشد. در حالی که تولید آن ارزانتر از B100/B200/B300 خواهد بود، ممکن است الزامات چگالی عملکرد کنترلهای صادراتی 2023 ایالات متحده را برآورده نکند. اما باز هم، از آنجایی که ارسال HGX H20 به چین به یک مسئله سیاسی تبدیل شده است، دستورالعملهای رسمی قبلی ممکن است بیربط شوند.
پدی گفت: “فکر میکنم تلاش برای اعمال منطق و اقتصاد بر یک مسئله سیاسی کار دشواری خواهد بود.” “[قوانین کنترل صادرات] هر روز تغییر خواهند کرد و به آخرین مسائل سیاسی بستگی دارند.”
در حال حاضر، تنها منطقی است که منتظر بمانیم و ببینیم انویدیا و دولت ایالات متحده در مورد محصولات مبتنی بر بلکول برای چین چه تصمیمی میگیرند. اما یک چیز مسلم است: میدانیم که این اتفاق خواهد افتاد، و چین ممکن است تواناییهای هوش مصنوعی قویتری به دست آورد، هر زمان که این واحدها به کشور برسند.
- کولبات
- مرداد 24, 1404
- 40 بازدید






