The tale of Nvidia's HGX H20: How an AI GPU became a political lightning rod | Tom's Hardware

داستان HGX H20 انویدیا: چگونه یک پردازنده گرافیکی هوش مصنوعی به ابزار سیاسی تبدیل شد

پردازنده گرافیکی هوش مصنوعی HGX H20 انویدیا تنها بخش کوچکی از درآمد این شرکت را تشکیل می‌دهد، اما تعداد دفعات ذکر آن در رسانه‌های تجاری بسیار بیشتر از پردازنده‌های قدرتمندتر و سودآورتر H100 یا B200 این شرکت است. در واقع، این مدل خاص از پردازنده گرافیکی در چند ماه اخیر شهرت زیادی کسب کرده است، زیرا به کانون توجه در جنگ تجاری داغ آمریکا و چین تبدیل شده است.

تا حد زیادی، این اتفاق به این دلیل افتاد که HGX H20 یکی از معدود مدل‌های پردازنده گرافیکی برای بارهای کاری هوش مصنوعی بود که دولت بایدن به شرکت اجازه داد بدون هیچ مجوز صادراتی به چین ارسال کند. با این حال، دولت فعلی ترامپ از HGX H20 به عنوان یک ابزار ژئوپلیتیکی استفاده کرده و اکنون آن را به منبع درآمد فدرال تبدیل کرده است.

چرا HGX H20 انویدیا برجسته است

انویدیا اولین نسخه‌های کاهش‌یافته از پردازنده‌های گرافیکی پرچمدار خود، A800 و H800 را در سال 2022 برای بازار چین عرضه کرد. این زمانی بود که دولت جو بایدن ارسال سخت‌افزارهای رده سوپرکامپیوتر را به جمهوری خلق چین به دلایل امنیت ملی محدود کرد. در نتیجه، پهنای باند NVLink در A800 و H800 به ترتیب به 400 گیگابایت بر ثانیه و 450 گیگابایت بر ثانیه کاهش یافت و گزینه‌های توپولوژی اتصال محدود شد، که مقیاس‌پذیری چند پردازنده گرافیکی و کارایی آن‌ها را برای سوپرکامپیوترهایی که بارهای کاری سنگین ارتباطی را اجرا می‌کنند، محدود کرد. از نظر عملکرد، A800 و H800 از قدرت برادران کامل خود چندان عقب نبودند.

تراشه هوش مصنوعی H100

تا اواخر سال 2023، مشخص شد که نهادهای مستقر در چین موفق شده‌اند محدودیت‌ها را دور بزنند و از H800 برای آموزش هوش مصنوعی بدون هیچ مشکل قابل توجهی استفاده کنند و از عملکرد و کارایی معماری هاپر انویدیا بهره‌مند شوند. این سال‌ها جلوتر از هر چیزی بود که توسعه‌دهندگان چینی می‌توانستند ارائه دهند.

به همین منظور، دولت بایدن مقررات اداره صادرات (EAR) را با قوانین 3A090.a (که پردازنده‌های طراحی یا بازاریابی شده برای استفاده در مراکز داده را پوشش می‌دهد) و 3A090.b (که پردازنده‌هایی را پوشش می‌دهد که برای مراکز داده طراحی یا بازاریابی نشده‌اند) اعمال کرد که محدودیت‌های توان پردازشی کل (TPP) و چگالی عملکرد (PD) را بر تمام سخت‌افزارهای محاسباتی ارسال شده به چین اعمال کرد.

در نتیجه، انویدیا مجبور شد سیلیکون‌های GH100، AD102 و AD104 خود را کاهش دهد تا محصولات HGX H20، L20 PCIe و L2 PCIe خود را بسازد که هر دو محدودیت TPP و PD اعمال شده توسط دولت ایالات متحده را برآورده می‌کردند. در نتیجه، HGX H20 انویدیا در بارهای کاری هوش مصنوعی 3.3 تا 6.69 برابر کندتر از H100 و در بارهای کاری HPC که نیاز به دقت FP64 دارند، 34 تا 67 برابر کندتر از H100 بود. AMD نیز با پردازنده Instinct MI308 همین رویه را دنبال کرد.

اما در حالی که HGX H20 به طور قابل توجهی کندتر از همتای کامل خود یعنی H100 است، این واحد همچنان با پردازنده‌های هوش مصنوعی طراحی شده در چین کاملاً رقابتی است (حتی با وجود اینکه هوآوی سیستم‌های هوش مصنوعی در مقیاس رک دارد که پرچمدار GB200 NVL72 انویدیا را شکست می‌دهند).

علاوه بر این، از آنجایی که اکثر ارائه‌دهندگان خدمات ابری هایپراسکیل (CSPs) در چین به پشته نرم‌افزاری بسیار کارآمد CUDA انویدیا متکی هستند، آن‌ها با اشتیاق میلیاردها دلار پردازنده HGX H20 را برای بارهای کاری خود خریداری کرده‌اند، زیرا عملکرد واقعی این تراشه‌ها در مقایسه با راه‌حل‌های داخلی بالاتر بود، طبق گزارش SemiAnalysis.

در نتیجه، پردازنده‌های گرافیکی هوش مصنوعی انویدیا نه تنها بر بخش سخت‌افزار هوش مصنوعی جهانی به طور کلی، بلکه به طور خاص بر بخش سخت‌افزار هوش مصنوعی چین تسلط یافته‌اند. این امر این پردازنده‌ها را به ابزارهای ژئوپلیتیکی تبدیل کرده است.

چگونه HGX H20 به عنوان ابزار سیاسی استفاده می‌شود

اوایل امسال، دولت بایدن سیاست خود را با عنوان قانون انتشار هوش مصنوعی معرفی کرد که صادرات پردازنده‌های گرافیکی پیشرفته به چین، روسیه و سایر کشورها را ممنوع می‌کرد، در حالی که قوانین کمی کمتر محدودکننده برای سایر کشورها پیشنهاد شد (حتی اگر به طور قابل توجهی بر عرضه تأثیر می‌گذاشتند). این قانون قرار بود در 15 می به اجرا درآید.

اگرچه دولت ترامپ قانون انتشار هوش مصنوعی را لغو کرد، اما سخت‌افزار انویدیا و کنترل‌های صادراتی مرتبط با آن، ابزار چانه‌زنی کلیدی در مذاکرات تجاری آمریکا و چین باقی ماندند.

انویدیا

قانون انتشار هوش مصنوعی جهان را به سه رده مجوز تقسیم می‌کرد. رده اول، متشکل از ایالات متحده و 18 متحد نزدیک، دسترسی نامحدود به تراشه‌های پیشرفته مانند H100 انویدیا را حفظ می‌کرد. رده دوم، شامل بیش از 100 کشور (از جمله متحدان نزدیک مانند کشورهای بالتیک، اسرائیل و لهستان)، با محدودیت تقریباً 50,000 پردازنده گرافیکی کلاس H100 در طول چندین سال مواجه می‌شدند، مگر اینکه تأیید کاربر نهایی تأیید شده (VEU) را دریافت کنند که نیاز به مذاکرات مستقیم با دولت ایالات متحده داشت.

با این حال، خریداران در این کشورهای رده 2 همچنان می‌توانستند سالانه تا 1,700 پردازنده هوش مصنوعی رده بالا را بدون نیاز به مجوز وارد کنند، و اینها در سهمیه حساب نمی‌شدند. رده سوم — که شامل چین، روسیه و ماکائو بود — به دلیل ممنوعیت‌های تسلیحاتی موجود، به طور کامل از دستیابی به پردازنده‌های پیشرفته منع می‌شدند. تحت این قانون، AMD و انویدیا توانایی فروش پردازنده‌های گرافیکی HGX H20 و Instinct MI308 را به نهادهای چینی از دست می‌دادند.

اخیراً، ترامپ اعتراف کرد که از وجود انویدیا بی‌خبر بوده است تا اینکه در گفتگویی با یک مشاور، کنترل غالب این شرکت بر بازار سخت‌افزار آموزش هوش مصنوعی آشکار شد. در نتیجه، هنگامی که به او گفته شد انویدیا عملاً 100% سهم بازار را در اختیار دارد، او در ابتدا اقدام نظارتی برای تقسیم شرکت را پیشنهاد کرد تا فضایی برای رقبای بالقوه ایجاد شود.

با این حال، به او توصیه شد که حتی اگر ایالات متحده استعدادهای برتر را جمع‌آوری کرده و شرکتی به اندازه کافی بزرگ برای بقا و رقابت تشکیل دهد، باز هم حداقل یک دهه طول می‌کشد تا با قابلیت‌های انویدیا برابری کند، حتی با فرض مدیریت ضعیف از سوی انویدیا. او همچنین اذعان داشت که برتری فناوری، انویدیا را به یک نیروی غالب در سطح جهانی تبدیل می‌کند که می‌تواند در صحنه ژئوپلیتیکی نقش مهمی ایفا کند.

در نتیجه، در حالی که دولت ترامپ قانون انتشار هوش مصنوعی را لغو کرد و به شرکت‌های آمریکایی اجازه داد سخت‌افزار خود را به چین ارسال کنند، نتوانست در برابر استفاده از کنترل‌های صادراتی بر چندین شرکت پیشرو آمریکایی — از جمله AMD، انویدیا و همچنین سازندگان ابزارهای اتوماسیون طراحی الکترونیکی (EDA) مانند Cadence، Synopsys و Siemens EDA — به عنوان برگ برنده در مذاکرات دولت ترامپ با چین مقاومت کند. در اواسط آوریل، دولت ایالات متحده فروش HGX H20 و Instinct MI308 را به نهادهای چینی ممنوع کرد و در ماه می نیز فروش ابزارهای EDA را به مشتریان چینی ممنوع کرد. در نتیجه ممنوعیت صادرات پردازنده HGX H20 خود برای هوش مصنوعی، انویدیا مجبور شد 4.5 میلیارد دلار موجودی (شامل سیلیکون‌های آماده ارسال و تعهدات به شریک تولیدی TSMC) را از ارزش دفتری خود حذف کند، در حالی که AMD 800 میلیون دلار را از ارزش دفتری خود حذف کرد.

با این حال، پس از اینکه چین با امضای یک توافق تجاری با ایالات متحده موافقت کرد و صادرات برخی فلزات خاکی کمیاب را تسهیل کرد، ایالات متحده به شرکت‌های EDA اجازه داد با مشتریان چینی کار کنند و اعلام کرد که مجوزهای صادراتی برای پردازنده‌های HGX H20 و Instinct MI308 را صادر خواهد کرد. هنگامی که تندروهای چینی از این اقدام برای اجازه فروش باقیمانده موجودی H20 انویدیا به مشتریانش در چین انتقاد کردند، هوارد لوت‌نیک، وزیر بازرگانی، گزارشاً استدلال کرد که پردازنده‌های تأیید شده در پیوند دادن توسعه‌دهندگان هوش مصنوعی چینی به اکوسیستم CUDA انویدیا نقش اساسی خواهند داشت.

اما، از آنجایی که H20 نسخه کاهش‌یافته‌ای از پردازنده گرافیکی هوش مصنوعی پرچمدار سابق انویدیا است، به نهادهای چینی توانایی توسعه هوش مصنوعی قابل مقایسه با مدل‌های ساخته شده در آمریکا را نمی‌دهد.

پاسخ چین

تلاش دولت ایالات متحده برای استفاده از سخت‌افزارهای پیشرفته — از جمله HGX H20 انویدیا — به عنوان عناصر در مذاکرات ژئوپلیتیکی قطعاً مورد توجه دولت چین قرار گرفت، بنابراین در هفته‌های اخیر اداره فضای مجازی چین (CAC) به شرکت‌های بزرگ فناوری، از جمله علی‌بابا، بایت‌دنس و تنسنت، دستور داد خرید پردازنده‌های گرافیکی جدید H20 انویدیا را متوقف کنند در حالی که خطرات امنیتی احتمالی را بررسی می‌کند، با اشاره به نگرانی‌ها از ویژگی‌های ردیابی اجباری ایالات متحده و بک‌دورهای احتمالی، که انویدیا در بیانیه‌ای آن را رد کرد و گفت:

“همانطور که هر دو دولت اذعان دارند، H20 یک محصول نظامی یا برای زیرساخت‌های دولتی نیست. چین عرضه کافی از تراشه‌های داخلی برای رفع نیازهای خود را دارد. این کشور هرگز به تراشه‌های آمریکایی برای عملیات دولتی متکی نبوده و نخواهد بود، درست همانطور که دولت ایالات متحده به تراشه‌های چینی متکی نخواهد بود. ممنوعیت فروش H20 در چین تنها به رهبری اقتصادی و فناوری ایالات متحده آسیب می‌رساند و هیچ منفعت امنیت ملی ندارد.”

مراکز داده بزرگ هوش مصنوعی و HPC را می‌توان از فضا با استفاده از حسگرهای IR مشاهده کرد، و تقریباً تمام تراشه‌های موجود در آنجا را می‌توان به طور نظری با استفاده از درایورهایشان ردیابی کرد، بنابراین مقامات چینی احتمالاً این موضوع را به یک مسئله سیاسی تبدیل می‌کنند.

“شما می‌توانید مراکز داده را با حسگرهای IR از فضا ببینید،” جان پدی، رئیس Jon Peddie Research، در بیانیه‌ای گفت. “پردازنده‌های گرافیکی و مرکزی مدت‌هاست که قابلیت‌های تله‌متری از طریق درایور را داشته‌اند. احتمالاً این یک مسیر دوطرفه است، که منجر به گمانه‌زنی چینی‌ها می‌شود که انویدیا یا دولت ایالات متحده می‌توانند تراشه‌ها را از راه دور خاموش کنند. این خودکشی خواهد بود: چه کسی هرگز یک تراشه انویدیا یا هر تراشه آمریکایی را می‌خرید اگر فکر می‌کردید که تأمین‌کننده یا دولت ممکن است آن را خاموش کند؟”

انویدیا هرگونه بک‌دور یا سوئیچ قطع‌کننده در سخت‌افزار خود را تکذیب کرده است، اما توقف ارسال H20 ضربه‌ای از سوی مقامات چینی به انویدیا است. این گواهی بر این است که هوش مصنوعی — هم در جبهه سخت‌افزار و هم نرم‌افزار — نه تنها یک فناوری استراتژیک مهم است، بلکه یک بخش جدید حیاتی از اقتصاد جهانی نیز محسوب می‌شود.

“امنیت سایبری برای ما بسیار مهم است. انویدیا هیچ ‘بک‌دوری’ در تراشه‌های خود ندارد که به کسی راهی برای دسترسی یا کنترل از راه دور آن‌ها بدهد،” در بیانیه‌ای از انویدیا آمده است.

تأثیر اقتصادی H20

از آنجایی که انویدیا ده‌ها میلیارد دلار از سخت‌افزار خود برای مراکز داده هوش مصنوعی درآمد کسب می‌کند، دولت ایالات متحده سهم خود را از موفقیت انویدیا می‌خواست. در نتیجه، تنها چند هفته پس از اعلام دولت ایالات متحده مبنی بر اعطای مجوزهای صادراتی برای پردازنده‌های Instinct MI308 AMD و HGX H20 انویدیا که به چین ارسال می‌شوند، مشخص شد که دولت ترامپ اساساً مالیات فروش بر این مجوزهای صادراتی اعمال کرده و شرکت‌ها را مجبور کرده است 15% از درآمد خود از چین را با دولت ایالات متحده به اشتراک بگذارند.

انویدیا

پدی ادامه می‌دهد: “این یک مالیات فروش است، نه چیزی استراتژیک یا فنی.” “این نشان‌دهنده مالیات مضاعف است، چیزی که جمهوری‌خواهان قبلاً از آن بسیار ناراحت می‌شدند. این اکنون راه را برای مالیات فروش بر مجوزهای صادراتی برای همه چیز باز می‌کند، که خلاف انتظار است، زیرا دولت فعلی قصد دارد تراز تجاری را تغییر دهد.”

اعمال عوارض صادراتی طبق قانون اساسی ایالات متحده غیرقانونی است، اما این مانع از پیشنهاد این معامله توسط رئیس جمهور دونالد ترامپ نشد، و سپس وزارت بازرگانی مبنای قانونی برای آن معرفی کرد. برخی از تندروهای چینی در شاخه قانونگذاری ایالات متحده ادعا کردند که حتی ارسال HGX H20 به چین نیز خطرات امنیت ملی را به همراه دارد، اما نه برای دولت فعلی.

پدی گفت: “این تقریباً نشان می‌دهد که مسئله امنیت ملی یک انحراف است.” “آیا اگر مالیات قابل جمع‌آوری باشد، مسئله امنیتی نیست؟”

جالب اینجاست که اندکی پس از اینکه دولت ایالات متحده اعلام کرد مجوزهای صادراتی برای تامین HGX H20 انویدیا به چین را صادر خواهد کرد، منابع غیررسمی نزدیک به این شرکت گفتند که تولید این پردازنده‌ها را از سر نخواهد گرفت، بلکه بر روی چیزی مبتنی بر بلک‌ول تمرکز خواهد کرد. با این حال، انویدیا اندکی پس از آن سفارش دیگری برای 300,000 پردازنده گرافیکی H20 ثبت کرد.

چرخه تولید یک پردازنده کلاس 4 نانومتری در TSMC حدود سه ماه است. سپس، یک پردازنده گرافیکی مرکز داده باید بسته‌بندی شود که آن نیز زمان می‌برد. این بدان معناست که انویدیا می‌تواند در بهترین حالت، یک محموله جدید از H20ها را در اواسط اکتبر دریافت کند. احتمالاً برای انویدیا منطقی نیست که در این مرحله سیلیکون GH100/H20 بیشتری تولید کند، اگرچه این شرکت احتمالاً به اندازه کافی دای‌های GH100/GH200 با نقص دارد که می‌توانند برای H20ها بازسازی شوند. اما اینکه آیا انویدیا می‌تواند آن‌ها را به شرکت‌های چینی ارسال کند یا خیر، اکنون یک سوال سیاسی است.

شرکت‌های چینی قبلاً حدود 700,000 شتاب‌دهنده هوش مصنوعی HGX H20 را سفارش داده بودند (که گمان می‌رود قیمت آن‌ها بین 12,000 تا 14,000 دلار برای هر واحد باشد)، و مشخص نیست که آیا این توقف بر این محموله‌ها تأثیر می‌گذارد یا خیر، طبق گزارش The Information.

اگر چنین شود، انویدیا بدون بیش از 8.4 میلیارد تا 9.8 میلیارد دلار درآمد (زیرا این شرکت سخت‌افزار مرکز داده زیادی را با پردازنده‌های گرافیکی خود می‌فروشد) و دولت ایالات متحده بدون بیش از 1.26 میلیارد یا 1.47 میلیارد دلار درآمد فدرال باقی خواهد ماند.

فراتر از HGX H20: شتاب‌دهنده‌های هوش مصنوعی مبتنی بر بلک‌ول برای چین؟

انویدیا نمونه‌هایی از یک تراشه بلک‌ول اصلاح‌شده را برای بازار چین عرضه کرده و در حال توسعه مدل دیگری است که به طور بالقوه سریع‌تر است و منتظر تأیید صادرات ایالات متحده است. دونالد ترامپ اخیراً تأیید کرد که دولت ایالات متحده ممکن است مجوز صادرات یک پردازنده گرافیکی مبتنی بر بلک‌ول را برای چین صادر کند، که 30% تا 50% از عملکرد کامل آن را کاهش می‌دهد.

رک‌ها و سرورهای Nvidia Blackwell Ultra B300

حتی با کاهش عملکرد 30 تا 50 درصدی، پردازنده‌های گرافیکی B100، B200 یا B300 انویدیا همچنان قدرت بسیار بیشتری نسبت به هر آنچه در چین موجود است، ارائه خواهند داد. در حال حاضر، بهترین گزینه برای شرکت‌های چینی H20 HGX است که با 148 ترافلاپس FP16/BF16 و 296 ترافلاپس FP8 رتبه‌بندی شده است. یک B100 که به نصف کاهش یافته باشد، همچنان حدود 900 ترافلاپس FP16/BF16، 1.75 پتافلاپس PF8 و 3.5 پتافلاپس FP4 ارائه می‌دهد — که توسط هیچ تراشه هوش مصنوعی داخلی چینی قابل رقابت نیست.

H20 HGX در حال حاضر 3.3 تا 6.69 برابر کندتر از یک H100 کامل است، که عمداً برای رعایت کنترل‌های صادراتی دوران بایدن بر پردازنده‌های گرافیکی پیشرفته هوش مصنوعی و HPC کاهش مقیاس یافته است. با این حال، حتی یک B100 که 50% کاهش یافته باشد، عملکردی نزدیک یا بهتر از H100 ارائه خواهد داد.

توسعه سیلیکون بلک‌ول مخصوص چین ممکن است ایده خوبی برای انویدیا نباشد. در حالی که تولید آن ارزان‌تر از B100/B200/B300 خواهد بود، ممکن است الزامات چگالی عملکرد کنترل‌های صادراتی 2023 ایالات متحده را برآورده نکند. اما باز هم، از آنجایی که ارسال HGX H20 به چین به یک مسئله سیاسی تبدیل شده است، دستورالعمل‌های رسمی قبلی ممکن است بی‌ربط شوند.

پدی گفت: “فکر می‌کنم تلاش برای اعمال منطق و اقتصاد بر یک مسئله سیاسی کار دشواری خواهد بود.” “[قوانین کنترل صادرات] هر روز تغییر خواهند کرد و به آخرین مسائل سیاسی بستگی دارند.”

در حال حاضر، تنها منطقی است که منتظر بمانیم و ببینیم انویدیا و دولت ایالات متحده در مورد محصولات مبتنی بر بلک‌ول برای چین چه تصمیمی می‌گیرند. اما یک چیز مسلم است: می‌دانیم که این اتفاق خواهد افتاد، و چین ممکن است توانایی‌های هوش مصنوعی قوی‌تری به دست آورد، هر زمان که این واحدها به کشور برسند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

جستجو در سایت

سبد خرید

درحال بارگذاری ...
بستن
مقایسه
مقایسه محصولات
لیست مقایسه محصولات شما خالی می باشد!