سیستم خنککننده برای یک رک Nvidia Blackwell Ultra NVL72 به تنهایی ۵۰,۰۰۰ دلار هزینه دارد
بر اساس گزارشی که اخیراً توسط مورگان استنلی منتشر شده و توسط @Jukanlosreve به دست آمده است، ارزش کل قطعات خنککننده مایع در سیستم هوش مصنوعی مقیاس رک Nvidia GB300 NVL72 برابر با ۴۹,۸۶۰ دلار است. هزینه سیستم خنککننده مایع برای راهحل نسل بعدی Vera Rubin NVL144 این شرکت، ۱۷ درصد دیگر افزایش یافته و به ۵۵,۷۱۰ دلار خواهد رسید، زیرا پردازندههای گرافیکی Rubin و سوئیچهای NVLink نسل بعدی، مصرف انرژی بیشتری خواهند داشت.
هزینه فهرست مواد (BOM) سیستم خنککننده برای رک NVL72 ‘Oberon’ انویدیا — که شامل ۱۸ سینی محاسباتی (هر کدام حداقل ۶.۶ کیلووات* توان مصرف میکنند، اما به خنککنندگی برای ۶.۲ کیلووات* نیاز دارند) و ۹ سینی سوئیچ است — در مجموع ۴۹,۸۶۰ دلار میشود.
محتویات خنککننده یک سینی محاسباتی حدود ۲,۲۶۰ دلار ارزش دارد؛ بنابراین، قطعات خنککننده برای هر ۱۸ سینی محاسباتی ۴۰,۶۸۰ دلار هزینه دارند. در مقابل، یک سیستم خنککننده برای سینی NVSwitch ۱,۰۲۰ دلار هزینه دارد، بنابراین تمام قطعات خنککننده برای سینیهای سوئیچ حدود ۹,۱۸۰ دلار قیمت دارند. همانطور که انتظار میرود، گرانترین قطعات خنککننده برای سرورهای هوش مصنوعی، صفحات سرد با کارایی بالا و سفارشیسازی شده برای CPUها و GPUها هستند که هر واحد ۳۰۰ دلار هزینه دارند، و همچنین برای ASICهای NVSwitch که هر واحد ۲۰۰ دلار هزینه دارند.
به گفته مورگان استنلی، حرارت در پلتفرم Vera Rubin NVL144 که بر پردازندههای مرکزی Vera داغتر، پردازندههای گرافیکی Rubin (تا ۱,۸۰۰ وات در هر واحد) و ASICهای NVSwitch 6.0 نسل بعدی متکی خواهد بود، بیشتر افزایش مییابد و هزینه سیستم خنککننده در مقیاس رک را به ۵۵,۷۱۰ دلار میرساند که ۱۷ درصد نسبت به سیستم خنککننده GB300 افزایش یافته است.
مورگان استنلی انتظار دارد هزینه سیستم خنککننده سینی محاسباتی ۱۸ درصد افزایش یابد و به ۲,۶۶۰ دلار در هر سینی برسد که مجموع خنککنندگی محاسباتی در هر رک را به ۴۷,۸۸۰ دلار میرساند. تعداد سینیها ثابت میماند، اما هر کدام اکنون شامل صفحات سرد با ظرفیت بالاتر هستند که هر واحد ۴۰۰ دلار هزینه دارند. در مقابل، انتظار میرود سیستم خنککننده سینی سوئیچ ارزانتر شود: ۸۷۰ دلار در هر سینی و ۷,۸۳۰ دلار در هر رک.
با افزایش عملکرد CPUها و GPUها، مصرف انرژی آنها نیز افزایش مییابد، بنابراین به راهحلهای خنککننده پیشرفتهتر و بیشتری نیاز دارند. انتقال از GB200 NVL72 به GB300 NVL72 (افزایش ۲۰ درصدی برای سیستم خنککننده) و از GB300 NVL72 به Vera Rubin NVL144 (افزایش ۱۷ درصدی) این روند صعودی را به وضوح نشان میدهد.
با شروع از پردازندههای گرافیکی Rubin Ultra، انویدیا قرار است به چهار چیپلت محاسباتی و ۱۶ چیپلت HBM4E در هر بسته منتقل شود، که در نتیجه TDP را به ۳,۶۰۰ وات افزایش میدهد. این امر به صفحات سرد جدید یا حتی استفاده از خنککنندگی غوطهوری یا تعبیهشده، حداقل برای برخی موارد استفاده، نیاز خواهد داشت. خود انویدیا در حال آمادهسازی یک راهحل کاملاً جدید خنککننده مایع در مقیاس رک NVL576 ‘Kyber’ با ۱۴۴ بسته GPU است که عملکرد را در مقایسه با Vera Rubin NVL144 (که ۷۲ بسته GPU دارد) دو برابر خواهد کرد، اما با هزینه مصرف حرارتی بسیار بالاتر. صفحات سرد خاص برای پردازندههای گرافیکی Rubin Ultra انویدیا و سایر بهبودها در سیستم خنککننده آنها احتمالاً هزینه سیستم خنککننده NVL576 را افزایش خواهد داد. اینکه چقدر هزینه خواهد داشت هنوز مشخص نیست، اما صفحات سرد با کارایی بالا که قادر به حذف ۳.۶ کیلووات انرژی حرارتی از یک بسته GPU هستند، قطعاً به طور قابل توجهی بیشتر از ۴۰۰ دلار در هر واحد هزینه خواهند داشت.
*هر پردازنده گرافیکی دیتاسنتر Blackwell Ultra 1,400 وات، هر پردازنده مرکزی Grace 300 وات، و حافظه SOCAMM 200 وات در هر سوکت مصرف میکند. خنککننده مایع برای دو پردازنده مرکزی و هشت پردازنده گرافیکی در هر سینی استفاده میشود، در حالی که حافظه مجهز به پخشکنندههای حرارت است.

- کولبات
- آبان 14, 1404
- 25 بازدید






