انویدیا روبین CPX نیمی از معماری جدید و «تفکیکشده» استنتاج هوش مصنوعی را تشکیل میدهد
انویدیا امروز از پردازنده گرافیکی جدید Rubin CPX خود رونمایی کرد، یک «پردازنده گرافیکی هدفمند که برای پاسخگویی به نیازهای بارهای کاری هوش مصنوعی با زمینه طولانی طراحی شده است.» پردازنده گرافیکی Rubin CPX، که نباید با پردازنده گرافیکی معمولی Rubin اشتباه گرفته شود، یک شتابدهنده/پردازنده گرافیکی هوش مصنوعی است که بر به حداکثر رساندن عملکرد استنتاج در رک آتی Vera Rubin NVL144 CPX تمرکز دارد.
همانطور که بارهای کاری هوش مصنوعی تکامل مییابند، معماریهای محاسباتی طراحی شده برای پشتیبانی از آنها نیز به موازات آن در حال تکامل هستند. استراتژی جدید انویدیا برای تقویت استنتاج، که «استنتاج تفکیکشده» نامیده میشود، بر چندین نوع متمایز از پردازندههای گرافیکی متکی است که به صورت هماهنگ برای دستیابی به اوج عملکرد کار میکنند. پردازندههای گرافیکی متمرکز بر محاسبات، آنچه را که «فاز زمینه» مینامد، مدیریت خواهند کرد، در حالی که تراشههای مختلف متمرکز بر پهنای باند حافظه، «فاز تولید» با توان عملیاتی بالا را بر عهده خواهند گرفت.
این شرکت توضیح میدهد که بارهای کاری پیشرفته هوش مصنوعی شامل استدلال چند مرحلهای و حافظه پایدار، مانند تولید ویدیوی هوش مصنوعی یا هوش مصنوعی عاملمحور، از در دسترس بودن حجم عظیمی از اطلاعات زمینه بهرهمند میشوند. استنتاج برای این مدلهای بزرگ هوش مصنوعی به مرز جدیدی برای توسعه سختافزار هوش مصنوعی تبدیل شده است، برخلاف آموزش آن مدلها.
به همین منظور، پردازنده گرافیکی Rubin CPX به عنوان یک اسب کاری برای فاز زمینه محاسباتی فشرده استنتاج تفکیکشده (جزئیات بیشتر در ادامه) طراحی شده است، در حالی که پردازنده گرافیکی استاندارد Rubin میتواند فاز تولید با محدودیت پهنای باند حافظه بیشتر را مدیریت کند.
Rubin CPX برای 30 پتافلاپس عملکرد محاسباتی خام بر روی نوع داده جدید NVFP4 این شرکت مناسب است و دارای 128 گیگابایت حافظه GDDR7 است. برای مقایسه، پردازنده گرافیکی استاندارد Rubin قادر خواهد بود به 50 پتافلاپس محاسبات FP4 دست یابد و با 288 گیگابایت حافظه HBM4 همراه است.
رندرهای اولیه پردازنده گرافیکی Rubin CPX، مانند تصویر بالا، به نظر میرسد دارای طراحی پردازنده گرافیکی تکدای هستند. پردازنده گرافیکی Rubin یک طراحی چیپلت دو-دای خواهد بود، و همانطور که توسط ComputerBase اشاره شد، نیمی از یک Rubin استاندارد 25 پتافلاپس FP4 خروجی میدهد؛ این باعث میشود برخی گمانهزنی کنند که Rubin CPX یک برش واحد و فوقبهینهسازی شده از یک پردازنده گرافیکی Rubin کامل است.
انتخاب گنجاندن GDDR7 به جای HBM4 نیز یکی از بهینهسازیها است. همانطور که ذکر شد، گردشهای کاری استنتاج تفکیکشده، فرآیند استنتاج را بین پردازندههای گرافیکی Rubin و Rubin CPX تقسیم میکنند. هنگامی که Rubin CPX بهینهسازیشده برای محاسبات، زمینه را برای یک کار ایجاد کرد، که پارامترهای عملکرد GDDR7 برای آن کافی است، سپس توپ را به پردازنده گرافیکی Rubin برای فاز تولید منتقل میکند، که از استفاده از حافظه با پهنای باند بالا بهره میبرد.
Rubin CPX در رک Vera Rubin NVL144 CPX انویدیا، که همراه با Vera Rubin در سال 2026 عرضه میشود، در دسترس خواهد بود. این رک، که شامل 144 پردازنده گرافیکی Rubin، 144 پردازنده گرافیکی Rubin CPX، 36 پردازنده مرکزی Vera، 100 ترابایت حافظه پرسرعت و 1.7 پتابایت بر ثانیه پهنای باند حافظه خواهد بود، قرار است 8 اگزافلاپس NVFP4 تولید کند. این عملکرد 7.5 برابر بیشتر از GB300 NVL72 نسل فعلی است و 3.6 اگزافلاپس Vera Rubin NVL144 پایه بدون CPX را شکست میدهد.
انویدیا ادعا میکند که 100 میلیون دلار هزینه شده برای سیستمهای هوش مصنوعی با Rubin CPX میتواند به 5 میلیارد دلار درآمد تبدیل شود. برای اطلاعات بیشتر در مورد آنچه که از پلتفرم هوش مصنوعی آتی Vera Rubin میدانیم، به پوشش ویژه ما از نقشه راه انویدیا مراجعه کنید. انتظار داریم Rubin، Rubin CPX و Vera Rubin را در مجموع در نمایشگاه GTC 2026 انویدیا در ماه مارس به صورت حضوری ببینیم.
- کولبات
- شهریور 19, 1404
- 44 بازدید






