Nvidia Rubin CPX forms one half of new, "disaggregated" AI inference architecture — approach splits work between compute- and bandwidth-optimized chips for best performance | Tom's Hardware

انویدیا روبین CPX نیمی از معماری جدید و «تفکیک‌شده» استنتاج هوش مصنوعی را تشکیل می‌دهد

انویدیا امروز از پردازنده گرافیکی جدید Rubin CPX خود رونمایی کرد، یک «پردازنده گرافیکی هدفمند که برای پاسخگویی به نیازهای بارهای کاری هوش مصنوعی با زمینه طولانی طراحی شده است.» پردازنده گرافیکی Rubin CPX، که نباید با پردازنده گرافیکی معمولی Rubin اشتباه گرفته شود، یک شتاب‌دهنده/پردازنده گرافیکی هوش مصنوعی است که بر به حداکثر رساندن عملکرد استنتاج در رک آتی Vera Rubin NVL144 CPX تمرکز دارد.

همانطور که بارهای کاری هوش مصنوعی تکامل می‌یابند، معماری‌های محاسباتی طراحی شده برای پشتیبانی از آن‌ها نیز به موازات آن در حال تکامل هستند. استراتژی جدید انویدیا برای تقویت استنتاج، که «استنتاج تفکیک‌شده» نامیده می‌شود، بر چندین نوع متمایز از پردازنده‌های گرافیکی متکی است که به صورت هماهنگ برای دستیابی به اوج عملکرد کار می‌کنند. پردازنده‌های گرافیکی متمرکز بر محاسبات، آنچه را که «فاز زمینه» می‌نامد، مدیریت خواهند کرد، در حالی که تراشه‌های مختلف متمرکز بر پهنای باند حافظه، «فاز تولید» با توان عملیاتی بالا را بر عهده خواهند گرفت.

این شرکت توضیح می‌دهد که بارهای کاری پیشرفته هوش مصنوعی شامل استدلال چند مرحله‌ای و حافظه پایدار، مانند تولید ویدیوی هوش مصنوعی یا هوش مصنوعی عامل‌محور، از در دسترس بودن حجم عظیمی از اطلاعات زمینه بهره‌مند می‌شوند. استنتاج برای این مدل‌های بزرگ هوش مصنوعی به مرز جدیدی برای توسعه سخت‌افزار هوش مصنوعی تبدیل شده است، برخلاف آموزش آن مدل‌ها.

به همین منظور، پردازنده گرافیکی Rubin CPX به عنوان یک اسب کاری برای فاز زمینه محاسباتی فشرده استنتاج تفکیک‌شده (جزئیات بیشتر در ادامه) طراحی شده است، در حالی که پردازنده گرافیکی استاندارد Rubin می‌تواند فاز تولید با محدودیت پهنای باند حافظه بیشتر را مدیریت کند.

Rubin CPX برای 30 پتافلاپس عملکرد محاسباتی خام بر روی نوع داده جدید NVFP4 این شرکت مناسب است و دارای 128 گیگابایت حافظه GDDR7 است. برای مقایسه، پردازنده گرافیکی استاندارد Rubin قادر خواهد بود به 50 پتافلاپس محاسبات FP4 دست یابد و با 288 گیگابایت حافظه HBM4 همراه است.

رندرهای اولیه پردازنده گرافیکی Rubin CPX، مانند تصویر بالا، به نظر می‌رسد دارای طراحی پردازنده گرافیکی تک‌دای هستند. پردازنده گرافیکی Rubin یک طراحی چیپلت دو-دای خواهد بود، و همانطور که توسط ComputerBase اشاره شد، نیمی از یک Rubin استاندارد 25 پتافلاپس FP4 خروجی می‌دهد؛ این باعث می‌شود برخی گمانه‌زنی کنند که Rubin CPX یک برش واحد و فوق‌بهینه‌سازی شده از یک پردازنده گرافیکی Rubin کامل است.

انتخاب گنجاندن GDDR7 به جای HBM4 نیز یکی از بهینه‌سازی‌ها است. همانطور که ذکر شد، گردش‌های کاری استنتاج تفکیک‌شده، فرآیند استنتاج را بین پردازنده‌های گرافیکی Rubin و Rubin CPX تقسیم می‌کنند. هنگامی که Rubin CPX بهینه‌سازی‌شده برای محاسبات، زمینه را برای یک کار ایجاد کرد، که پارامترهای عملکرد GDDR7 برای آن کافی است، سپس توپ را به پردازنده گرافیکی Rubin برای فاز تولید منتقل می‌کند، که از استفاده از حافظه با پهنای باند بالا بهره می‌برد.

Rubin CPX در رک Vera Rubin NVL144 CPX انویدیا، که همراه با Vera Rubin در سال 2026 عرضه می‌شود، در دسترس خواهد بود. این رک، که شامل 144 پردازنده گرافیکی Rubin، 144 پردازنده گرافیکی Rubin CPX، 36 پردازنده مرکزی Vera، 100 ترابایت حافظه پرسرعت و 1.7 پتابایت بر ثانیه پهنای باند حافظه خواهد بود، قرار است 8 اگزافلاپس NVFP4 تولید کند. این عملکرد 7.5 برابر بیشتر از GB300 NVL72 نسل فعلی است و 3.6 اگزافلاپس Vera Rubin NVL144 پایه بدون CPX را شکست می‌دهد.

انویدیا ادعا می‌کند که 100 میلیون دلار هزینه شده برای سیستم‌های هوش مصنوعی با Rubin CPX می‌تواند به 5 میلیارد دلار درآمد تبدیل شود. برای اطلاعات بیشتر در مورد آنچه که از پلتفرم هوش مصنوعی آتی Vera Rubin می‌دانیم، به پوشش ویژه ما از نقشه راه انویدیا مراجعه کنید. انتظار داریم Rubin، Rubin CPX و Vera Rubin را در مجموع در نمایشگاه GTC 2026 انویدیا در ماه مارس به صورت حضوری ببینیم.