انویدیا در CES 2026 از سوپرکامپیوتر هوش مصنوعی Vera Rubin NVL72 رونمایی کرد. این سیستم نسل بعدی، با وعده تا 5 برابر عملکرد استنتاجی بیشتر و 10 برابر هزینه کمتر به ازای هر توکن نسبت به Blackwell، گامی بزرگ در زیرساختهای هوش مصنوعی است. Vera Rubin حاصل “طراحی مشترک افراطی” شش نوع تراشه کلیدی (CPU، GPU، NVLink، DPU و سوئیچهای اترنت) است. هر پردازنده گرافیکی Rubin عملکرد بالا در استنتاج و آموزش با حافظه HBM4 ارائه میدهد. NVLink 6 پهنای باند شبکه را به شدت افزایش داده و پلتفرم ذخیرهسازی حافظه متنی استنتاجی، گلوگاههای عملکردی را رفع میکند.
این معماری جدید با بهبودهای RAS و امنیت، تعداد پردازندههای گرافیکی مورد نیاز برای آموزش مدلهای MoE را تا 1/4 کاهش داده و هزینه استنتاج را تا 10 برابر پایین میآورد. تولید انبوه سیستمهای Vera Rubin NVL72 برای نیمه دوم سال 2026 برنامهریزی شده است، که نویدبخش آیندهای کارآمدتر و مقیاسپذیرتر برای هوش مصنوعی است.
InferenceMax، بنچمارک متنباز جدید SemiAnalysis، رویکردی نوین در ارزیابی هوش مصنوعی ارائه میدهد. این ابزار به جای تمرکز بر سختافزار، کارایی پشتههای نرمافزاری هوش مصنوعی را در سناریوهای استنتاجی واقعی اندازهگیری میکند. نتایج روزانه منتشر شده و هدف آن ارائه معیارهای بیطرفانه و شبیهسازی کاربردهای دنیای واقعی است. تمرکز اصلی بر هزینه کل مالکیت (TCO) بر حسب دلار در هر میلیون توکن است، که به ارزیابی جامعتر و ردیابی تکامل نرمافزاری کمک میکند.
این بنچمارک تعادل توان عملیاتی و تعاملپذیری را بررسی کرده، نشان میدهد کارآمدترین GPU لزوماً سریعترین نیست. InferenceMax رقابت MI335X AMD با B200 انویدیا را از نظر TCO برجسته میکند و به نیاز به بهبود در کرنلهای FP4 AMD اشاره دارد. پروژه با همکاری فروشندگان، اشکالاتی را در تنظیمات هر دو شرکت کشف کرده است. InferenceMax از شتابدهندههای اصلی AMD و Nvidia پشتیبانی کرده و قصد دارد پشتیبانی از Tensor گوگل و AWS Trainium را نیز اضافه کند.
انویدیا با سیستم Blackwell Ultra GB300 NVL72 خود رکوردهای جدیدی در بنچمارکهای MLPerf ثبت کرده است. این سیستم در تستهای DeepSeek R1، عملکرد استنتاج را تا ۴۵ درصد نسبت به پلتفرم GB200 افزایش داده و تا پنج برابر سریعتر از GPUهای قدیمیتر Hopper عمل میکند. این دستاورد نتیجه ترکیب بهبودهای سختافزاری، از جمله هستههای تنسور توانمندتر و NVLink با پهنای باند بالا، و بهینهسازیهای نرمافزاری مانند فرمت NVFP4 و قابلیت «خرد کردن» مدلها در چندین GPU است.
انویدیا این پلتفرم را به عنوان یک راهحل اقتصادی تحولآفرین برای «کارخانههای هوش مصنوعی» معرفی میکند که میتواند منجر به افزایش قابل توجهی در تولید درآمد شود. با شروع عرضه GB300 در ماه جاری، این نتایج بنچمارک جدید اهمیت استراتژیک این محصول را برای آینده بارهای کاری مراکز داده هوش مصنوعی نشان میدهد.