بایگانی‌های AI Inference Performance - کول بایت | فروشگاه لوازم و قطعات کامپیوتر

انویدیا سوپرکامپیوتر هوش مصنوعی Vera Rubin NVL72 را در CES معرفی کرد

انویدیا در CES 2026 از سوپرکامپیوتر هوش مصنوعی Vera Rubin NVL72 رونمایی کرد. این سیستم نسل بعدی، با وعده تا 5 برابر عملکرد استنتاجی بیشتر و 10 برابر هزینه کمتر به ازای هر توکن نسبت به Blackwell، گامی بزرگ در زیرساخت‌های هوش مصنوعی است. Vera Rubin حاصل “طراحی مشترک افراطی” شش نوع تراشه کلیدی (CPU، GPU، NVLink، DPU و سوئیچ‌های اترنت) است. هر پردازنده گرافیکی Rubin عملکرد بالا در استنتاج و آموزش با حافظه HBM4 ارائه می‌دهد. NVLink 6 پهنای باند شبکه را به شدت افزایش داده و پلتفرم ذخیره‌سازی حافظه متنی استنتاجی، گلوگاه‌های عملکردی را رفع می‌کند.

این معماری جدید با بهبودهای RAS و امنیت، تعداد پردازنده‌های گرافیکی مورد نیاز برای آموزش مدل‌های MoE را تا 1/4 کاهش داده و هزینه استنتاج را تا 10 برابر پایین می‌آورد. تولید انبوه سیستم‌های Vera Rubin NVL72 برای نیمه دوم سال 2026 برنامه‌ریزی شده است، که نویدبخش آینده‌ای کارآمدتر و مقیاس‌پذیرتر برای هوش مصنوعی است.

کول‌بات
دی 16, 1404
- تکنولوژی

بنچمارک هوش مصنوعی InferenceMax پشته‌های نرم‌افزاری، کارایی و TCO را آزمایش می‌کند

InferenceMax، بنچمارک متن‌باز جدید SemiAnalysis، رویکردی نوین در ارزیابی هوش مصنوعی ارائه می‌دهد. این ابزار به جای تمرکز بر سخت‌افزار، کارایی پشته‌های نرم‌افزاری هوش مصنوعی را در سناریوهای استنتاجی واقعی اندازه‌گیری می‌کند. نتایج روزانه منتشر شده و هدف آن ارائه معیارهای بی‌طرفانه و شبیه‌سازی کاربردهای دنیای واقعی است. تمرکز اصلی بر هزینه کل مالکیت (TCO) بر حسب دلار در هر میلیون توکن است، که به ارزیابی جامع‌تر و ردیابی تکامل نرم‌افزاری کمک می‌کند.
این بنچمارک تعادل توان عملیاتی و تعامل‌پذیری را بررسی کرده، نشان می‌دهد کارآمدترین GPU لزوماً سریع‌ترین نیست. InferenceMax رقابت MI335X AMD با B200 انویدیا را از نظر TCO برجسته می‌کند و به نیاز به بهبود در کرنل‌های FP4 AMD اشاره دارد. پروژه با همکاری فروشندگان، اشکالاتی را در تنظیمات هر دو شرکت کشف کرده است. InferenceMax از شتاب‌دهنده‌های اصلی AMD و Nvidia پشتیبانی کرده و قصد دارد پشتیبانی از Tensor گوگل و AWS Trainium را نیز اضافه کند.

کول‌بات
مهر 22, 1404
- تکنولوژی

انویدیا ادعا می‌کند ارتقاء نرم‌افزاری و سخت‌افزاری به Blackwell Ultra GB300 اجازه می‌دهد تا بر بنچمارک‌های MLPerf مسلط شود

انویدیا با سیستم Blackwell Ultra GB300 NVL72 خود رکوردهای جدیدی در بنچمارک‌های MLPerf ثبت کرده است. این سیستم در تست‌های DeepSeek R1، عملکرد استنتاج را تا ۴۵ درصد نسبت به پلتفرم GB200 افزایش داده و تا پنج برابر سریع‌تر از GPUهای قدیمی‌تر Hopper عمل می‌کند. این دستاورد نتیجه ترکیب بهبودهای سخت‌افزاری، از جمله هسته‌های تنسور توانمندتر و NVLink با پهنای باند بالا، و بهینه‌سازی‌های نرم‌افزاری مانند فرمت NVFP4 و قابلیت «خرد کردن» مدل‌ها در چندین GPU است.

انویدیا این پلتفرم را به عنوان یک راه‌حل اقتصادی تحول‌آفرین برای «کارخانه‌های هوش مصنوعی» معرفی می‌کند که می‌تواند منجر به افزایش قابل توجهی در تولید درآمد شود. با شروع عرضه GB300 در ماه جاری، این نتایج بنچمارک جدید اهمیت استراتژیک این محصول را برای آینده بارهای کاری مراکز داده هوش مصنوعی نشان می‌دهد.