بنچمارک هوش مصنوعی InferenceMax پشته‌های نرم‌افزاری، کارایی و TCO را آزمایش می‌کند

InferenceMax، بنچمارک متن‌باز جدید SemiAnalysis، رویکردی نوین در ارزیابی هوش مصنوعی ارائه می‌دهد. این ابزار به جای تمرکز بر سخت‌افزار، کارایی پشته‌های نرم‌افزاری هوش مصنوعی را در سناریوهای استنتاجی واقعی اندازه‌گیری می‌کند. نتایج روزانه منتشر شده و هدف آن ارائه معیارهای بی‌طرفانه و شبیه‌سازی کاربردهای دنیای واقعی است. تمرکز اصلی بر هزینه کل مالکیت (TCO) بر حسب دلار در هر میلیون توکن است، که به ارزیابی جامع‌تر و ردیابی تکامل نرم‌افزاری کمک می‌کند.
این بنچمارک تعادل توان عملیاتی و تعامل‌پذیری را بررسی کرده، نشان می‌دهد کارآمدترین GPU لزوماً سریع‌ترین نیست. InferenceMax رقابت MI335X AMD با B200 انویدیا را از نظر TCO برجسته می‌کند و به نیاز به بهبود در کرنل‌های FP4 AMD اشاره دارد. پروژه با همکاری فروشندگان، اشکالاتی را در تنظیمات هر دو شرکت کشف کرده است. InferenceMax از شتاب‌دهنده‌های اصلی AMD و Nvidia پشتیبانی کرده و قصد دارد پشتیبانی از Tensor گوگل و AWS Trainium را نیز اضافه کند.

انویدیا ادعا می‌کند ارتقاء نرم‌افزاری و سخت‌افزاری به Blackwell Ultra GB300 اجازه می‌دهد تا بر بنچمارک‌های MLPerf مسلط شود

انویدیا با سیستم Blackwell Ultra GB300 NVL72 خود رکوردهای جدیدی در بنچمارک‌های MLPerf ثبت کرده است. این سیستم در تست‌های DeepSeek R1، عملکرد استنتاج را تا ۴۵ درصد نسبت به پلتفرم GB200 افزایش داده و تا پنج برابر سریع‌تر از GPUهای قدیمی‌تر Hopper عمل می‌کند. این دستاورد نتیجه ترکیب بهبودهای سخت‌افزاری، از جمله هسته‌های تنسور توانمندتر و NVLink با پهنای باند بالا، و بهینه‌سازی‌های نرم‌افزاری مانند فرمت NVFP4 و قابلیت «خرد کردن» مدل‌ها در چندین GPU است.

انویدیا این پلتفرم را به عنوان یک راه‌حل اقتصادی تحول‌آفرین برای «کارخانه‌های هوش مصنوعی» معرفی می‌کند که می‌تواند منجر به افزایش قابل توجهی در تولید درآمد شود. با شروع عرضه GB300 در ماه جاری، این نتایج بنچمارک جدید اهمیت استراتژیک این محصول را برای آینده بارهای کاری مراکز داده هوش مصنوعی نشان می‌دهد.

جستجو در سایت

سبد خرید

درحال بارگذاری ...
بستن
مقایسه
مقایسه محصولات
لیست مقایسه محصولات شما خالی می باشد!