انویدیا ادعا می‌کند ارتقاء نرم‌افزاری و سخت‌افزاری به Blackwell Ultra GB300 اجازه می‌دهد تا بر بنچمارک‌های MLPerf مسلط شود

انویدیا با سیستم Blackwell Ultra GB300 NVL72 خود رکوردهای جدیدی در بنچمارک‌های MLPerf ثبت کرده است. این سیستم در تست‌های DeepSeek R1، عملکرد استنتاج را تا ۴۵ درصد نسبت به پلتفرم GB200 افزایش داده و تا پنج برابر سریع‌تر از GPUهای قدیمی‌تر Hopper عمل می‌کند. این دستاورد نتیجه ترکیب بهبودهای سخت‌افزاری، از جمله هسته‌های تنسور توانمندتر و NVLink با پهنای باند بالا، و بهینه‌سازی‌های نرم‌افزاری مانند فرمت NVFP4 و قابلیت «خرد کردن» مدل‌ها در چندین GPU است.

انویدیا این پلتفرم را به عنوان یک راه‌حل اقتصادی تحول‌آفرین برای «کارخانه‌های هوش مصنوعی» معرفی می‌کند که می‌تواند منجر به افزایش قابل توجهی در تولید درآمد شود. با شروع عرضه GB300 در ماه جاری، این نتایج بنچمارک جدید اهمیت استراتژیک این محصول را برای آینده بارهای کاری مراکز داده هوش مصنوعی نشان می‌دهد.

خنک‌سازی غوطه‌وری برای مراکز داده: یک اجتناب‌ناپذیری عجیب؟

مراکز داده مدرن با چالش گرمای فزاینده پردازنده‌های هوش مصنوعی (مانند GPUهای انویدیا) روبرو هستند. در حالی که خنک‌سازی مایع مستقیم به تراشه (D2C) راه‌حل کنونی است، GPUهای آینده با مصرف برق بالاتر (مانند Feynman با 4.4 کیلووات) به خنک‌سازی غوطه‌وری نیاز خواهند داشت. این فناوری، که شامل قرار دادن تجهیزات در مایع دی‌الکتریک است، مزایایی چون کارایی و چگالی بالا را ارائه می‌دهد.

با این حال، خنک‌سازی غوطه‌وری با موانعی نظیر عدم اطمینان از قابلیت اطمینان قطعات، نبود زیرساخت‌های استاندارد و گران بودن مایعات تخصصی (مانند جایگزین‌های 3M Novec) مواجه است. استقرارهای گسترده محدود بوده، اما همکاری‌های اخیر اینتل، شل، سوپرمیکرو و سابمر برای راه‌حل‌های تک‌فاز گواهی‌شده، پیشرفت را نشان می‌دهد. برای آماده‌سازی اکوسیستم خنک‌سازی غوطه‌وری جهت نیازهای آینده مراکز داده هوش مصنوعی تا سال‌های 2028-2029، اقدامات گسترده‌تری از سوی صنعت ضروری است.

انویدیا برنامه‌های خود را برای استفاده از نور جهت ارتباط بین پردازنده‌های گرافیکی هوش مصنوعی تا سال ۲۰۲۶ تشریح می‌کند

انویدیا برنامه‌های خود را برای متحول کردن ارتباطات بین پردازنده‌های گرافیکی هوش مصنوعی در مراکز داده تا سال ۲۰۲۶ با استفاده از فوتونیک سیلیکونی و اپتیک هم‌بسته‌بندی‌شده (CPO) اعلام کرده است. این فناوری برای پاسخگویی به نیازهای شدید خوشه‌های هوش مصنوعی طراحی شده و با ادغام موتور تبدیل نوری در کنار ASIC سوئیچ، اتلاف الکتریکی و مصرف برق را بهینه‌سازی می‌کند. این رویکرد منجر به افزایش کارایی، قابلیت اطمینان و مقیاس‌پذیری در سیستم‌های هوش مصنوعی می‌شود.

این شرکت پلتفرم‌های اتصال نوری CPO را برای اترنت (Spectrum-X Photonics) و اینفینی‌بند (Quantum-X InfiniBand) تا سال ۲۰۲۶ معرفی خواهد کرد که توان عملیاتی بسیار بالایی دارند. CPO یک نیاز ساختاری برای مراکز داده هوش مصنوعی آینده است. این فناوری با حذف قطعات مجزا، نصب و سرویس‌دهی آسان‌تر و کاهش مصرف برق، مزایای قابل توجهی در زمان راه‌اندازی و قابلیت اطمینان بلندمدت ارائه می‌دهد.

اولین ‘تراشه محاسبات ترمودینامیکی’ جهان به مرحله تولید رسید

شرکت Normal Computing از تکمیل موفقیت‌آمیز طراحی و آماده‌سازی برای تولید اولین تراشه محاسبات ترمودینامیکی جهان با نام CN101 خبر داد. این تراشه که برای مراکز داده هوش مصنوعی (AI) و محاسبات با عملکرد بالا (HPC) طراحی شده، رویکردی کاملاً متفاوت از روش‌های سنتی مبتنی بر سیلیکون دارد. CN101 به جای مقابله با نویز، از اصول ترمودینامیک و سایر قوانین فیزیک بهره می‌برد و به طور فعال از نویز، تصادفی بودن و عدم قطعیت برای حل مسائل استفاده می‌کند. این رویکرد به آن اجازه می‌دهد تا به کارایی محاسباتی دست یابد که تراشه‌های سنتی قادر به رقابت با آن نیستند.

برخلاف تراشه‌های معمولی که برای کارهای قطعی طراحی شده‌اند، تراشه‌های ترمودینامیکی برای کاربردهای غیرقطعی بهینه شده‌اند. این بدان معناست که CN101 برای وظایف پیچیده هوش مصنوعی مانند تولید تصویر، مدل‌های انتشار و سایر فرآیندهای آموزشی بسیار مناسب است. زاخاری بلاتچ، سرپرست مهندسی سیلیکون در Normal Computing، تأکید می‌کند که فضای الگوریتمی که از این ویژگی‌ها بهره می‌برد، بسیار وسیع است و شامل محاسبات علمی، هوش مصنوعی و جبر خطی می‌شود. CN101 به طور خاص برای حل کارآمد عملیات جبر خطی و ماتریس، و همچنین محاسبات احتمالاتی طراحی شده است.

این تراشه می‌تواند تا 1000 برابر کارایی مصرف انرژی را در حجم‌های کاری آموزش هوش مصنوعی در مراکز داده مدرن ارائه دهد. نقشه راه Normal برای خط تولید CN شامل عرضه‌هایی در سال‌های 2026 و 2028 است که هدف آن مقیاس‌پذیری برای مدل‌های انتشار عکس و ویدئو است. هدف بلندمدت Normal Computing ایجاد اکوسیستمی است که در آن سرورهای آموزش هوش مصنوعی شامل ترکیبی از CPU، GPU، ASICهای ترمودینامیکی و حتی تراشه‌های احتمالاتی و کوانتومی باشند تا هر مشکل به کارآمدترین راه‌حل خود دست یابد. این فناوری می‌تواند نقش مهمی در آینده محاسبات با کارایی بالا ایفا کند، به خصوص با توجه به رشد نیازهای هوش مصنوعی و محدودیت‌های محاسبات سیلیکونی.

جستجو در سایت

سبد خرید

درحال بارگذاری ...
بستن
مقایسه
مقایسه محصولات
لیست مقایسه محصولات شما خالی می باشد!