انویدیا با سیستم Blackwell Ultra GB300 NVL72 خود رکوردهای جدیدی در بنچمارکهای MLPerf ثبت کرده است. این سیستم در تستهای DeepSeek R1، عملکرد استنتاج را تا ۴۵ درصد نسبت به پلتفرم GB200 افزایش داده و تا پنج برابر سریعتر از GPUهای قدیمیتر Hopper عمل میکند. این دستاورد نتیجه ترکیب بهبودهای سختافزاری، از جمله هستههای تنسور توانمندتر و NVLink با پهنای باند بالا، و بهینهسازیهای نرمافزاری مانند فرمت NVFP4 و قابلیت «خرد کردن» مدلها در چندین GPU است.
انویدیا این پلتفرم را به عنوان یک راهحل اقتصادی تحولآفرین برای «کارخانههای هوش مصنوعی» معرفی میکند که میتواند منجر به افزایش قابل توجهی در تولید درآمد شود. با شروع عرضه GB300 در ماه جاری، این نتایج بنچمارک جدید اهمیت استراتژیک این محصول را برای آینده بارهای کاری مراکز داده هوش مصنوعی نشان میدهد.
مراکز داده مدرن با چالش گرمای فزاینده پردازندههای هوش مصنوعی (مانند GPUهای انویدیا) روبرو هستند. در حالی که خنکسازی مایع مستقیم به تراشه (D2C) راهحل کنونی است، GPUهای آینده با مصرف برق بالاتر (مانند Feynman با 4.4 کیلووات) به خنکسازی غوطهوری نیاز خواهند داشت. این فناوری، که شامل قرار دادن تجهیزات در مایع دیالکتریک است، مزایایی چون کارایی و چگالی بالا را ارائه میدهد.
با این حال، خنکسازی غوطهوری با موانعی نظیر عدم اطمینان از قابلیت اطمینان قطعات، نبود زیرساختهای استاندارد و گران بودن مایعات تخصصی (مانند جایگزینهای 3M Novec) مواجه است. استقرارهای گسترده محدود بوده، اما همکاریهای اخیر اینتل، شل، سوپرمیکرو و سابمر برای راهحلهای تکفاز گواهیشده، پیشرفت را نشان میدهد. برای آمادهسازی اکوسیستم خنکسازی غوطهوری جهت نیازهای آینده مراکز داده هوش مصنوعی تا سالهای 2028-2029، اقدامات گستردهتری از سوی صنعت ضروری است.
انویدیا برنامههای خود را برای متحول کردن ارتباطات بین پردازندههای گرافیکی هوش مصنوعی در مراکز داده تا سال ۲۰۲۶ با استفاده از فوتونیک سیلیکونی و اپتیک همبستهبندیشده (CPO) اعلام کرده است. این فناوری برای پاسخگویی به نیازهای شدید خوشههای هوش مصنوعی طراحی شده و با ادغام موتور تبدیل نوری در کنار ASIC سوئیچ، اتلاف الکتریکی و مصرف برق را بهینهسازی میکند. این رویکرد منجر به افزایش کارایی، قابلیت اطمینان و مقیاسپذیری در سیستمهای هوش مصنوعی میشود.
این شرکت پلتفرمهای اتصال نوری CPO را برای اترنت (Spectrum-X Photonics) و اینفینیبند (Quantum-X InfiniBand) تا سال ۲۰۲۶ معرفی خواهد کرد که توان عملیاتی بسیار بالایی دارند. CPO یک نیاز ساختاری برای مراکز داده هوش مصنوعی آینده است. این فناوری با حذف قطعات مجزا، نصب و سرویسدهی آسانتر و کاهش مصرف برق، مزایای قابل توجهی در زمان راهاندازی و قابلیت اطمینان بلندمدت ارائه میدهد.
شرکت Normal Computing از تکمیل موفقیتآمیز طراحی و آمادهسازی برای تولید اولین تراشه محاسبات ترمودینامیکی جهان با نام CN101 خبر داد. این تراشه که برای مراکز داده هوش مصنوعی (AI) و محاسبات با عملکرد بالا (HPC) طراحی شده، رویکردی کاملاً متفاوت از روشهای سنتی مبتنی بر سیلیکون دارد. CN101 به جای مقابله با نویز، از اصول ترمودینامیک و سایر قوانین فیزیک بهره میبرد و به طور فعال از نویز، تصادفی بودن و عدم قطعیت برای حل مسائل استفاده میکند. این رویکرد به آن اجازه میدهد تا به کارایی محاسباتی دست یابد که تراشههای سنتی قادر به رقابت با آن نیستند.
برخلاف تراشههای معمولی که برای کارهای قطعی طراحی شدهاند، تراشههای ترمودینامیکی برای کاربردهای غیرقطعی بهینه شدهاند. این بدان معناست که CN101 برای وظایف پیچیده هوش مصنوعی مانند تولید تصویر، مدلهای انتشار و سایر فرآیندهای آموزشی بسیار مناسب است. زاخاری بلاتچ، سرپرست مهندسی سیلیکون در Normal Computing، تأکید میکند که فضای الگوریتمی که از این ویژگیها بهره میبرد، بسیار وسیع است و شامل محاسبات علمی، هوش مصنوعی و جبر خطی میشود. CN101 به طور خاص برای حل کارآمد عملیات جبر خطی و ماتریس، و همچنین محاسبات احتمالاتی طراحی شده است.
این تراشه میتواند تا 1000 برابر کارایی مصرف انرژی را در حجمهای کاری آموزش هوش مصنوعی در مراکز داده مدرن ارائه دهد. نقشه راه Normal برای خط تولید CN شامل عرضههایی در سالهای 2026 و 2028 است که هدف آن مقیاسپذیری برای مدلهای انتشار عکس و ویدئو است. هدف بلندمدت Normal Computing ایجاد اکوسیستمی است که در آن سرورهای آموزش هوش مصنوعی شامل ترکیبی از CPU، GPU، ASICهای ترمودینامیکی و حتی تراشههای احتمالاتی و کوانتومی باشند تا هر مشکل به کارآمدترین راهحل خود دست یابد. این فناوری میتواند نقش مهمی در آینده محاسبات با کارایی بالا ایفا کند، به خصوص با توجه به رشد نیازهای هوش مصنوعی و محدودیتهای محاسبات سیلیکونی.