گوگل پلتفرم «ابرکامپیوتر هوش مصنوعی» خود را با پردازندههای مرکزی Axion و واحدهای پردازش تنسور (TPU) نسل هفتم Ironwood معرفی کرد. این سیستم برای آموزش و استنتاج مدلهای هوش مصنوعی در مقیاس بزرگ طراحی شده و پادهای Ironwood با 42.5 اگزافلاپس FP8، عملکردی فراتر از Nvidia GB300 NVL72 ارائه میدهند. این پلتفرم یکپارچه، محاسبات، ذخیرهسازی و شبکه را ترکیب میکند و شرکتهایی مانند Anthropic نیز از آن برای توسعه مدلهای Claude استفاده خواهند کرد که نشاندهنده مزایای هزینه به عملکرد آن است.
پردازندههای Axion، اولین پردازندههای عمومی مبتنی بر Armv9 گوگل، نیز عرضه شدهاند. این پردازندهها برای منطق برنامهها و بارهای کاری هوش مصنوعی طراحی شده و تا 50 درصد عملکرد بیشتر و تا 60 درصد بهرهوری انرژی بالاتری نسبت به پردازندههای x86 مدرن دارند. Axion در سه پیکربندی C4A، N4A و C4A Metal برای کاربردهای متنوعی در دسترس است. این حرکت گوگل، مجموعه تراشههای سفارشی این شرکت را تکمیل کرده و رقابت در بازار شتابدهندههای هوش مصنوعی را تشدید میکند.
مایکروسافت اولین کلاستر ابرکامپیوتری GB300 NVL72 جهان را در Azure راهاندازی کرده است. این کلاستر شامل 4,608 پردازنده گرافیکی GB300 انویدیا است که با NVLink 5 و InfiniBand Quantum-X800 متصل شدهاند. این سیستم توانایی 92.1 اگزافلاپس استنتاج FP4 را دارد و به بارهای کاری OpenAI اختصاص یافته تا آموزش مدلهای هوش مصنوعی را از ماهها به هفتهها تسریع بخشد. هر رک NVL72، 1,440 پتافلاپس عملکرد Tensor FP4 و 130 ترابایت بر ثانیه پهنای باند حافظه مستقیم را ارائه میدهد. این استقرار نقطه عطفی برای Grace Blackwell GB300 انویدیا است.
این پروژه بخشی از مشارکت استراتژیک انویدیا و OpenAI است که شامل سرمایهگذاری 100 میلیارد دلاری انویدیا در OpenAI و استفاده OpenAI از پردازندههای گرافیکی انویدیا برای زیرساختهای هوش مصنوعی نسل بعدی میشود. کلاستر GB300 NVL72 پیشدرآمدی برای این سرمایهگذاری عظیم است و تعهد مایکروسافت و انویدیا به پیشبرد قابلیتهای هوش مصنوعی را نشان میدهد.
گزارشها حاکی از آن است که آمازون و گوگل پیش از اعلام عمومی جزئیات تراشههای هوش مصنوعی خود، جنسن هوانگ، مدیرعامل انویدیا را مطلع میکنند. این رویه، تسلط بیچون و چرای انویدیا را در بازار سختافزار هوش مصنوعی، به ویژه در توان محاسباتی آموزش مدلها، آشکار میسازد. انویدیا عمیقاً در عملیات ابری این شرکتها ادغام شده و کنترل زنجیره تامین زیرساختهای هوش مصنوعی آنها را در دست دارد؛ از این رو، مشتریانش برای حفظ ارتباط با این تامینکننده، از غافلگیر کردن او اجتناب میکنند.
انویدیا با سرمایهگذاری میلیاردها دلاری در مشتریان، تامینکنندگان و رقبا (خرید ظرفیت GPU و همکاری با اینتل و OpenAI)، تسلط خود را بر بازار محکمتر میکند. این اقدامات با هدف پیشگیری از ظهور شتابدهندههای غیر GPU انجام میشود. با وجود تلاشهای آمازون و گوگل برای توسعه تراشههای داخلی، آنها همچنان به شدت به اکوسیستم CUDA و خط تولید انویدیا وابسته هستند. این وابستگی، خروج از اکوسیستم انویدیا را برای مشتریان دشوار کرده و قدرت کنونی این شرکت را در بازار هوش مصنوعی نشان میدهد.