Google deploys new Axion CPUs and seventh-gen Ironwood TPU — training and inferencing pods beat Nvidia GB300 and shape 'AI Hypercomputer' model | Tom's Hardware

گوگل پردازنده‌های مرکزی Axion و واحدهای پردازش تنسور Ironwood نسل هفتم خود را عرضه می‌کند

امروز، گوگل کلود نمونه‌های جدیدی با محوریت هوش مصنوعی را معرفی کرد که توسط پردازنده‌های مرکزی Axion و واحدهای پردازش تنسور (TPU) Ironwood خود گوگل قدرت می‌گیرند. این نمونه‌های جدید هم برای آموزش و هم برای استنتاج با تأخیر کم مدل‌های هوش مصنوعی در مقیاس بزرگ طراحی شده‌اند. ویژگی کلیدی این نمونه‌های جدید، مقیاس‌پذیری کارآمد مدل‌های هوش مصنوعی است که با اندازه مقیاس‌پذیری بسیار بزرگ سیستم‌های مبتنی بر Ironwood گوگل امکان‌پذیر شده است.

میلیون‌ها واحد پردازش تنسور Ironwood برای آموزش و استنتاج.

Ironwood واحد پردازش تنسور (TPU) نسل هفتم گوگل است که عملکردی معادل 4,614 ترافلاپس FP8 ارائه می‌دهد و به 192 گیگابایت حافظه HBM3E مجهز شده است که پهنای باندی تا 7.37 ترابایت بر ثانیه را فراهم می‌کند. پادهای Ironwood تا 9,216 شتاب‌دهنده هوش مصنوعی مقیاس‌پذیر هستند و در مجموع 42.5 اگزافلاپس FP8 برای آموزش و استنتاج ارائه می‌دهند که به مراتب از قابلیت‌های FP8 سیستم Nvidia GB300 NVL72 که 0.36 اگزافلاپس است، فراتر می‌رود. این پاد با استفاده از یک شبکه اختصاصی Inter-Chip Interconnect با سرعت 9.6 ترابیت بر ثانیه به هم متصل شده و در مجموع تقریباً 1.77 پتابایت حافظه HBM3E را حمل می‌کند که باز هم از آنچه پلتفرم رقیب انویدیا می‌تواند ارائه دهد، بیشتر است.

Google

پادهای Ironwood — مبتنی بر پردازنده‌های مرکزی Axion و واحدهای پردازش تنسور Ironwood — می‌توانند به خوشه‌هایی متشکل از صدها هزار واحد TPU متصل شوند که بخشی از «ابرکامپیوتر هوش مصنوعی» گوگل را تشکیل می‌دهند. این یک پلتفرم ابررایانشی یکپارچه است که محاسبات، ذخیره‌سازی و شبکه را تحت یک لایه مدیریتی واحد متحد می‌کند. برای افزایش قابلیت اطمینان پادهای فوق‌بزرگ و ابرکامپیوتر هوش مصنوعی، گوگل از ساختار قابل تنظیم مجدد خود به نام Optical Circuit Switching استفاده می‌کند که فوراً مسیرها را در اطراف هرگونه وقفه سخت‌افزاری تغییر می‌دهد تا عملیات مداوم حفظ شود.

داده‌های IDC مدل ابرکامپیوتر هوش مصنوعی را با میانگین بازگشت سرمایه (ROI) 353 درصدی در سه سال، 28 درصد کاهش هزینه‌های فناوری اطلاعات و 55 درصد افزایش کارایی عملیاتی برای مشتریان سازمانی اعتبار می‌بخشد.

چندین شرکت در حال حاضر پلتفرم مبتنی بر Ironwood گوگل را پذیرفته‌اند. Anthropic قصد دارد تا یک میلیون واحد TPU را برای عملیات و گسترش خانواده مدل‌های Claude خود استفاده کند و به مزایای عمده هزینه به عملکرد اشاره دارد. Lightricks نیز استقرار Ironwood را برای آموزش و ارائه سیستم چندوجهی LTX-2 خود آغاز کرده است.

پردازنده‌های مرکزی Axion: گوگل سرانجام پردازنده‌های طراحی‌شده داخلی خود را عرضه می‌کند

اگرچه شتاب‌دهنده‌های هوش مصنوعی مانند Ironwood گوگل در عصر محاسبات هوش مصنوعی تمایل دارند تمام توجه را به خود جلب کنند، اما پردازنده‌های مرکزی (CPU) همچنان برای منطق برنامه‌ها و میزبانی خدمات و همچنین اجرای برخی از بارهای کاری هوش مصنوعی، مانند دریافت داده‌ها، اهمیت حیاتی دارند. بنابراین، گوگل در کنار واحدهای پردازش تنسور (TPU) نسل هفتم خود، اولین پردازنده‌های عمومی مبتنی بر Armv9 خود را با نام Axion نیز عرضه می‌کند.

Google

گوگل مشخصات کامل دای پردازنده‌های مرکزی Axion خود را منتشر نکرده است: تعداد هسته‌های تأیید شده در هر دای (فراتر از 96 vCPU و 768 گیگابایت حافظه DDR5 برای نمونه C4A Metal)، سرعت کلاک اعلام شده و جزئیات عمومی گره فرآیند برای این قطعه وجود ندارد. آنچه می‌دانیم این است که Axion بر اساس پلتفرم Arm Neoverse v2 ساخته شده و طراحی شده است تا تا 50 درصد عملکرد بیشتر و تا 60 درصد بهره‌وری انرژی بالاتری نسبت به پردازنده‌های مرکزی x86 مدرن، و همچنین 30 درصد عملکرد بالاتر از «سریع‌ترین نمونه‌های عمومی مبتنی بر Arm موجود در فضای ابری امروز» ارائه دهد. گزارش‌هایی وجود دارد که این پردازنده مرکزی 2 مگابایت کش L2 خصوصی به ازای هر هسته، 80 مگابایت کش L3، پشتیبانی از حافظه DDR5-5600 MT/s و دسترسی یکپارچه به حافظه (UMA) برای گره‌ها را ارائه می‌دهد.

سرورهای مجهز به پردازنده‌های مرکزی Axion و Ironwood گوگل با کنترلرهای سفارشی با نام تجاری Titanium این شرکت عرضه می‌شوند که پردازش شبکه، امنیت و ورودی/خروجی ذخیره‌سازی را از پردازنده مرکزی میزبان بر عهده می‌گیرند و بدین ترتیب مدیریت بهتر و عملکرد بالاتری را به ارمغان می‌آورند.

به طور کلی، پردازنده‌های مرکزی Axion می‌توانند هم برای سرورهای هوش مصنوعی و هم برای سرورهای عمومی برای کارهای مختلف مورد استفاده قرار گیرند. در حال حاضر، گوگل سه پیکربندی Axion را ارائه می‌دهد: C4A، N4A و C4A metal.

C4A اولین و اصلی‌ترین پیشنهاد در خانواده نمونه‌های مبتنی بر Axion گوگل است و تنها نمونه‌ای است که در حال حاضر به طور عمومی در دسترس است. این نمونه تا 72 vCPU، 576 گیگابایت حافظه DDR5 و شبکه 100 گیگابیت بر ثانیه را ارائه می‌دهد که با ذخیره‌سازی SSD تیتانیوم با ظرفیت محلی تا 6 ترابایت همراه است. این نمونه برای عملکرد بالا و پایدار در کاربردهای مختلف بهینه‌سازی شده است.

نمونه بعدی N4A است که آن نیز برای بارهای کاری عمومی مانند پردازش داده، خدمات وب و محیط‌های توسعه طراحی شده است، اما تا 64 vCPU، 512 گیگابایت رم DDR5 و شبکه 50 گیگابیت بر ثانیه مقیاس‌پذیر است که آن را به گزینه‌ای مقرون‌به‌صرفه‌تر تبدیل می‌کند.

مدل پیش‌نمایش دیگر C4A Metal است که یک پیکربندی bare-metal است و احتمالاً پشته سخت‌افزاری کامل Axion را مستقیماً در اختیار مشتریان قرار می‌دهد: تا 96 vCPU، 768 گیگابایت حافظه DDR5 و شبکه 100 گیگابیت بر ثانیه. این نمونه برای کاربردهای تخصصی یا دارای محدودیت مجوز یا توسعه بومی Arm در نظر گرفته شده است.

مجموعه‌ای کامل از سیلیکون‌های سفارشی

این عرضه‌های جدید بر اساس یک دهه توسعه سیلیکون سفارشی گوگل بنا شده‌اند که با TPU اصلی آغاز شد و از طریق VCUهای یوتیوب، پردازنده‌های موبایل Tensor و زیرساخت Titanium ادامه یافت. پردازنده مرکزی Axion — اولین پردازنده سرور عمومی مبتنی بر Arm گوگل — مجموعه تراشه‌های سفارشی این شرکت را تکمیل می‌کند و TPUهای Ironwood زمینه را برای رقابت با بهترین شتاب‌دهنده‌های هوش مصنوعی در بازار فراهم می‌آورد.

Google Preferred Source

ما را در Google News دنبال کنید، یا ما را به عنوان منبع ترجیحی خود اضافه کنید، تا آخرین اخبار، تحلیل‌ها و بررسی‌های ما را در فیدهای خود دریافت کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

جستجو در سایت

سبد خرید

درحال بارگذاری ...
بستن
مقایسه
مقایسه محصولات
لیست مقایسه محصولات شما خالی می باشد!