گوگل پردازندههای مرکزی Axion و واحدهای پردازش تنسور Ironwood نسل هفتم خود را عرضه میکند
امروز، گوگل کلود نمونههای جدیدی با محوریت هوش مصنوعی را معرفی کرد که توسط پردازندههای مرکزی Axion و واحدهای پردازش تنسور (TPU) Ironwood خود گوگل قدرت میگیرند. این نمونههای جدید هم برای آموزش و هم برای استنتاج با تأخیر کم مدلهای هوش مصنوعی در مقیاس بزرگ طراحی شدهاند. ویژگی کلیدی این نمونههای جدید، مقیاسپذیری کارآمد مدلهای هوش مصنوعی است که با اندازه مقیاسپذیری بسیار بزرگ سیستمهای مبتنی بر Ironwood گوگل امکانپذیر شده است.
میلیونها واحد پردازش تنسور Ironwood برای آموزش و استنتاج.
Ironwood واحد پردازش تنسور (TPU) نسل هفتم گوگل است که عملکردی معادل 4,614 ترافلاپس FP8 ارائه میدهد و به 192 گیگابایت حافظه HBM3E مجهز شده است که پهنای باندی تا 7.37 ترابایت بر ثانیه را فراهم میکند. پادهای Ironwood تا 9,216 شتابدهنده هوش مصنوعی مقیاسپذیر هستند و در مجموع 42.5 اگزافلاپس FP8 برای آموزش و استنتاج ارائه میدهند که به مراتب از قابلیتهای FP8 سیستم Nvidia GB300 NVL72 که 0.36 اگزافلاپس است، فراتر میرود. این پاد با استفاده از یک شبکه اختصاصی Inter-Chip Interconnect با سرعت 9.6 ترابیت بر ثانیه به هم متصل شده و در مجموع تقریباً 1.77 پتابایت حافظه HBM3E را حمل میکند که باز هم از آنچه پلتفرم رقیب انویدیا میتواند ارائه دهد، بیشتر است.
پادهای Ironwood — مبتنی بر پردازندههای مرکزی Axion و واحدهای پردازش تنسور Ironwood — میتوانند به خوشههایی متشکل از صدها هزار واحد TPU متصل شوند که بخشی از «ابرکامپیوتر هوش مصنوعی» گوگل را تشکیل میدهند. این یک پلتفرم ابررایانشی یکپارچه است که محاسبات، ذخیرهسازی و شبکه را تحت یک لایه مدیریتی واحد متحد میکند. برای افزایش قابلیت اطمینان پادهای فوقبزرگ و ابرکامپیوتر هوش مصنوعی، گوگل از ساختار قابل تنظیم مجدد خود به نام Optical Circuit Switching استفاده میکند که فوراً مسیرها را در اطراف هرگونه وقفه سختافزاری تغییر میدهد تا عملیات مداوم حفظ شود.
دادههای IDC مدل ابرکامپیوتر هوش مصنوعی را با میانگین بازگشت سرمایه (ROI) 353 درصدی در سه سال، 28 درصد کاهش هزینههای فناوری اطلاعات و 55 درصد افزایش کارایی عملیاتی برای مشتریان سازمانی اعتبار میبخشد.
چندین شرکت در حال حاضر پلتفرم مبتنی بر Ironwood گوگل را پذیرفتهاند. Anthropic قصد دارد تا یک میلیون واحد TPU را برای عملیات و گسترش خانواده مدلهای Claude خود استفاده کند و به مزایای عمده هزینه به عملکرد اشاره دارد. Lightricks نیز استقرار Ironwood را برای آموزش و ارائه سیستم چندوجهی LTX-2 خود آغاز کرده است.
پردازندههای مرکزی Axion: گوگل سرانجام پردازندههای طراحیشده داخلی خود را عرضه میکند
اگرچه شتابدهندههای هوش مصنوعی مانند Ironwood گوگل در عصر محاسبات هوش مصنوعی تمایل دارند تمام توجه را به خود جلب کنند، اما پردازندههای مرکزی (CPU) همچنان برای منطق برنامهها و میزبانی خدمات و همچنین اجرای برخی از بارهای کاری هوش مصنوعی، مانند دریافت دادهها، اهمیت حیاتی دارند. بنابراین، گوگل در کنار واحدهای پردازش تنسور (TPU) نسل هفتم خود، اولین پردازندههای عمومی مبتنی بر Armv9 خود را با نام Axion نیز عرضه میکند.
گوگل مشخصات کامل دای پردازندههای مرکزی Axion خود را منتشر نکرده است: تعداد هستههای تأیید شده در هر دای (فراتر از 96 vCPU و 768 گیگابایت حافظه DDR5 برای نمونه C4A Metal)، سرعت کلاک اعلام شده و جزئیات عمومی گره فرآیند برای این قطعه وجود ندارد. آنچه میدانیم این است که Axion بر اساس پلتفرم Arm Neoverse v2 ساخته شده و طراحی شده است تا تا 50 درصد عملکرد بیشتر و تا 60 درصد بهرهوری انرژی بالاتری نسبت به پردازندههای مرکزی x86 مدرن، و همچنین 30 درصد عملکرد بالاتر از «سریعترین نمونههای عمومی مبتنی بر Arm موجود در فضای ابری امروز» ارائه دهد. گزارشهایی وجود دارد که این پردازنده مرکزی 2 مگابایت کش L2 خصوصی به ازای هر هسته، 80 مگابایت کش L3، پشتیبانی از حافظه DDR5-5600 MT/s و دسترسی یکپارچه به حافظه (UMA) برای گرهها را ارائه میدهد.
سرورهای مجهز به پردازندههای مرکزی Axion و Ironwood گوگل با کنترلرهای سفارشی با نام تجاری Titanium این شرکت عرضه میشوند که پردازش شبکه، امنیت و ورودی/خروجی ذخیرهسازی را از پردازنده مرکزی میزبان بر عهده میگیرند و بدین ترتیب مدیریت بهتر و عملکرد بالاتری را به ارمغان میآورند.
به طور کلی، پردازندههای مرکزی Axion میتوانند هم برای سرورهای هوش مصنوعی و هم برای سرورهای عمومی برای کارهای مختلف مورد استفاده قرار گیرند. در حال حاضر، گوگل سه پیکربندی Axion را ارائه میدهد: C4A، N4A و C4A metal.
C4A اولین و اصلیترین پیشنهاد در خانواده نمونههای مبتنی بر Axion گوگل است و تنها نمونهای است که در حال حاضر به طور عمومی در دسترس است. این نمونه تا 72 vCPU، 576 گیگابایت حافظه DDR5 و شبکه 100 گیگابیت بر ثانیه را ارائه میدهد که با ذخیرهسازی SSD تیتانیوم با ظرفیت محلی تا 6 ترابایت همراه است. این نمونه برای عملکرد بالا و پایدار در کاربردهای مختلف بهینهسازی شده است.
نمونه بعدی N4A است که آن نیز برای بارهای کاری عمومی مانند پردازش داده، خدمات وب و محیطهای توسعه طراحی شده است، اما تا 64 vCPU، 512 گیگابایت رم DDR5 و شبکه 50 گیگابیت بر ثانیه مقیاسپذیر است که آن را به گزینهای مقرونبهصرفهتر تبدیل میکند.
مدل پیشنمایش دیگر C4A Metal است که یک پیکربندی bare-metal است و احتمالاً پشته سختافزاری کامل Axion را مستقیماً در اختیار مشتریان قرار میدهد: تا 96 vCPU، 768 گیگابایت حافظه DDR5 و شبکه 100 گیگابیت بر ثانیه. این نمونه برای کاربردهای تخصصی یا دارای محدودیت مجوز یا توسعه بومی Arm در نظر گرفته شده است.
مجموعهای کامل از سیلیکونهای سفارشی
این عرضههای جدید بر اساس یک دهه توسعه سیلیکون سفارشی گوگل بنا شدهاند که با TPU اصلی آغاز شد و از طریق VCUهای یوتیوب، پردازندههای موبایل Tensor و زیرساخت Titanium ادامه یافت. پردازنده مرکزی Axion — اولین پردازنده سرور عمومی مبتنی بر Arm گوگل — مجموعه تراشههای سفارشی این شرکت را تکمیل میکند و TPUهای Ironwood زمینه را برای رقابت با بهترین شتابدهندههای هوش مصنوعی در بازار فراهم میآورد.
ما را در Google News دنبال کنید، یا ما را به عنوان منبع ترجیحی خود اضافه کنید، تا آخرین اخبار، تحلیلها و بررسیهای ما را در فیدهای خود دریافت کنید.
- کولبات
- آبان 15, 1404
- 61 بازدید






