بر اساس یک پروفایل لینکدین، AMD در حال کار بر روی یک پردازنده گرافیکی مبتنی بر چیپلت دیگر است
خط تولید فعلی سری RX 9000 رادئون AMD که بر پایه معماری RDNA 4 است، تلاشی برای به چالش کشیدن انویدیا در بازار پردازندههای گرافیکی ردهبالای دسکتاپ ندارد. Radeon RX 9070 XT که در صدر این سری قرار دارد، با GeForce RTX 5070 Ti میانرده انویدیا، یکی از بهترین کارتهای گرافیک موجود، رقابت میکند. اما به نظر میرسد که بخش گرافیک این شرکت، طبق پروفایل لینکدین یکی از اعضای ارشد آن، برای نسل بعدی یک یا دو برگ برنده در آستین دارد.
لاکس پاپو، عضو ارشد و معمار اصلی سیستم روی تراشه (SoC) در AMD، طبق پروفایل لینکدین خود، مسئول توسعه پردازندههای گرافیکی دیتاسنتر AMD و همچنین معماری محصولات رادئون برای بازیهای ابری، نسلهای Navi4x و Navi5x است. او شغل خود را “ساخت SoCهای گرافیکی رقابتی نسل بعدی مبتنی بر چیپلت 2.5D/3.5D و یکپارچه بر روی فناوریهای بستهبندی مختلف” توصیف میکند، که تقریباً به این معنی است که پردازندههای گرافیکی نسل بعدی AMD از آرایشهای یکپارچه و چند چیپلت استفاده خواهند کرد.
لاکس پاپو در آگوست 2022، پس از بیش از 25 سال فعالیت در اینتل، به AMD پیوست. او در اینتل مسئول پردازندههای گرافیکی مجزای این شرکت با نامهای رمز DG1، Alchemist و Battlemage بود. او همچنین “پردازندههای گرافیکی چندتایلی” را برای کارتهای گرافیک ردهبالا بررسی کرده بود، اگرچه در حال حاضر محصولات دو پردازنده گرافیکی Battlemage بیشتر برای بارهای کاری هوش مصنوعی هدفگذاری شدهاند تا گرافیک.
پردازندههای گرافیکی ردهبالا برای بازی و دیتاسنترها اغلب یک چرخه توسعه 2.5 تا 3.5 ساله را دنبال میکنند، از مفهوم معماری تا محصول نهایی (تعریف معماری و برنامهریزی در سطح بلوک: حدود یک سال طول میکشد، سپس پیادهسازی فیزیکی بسته به پیچیدگی طراحی و تعداد ترانزیستورها 1 تا 1.5 سال دیگر زمان میبرد، و سپس مرحله تولید و راهاندازی سیلیکون یک سال دیگر). هنگامی که پاپو در آگوست 2022 به AMD پیوست، معماریهای RDNA 4 و CDNA 4 قبلاً تعریف شده بودند، اما او میتوانست تأثیر قابل توجهی بر پیادهسازی فیزیکی (از نظر تعادلها)، پیکربندی بلوک، مبادلات توان/عملکرد و تنظیم نهایی سیلیکون داشته باشد. به همین دلیل، در حالی که او مسئول تعریف یا توسعه معماری RDNA 4 و CDNA 4 نبود، تأثیر او بر محصولات سری Radeon RX 9000 و Instinct MI350 قابل توجه بود.
در همین حال، از آنجایی که او در نسل Navi 5x و احتمالاً نسل Instinct MI500-series دخیل است، اینها اولین معماریهایی خواهند بود که او از ابتدا رهبری کرده است، بنابراین او تأثیر کاملی بر چرخه توسعه دارد. ظاهراً، Navi 5x میتواند از بستهبندی 2.5D یا 3.5D استفاده کند، اگر شرح شغل پاپو در لینکدین دقیق باشد.
در حالی که پردازندههای گرافیکی دیتاسنتر سری Instinct MI300 AMD و سری Blackwell انویدیا برای هوش مصنوعی و HPC از طراحیهای تفکیکشده استفاده میکنند، هیچ یک از پردازندههای گرافیکی کلاینت موجود به معماری چندتایلی متکی نیستند (به جز Navi 31، اما این طراحی را به روشی متفاوت تفکیک میکند).
ساخت پردازندههای گرافیکی چندتایلی برای مصرفکنندگان به دلیل ماهیت بسیار مرتبط بارهای کاری پردازش گرافیکی و نیاز به ارتباط فوقسریع و با تأخیر کم بین واحدهای پردازشی، بسیار چالشبرانگیز است. برخلاف CPUها که میتوانند تا حدی تأخیر را در هستهها یا چیپلتها تحمل کنند، پردازندههای گرافیکی به هزاران رشته موازی متکی هستند که باید دقیق و سریع، به ویژه در داخل warps یا گروههای رشته، هماهنگ شوند. تفکیک هستههای سایهزن در چندین دای، سربار همگامسازی، جریمههای تأخیر و الزامات پیچیده سازگاری را به همراه دارد که میتواند عملکرد را به طور قابل توجهی کاهش دهد یا مصرف برق را افزایش دهد. علاوه بر این، حفظ پهنای باند بالا بین تایلها نیازمند فناوریهای بستهبندی پیشرفته و اتصالات داخلی (مانند Infinity Fabric یا CoWoS) است که هزینه و مصرف برق را افزایش میدهد. همچنین، نرمافزار و درایورها نیز باید پردازنده گرافیکی چندتایلی را به عنوان یک دستگاه واحد و یکپارچه به سیستمعاملها و موتورهای بازی معرفی کنند که لایه دیگری از پیچیدگی را اضافه میکند. در مجموع، این موانع معماری، تولید و نرمافزاری، طراحیهای چندتایلی را عمدتاً به پردازندههای گرافیکی دیتاسنتر و HPC محدود کرده است، جایی که اقتصاد و بارهای کاری، این مبادلات را بهتر توجیه میکنند.
با این حال، از آنجایی که ساخت پردازندههای گرافیکی بزرگ برای بازی (مانند GB102 انویدیا) دشوارتر و گرانتر میشود، در نقطهای ممکن است ساخت پردازندههای گرافیکی مصرفکننده محور منطقی به نظر برسد. طراحیهای چندتایلی تفکیکشده به افزایش بازده در سطح سیلیکون کمک میکنند (اگرچه بستهبندی پیشرفته نیز مقداری از بازده را مصرف میکند)، اما هزینهها به دلیل پیچیدگی بستهبندی و دایهای میانجی/پل افزایش مییابد. بنابراین، اگر AMD بتواند تفکیک محاسباتی را حل کند، ممکن است یک پردازنده گرافیکی چندتایلی برای کاربردهای کلاینت بسازد.
AMD اولین شرکتی بود که از طراحی چند چیپلت برای CPUهای دیتاسنتر و مصرفکننده استفاده کرد، بنابراین اگر این شرکت در آینده واحدهای پردازش گرافیکی را تفکیک کند، جای تعجب نخواهد بود. در واقع، پردازندههای Navi 31 سری Radeon RX 7900 AMD در حال حاضر دارای یک طراحی تفکیکشده هستند که شامل یک دای اصلی هسته گرافیکی (GCD) و شش چیپلت کنترلر کش/حافظه/PHY است، بنابراین میتوان آن را به عنوان یک آزمایش برای یک پردازنده گرافیکی چندتایلی در نظر گرفت. علاوه بر این، نقشه چیدمان GCD ناوی 31 نشان میدهد که طراحی آن بسیار متقارن است، به این معنی که در صورت نیاز میتوان تراشه را “نصف” کرد، با فرض اینکه AMD راه حل تفکیک طراحی در سطح منطقی و واداشتن نرمافزار به این باور که با یک پردازنده گرافیکی یکپارچه سروکار دارد را پیدا کند. برای Navi 31، چنین طراحی به AMD امکان داد تا چندین رده محصول را از یک طراحی واحد ایجاد کند (Radeon RX 7900 XTX, RX 7900 XT, RX 7900 GRE, RX 7900M)، اما در تئوری میتوانست یک پردازنده گرافیکی چندتایلی بسازد اگر تفکیک محاسباتی را به درستی انجام میداد.
با این حال، از آنچه از پروفایل لینکدین پاپو به نظر میرسد، او در اینتل پردازندههای گرافیکی “هالو” چندتایلی را تصور کرده بود و اکنون در حال کار بر روی “SoCهای گرافیکی رقابتی نسل بعدی مبتنی بر چیپلت 2.5D/3.5D و یکپارچه” است که شاید بر اساس معماری RDNA 5 باشند.
با این حال، زمان انتظار برای RDNA 5 یک سوال جالب است. چرخه معمول پردازندههای گرافیکی AMD یک چرخه دو ساله را دنبال میکند. این شرکت میتوانست محصولات سری Radeon RX 9070 مبتنی بر RDNA 4 خود را در اواخر سال 2024 عرضه کند، اما آنها را به مارس 2025 به تعویق انداخت. از این رو، کاملاً منطقی است که انتظار داشته باشیم RDNA 5 در اواخر سال 2026 یا اوایل سال 2027 عرضه شود.
تا آگوست 2025، RDNA 5 (Navi 5x) به احتمال زیاد در مرحله tape-out یا اوایل پس از tape-out قرار دارد، به این معنی که مراحل طراحی معماری و RTL کامل شدهاند، طراحی فیزیکی و تأیید در حال اتمام هستند، و AMD یا در حال نهایی کردن است یا به تازگی فایلهای GDSII پردازنده گرافیکی را برای ساخت اولیه سیلیکون به TSMC تحویل داده است. این با پنجره عرضه اواخر 2026 تا اوایل 2027 همخوانی دارد و RDNA 5 را در مرحلهای قرار میدهد که سختافزار واقعی هنوز ماهها فاصله دارد، اما پیشبینیهای عملکرد، توسعه فریمور و کار اولیه درایور به خوبی در داخل شرکت در حال انجام است. با این حال، AMD در طول چند ماه آینده بر اساس آزمایش سختافزار واقعی، متوجه خواهد شد که آیا طراحی چندتایلی برای پردازندههای گرافیکی مصرفکننده منطقی است یا خیر. از این رو، به نظر میرسد که احتمالاً در چند ماه آینده شاهد برخی افشاگریهای بسیار جالب خواهیم بود. با ما همراه باشید.
- کولبات
- شهریور 7, 1404
- 42 بازدید






