همانطور که می دانید AMD ریزمعماری گرافیکی جدید RDNA 3 را با کارتهای گرافیک سری RX 7900 معرفی کرده است و ادعاهای بزرگی دارد. اما ریزمعماری RDNA 3 چه تغییرات، تفاوت و پیشرفتهایی نسبت به RDNA 2 دارد؟ در ادامه به معرفی ریزمعماری RDNA 3 به همراه تشریح قابلیتها، تغییرات و پیشرفتهای آن میپردازیم، با شهر سخت افزار همراه باشید.
مقایسه ریزمعماری RDNA 3 با RDNA 2
AMD ادعا میکند کارت گرافیک پرچمدار جدید AMD Radeon RX 7900 XTX در گیمینگ 4K تا 70 درصد سریعتر از Radeon RX 6950 XT متعلق نسل قبل است. چنین پیشرفت بزرگی نمیتواند اتفاقی باشد و بهبودها و تغییرات گستردهای میطلبد. آنطور که AMD میگوید، این پیشرفت بزرگ به لطف افزایش 54 درصدی کارایی RDNA 3 به ازای هر وات انرژی مصرفی نسبت به RDNA 2 و البته افزایش فرکانسها و تولید با فناوری ساخت 5 نانومتری TSMC ممکن شده است.
البته می دانیم افزایش چشمگیر کارایی کارت گرافیک نسبت به نسل قبل، بدون افزایش مصرف انرژی امکان پذیر نیست.
در ادامه به تشریح قابلیتهای جدید، تغییرات و پیشرفتهای ریزمعماری گرافیکی AMD RDNA 3 میپردازیم و به شما می گوییم این نسل چه تفاوتی با نسل قبل یا RDNA 2 دارد.
استفاده از طراحی چیپلت برای اولین بار
AMD با تکیه بر تجربه بسیار موفق خود با پردازندههای رایزن، برای اولین بار در پردازندههای گرافیکی مخصوص گیمینگ از طراحی موسوم به چیپلت (Chiplet) بهره گرفته است. در این طراحی به جای یک تراشه بزرگ با تنها یک قطعه سیلیکونی (Monolithic)، چندین قطعه سیلیکونی (Die) بر روی یک بُرد مشترک در کنار هم قرار میگیرند. این کار مزایایی چون امکان ساخت پردازندههای گرافیکی قویتر و کاهش هزینه تولید دارد.
تراشه Navi 3x که نیروبخش پردازندههای گرافیکی رده بالا سری Radeon RX 7000 خواهد بود، از دو نوع چیپلت تشکیل شده است. چیپلت اصلی Graphics Compute Die (GCD) نام دارد و اجزای مرتبط با گرافیک یا به طور دقیقتر اجزایی چون محاسبه و منطق (ALU)، شتاب بخشی گرافیکی، خروجی تصویر و موتورهای چند رسانهای را در خود جای داده است.
از آنجایی که قطعه سیلیکونی GCD بزرگ بوده و اجزای کلیدی پردازنده گرافیکی را در خود جای داده است، با فناوری ساخت بروز و پیشرفته 5 نانومتری TSMC تولید میشود تا از نظر کارایی، مصرف انرژی و تولید گرما مطلوبترین عملکرد را داشته باشد. مساحت قطعه سیلیکونی GCD برابر با 300 میلی متر مربع است.
در Navi 3x که همان تراشه مورد استفاده در تولید Radeon RX 7900 XTX و Radeon RX 7900 XT است، تنها یک قطعه سیلیکونی GCD وجود دارد.
قطعه سیلیکونی دوم و کوچکتر Memory Cache Die (MCD) نام دارد و اجزایی شامل کش سطح سوم (infinity Cache) و رابط حافظه GDDR6 با عرض 64 بیت (از نظر فنی 2x32 بیت) را در خود جای داده است. مزیت بزرگ MCD امکان قرار دادن بیش از عدد آن بر روی پردازنده گرافیکی است که تعداد آن در تراشه Navi 3x شش عدد است.
در حالی که پردازنده گرافیکی پرچمدار Radeon RX 7900 XTX از هر شش چیپلت MCD موجود برای رابط حافظه 384 بیتی (6x64) استفاده میکند، RX 7900 XT پنج واحد فعال با رابط حافظه 320 بیتی دارد. واحد MCD ششم احتمالاً معیوب است. همچنین حاصل این ترکیب 96 مگابایت حافظه کش سطح سوم در مدل XTX و 80 مگابایت در مدل XT است.
چیپلت های MCD در ریزمعماری گرافیکی AMD RDNA 3 دارای مساحت 37 میلی متر مربع هستند و با فناوری ساخت 6 نانومتری TSMC تولید میشوند. AMD این قطعههای سیلیکونی کوچک را با فناوری ساخت نسبتاً ارزانتر تولید میکند که از مزایای طراحی مبتنی بر چیپلت است.
وجود بیش از یک قطعه سیلیکونی در پردازنده گرافیکی بی هزینه هم نیست و دشواری های خاص خود را دارد. این تراشههای کوچک (چیپلت) به یک رابط پرسرعت با پایینترین تأخیر برای ارتباط با GPU نیاز دارند که پیاده سازی آن آسان نیست. همچنین نصب و مونتاژ چیپلت های متعدد در کنار یکدیگر هزینه بر و پیچیده است.
ایام دی در ریزمعماری RDNA 3 برای ارتباط میان چیپلت ها از فناوری اختصاصی Infinity Link استفاده کرده است که پهنای باند آن در ارتباط میان GCD و MCD با یکدیگر به 5.3 ترابایت در ثانیه میرسد. احتمالاً سهم هر چیپلت MCD حدود 900 گیگابایت در ثانیه باشد.
تراشه Navi 3x که در تولید Radeon RX 7900 XTX و Radeon RX 7900 XT استفاده میشود، روی هم رفته 58 میلیارد ترانزیستور دارد.
افزایش قدرت و توانایی های هسته ها
پس از آشنایی اجمالی با ساختار فیزیکی اولین تراشه مبتنی بر ریزمعماری RDNA 3، حالا وقت آن است که وارد جزئیات خود پردازنده گرافیکی و بخشهای محاسباتی (پردازشی) آن شویم تا به تفاوت های RDNA 3 با RDNA 2 پی ببریم.
با وجود اینکه ریزمعماری RDNA 3 بسیاری از عناصر تشکیل دهنده خود را RDNA 2 و RDNA 1 به ارث برده است، اما برخی تفاوتهای اساسی هم دارد. در واقع میزان تفاوت RDNA 3 با RDNA 2 بسیار بیشتر از RDNA 2 نسبت به RDNA است. خوشبختانه برخلاف RDNA 2 که قسمت هسته یا محاسباتی آن تفاوتی با RDNA 1 نداشت، RDNA 3 دگرگون شده است.
بزرگترین هستهها در RDNA 3 به واحدهای ALU یا محاسبه و منطق مربوط میشود. به طور خلاصه در ریزمعماری آران دیای 3 شاهد افزایش دو برابری تعداد واحدهای ALU به ازای هر واحد CU هستیم که حاصل آن وجود 128 واحد ALU به جای 64 عدد است. با این کار عملاً AMD تعداد هستههای گرافیکی را دو برابر کرده است.
همچنین در ریزمعماری RDNA 3 هر SIMD حالا قادر به اجرای تا دو دستورالعمل به ازای هر سیکل است که اصطلاحاً Dual-issue نامیده میشود. در این روش پردازنده قادر به اجرای تعداد بیشتری دستورالعمل به ازای هر سیکل میشود. البته همیشه امکان این کار وجود ندارد و صرفاً دستورالعمل های واجد شرایط میتوانند با هم و طی یک چرخه اجرا شوند.
SIMD ها اجزای سخت افزاری در هر هسته گرافیکی هستند که یک عملیات مشترک را بر روی چندین داده اجرا میکنند و بخشی از پردازش موازی هستند. دقت داشته باشید این یک روش موازی سازی در سطح دستورالعمل ها (ILP) است و پردازنده در زمان اجرای دستورالعمل ها باید قادر به استخراج آنهایی باشد که امکان اجرای هم زمان یا موازی با هم را دارند.
جالب اینکه AMD در RDNA 1 به عنوان یکی از تلاشهای خود برای جبران نواقص ریزمعماری GCN، استفاده از ILP را کنار گذاشت که باعث شد قدرت GCN در عمل (دنیای واقعی) به اندازه اعداد روی کاغذ نباشد. بنابراین این یک قدم رو به عقب است و باید دید چگونه بر قدرت ریزمعماری گرافیکی AMD RDNA 3 تأثیر میگذارد.
در حقیقت Dual-issue روش ارزانی برای افزایش قدرت پردازندهها است، اما از آنجایی که همیشه امکان انجام آن وجود ندارد، احتمالاً شدت استفاده از واحد ALU در ریزمعماری گرافیکی AMD RDNA 3 به دلیل حبابهایی که در پی همین موضوع رخ میدهد، پایینتر از RDNA 2 خواهد بود.
همچنین بازگشت ILP و کار کردن مشروط آن باعث میشود مقایسه RDNA 3 و RDNA 2 بر اساس قدرت محاسباتی (FLOPS) کار دقیقی نباشد. Radeon RX 7900 XTX بر روی کاغذ 2.6 برابر قدرت محاسبات تک رقم اعشار (FP32) بالاتری نسبت به RX 6950 XTX اما مزیت واقعی آن تا حد زیادی شانسی و وابسته به کُدها است. به همین دلیل AMD صرفاً بر روی 1.7 برابر عملکرد سریعتر تاکید کرده است.
تغییر دیگر RDNA 3 در سطح هستهها، افزایش 50 درصدی اندازه ثبات یا رجیستر Vector General Purpose Register (VGPR) است که با تغییرات دیگر انطباق پذیری خوبی دارد.
مهمتر اینکه بالاخره در RDNA 3 شاهد شتاب دهنده سخت افزاری مجزا برای هوش مصنوعی (AI) هستیم که پیشتر AMD در این زمینه حسابی از انویدیا عقب بود. متأسفانه جزئیات زیادی در این باره ارائه نشده است و صرفاً می دانیم هر واحد CU در ریزمعماری RDNA 3 دارای دو واحد شتاب دهنده هوش مصنوعی است.
روی هم رفته تیم سرخ مدعی شده قدرت RX 7900 XTX در محاسبات هوش مصنوعی 2.7 برابر بیشتر از RX 6950 XT است. برای این مقایسه AMD به قدرت bfloat16 اتکا کرد.
از آنجایی که تاکنون AMD برخلاف DLSS 2 انویدیا از شتاب دهنده هوش مصنوعی به منظور بهبود سرعت و عملکرد فناوری FSR استفاده نکرده است، هنوز اهمیت افزایش قدرت هوش مصنوعی پردازندههای گرافیکی RDNA 3 برای گیمرها روشن نیست، با این حال برای استفادههای کاری و حرفهای احتمالاً سودمند خواهد بود.
AMD همچنین در ریزمعماری گرافیکی RDNA 3 شتاب دهندههای Ray Tracing را ارتقا داده است و شاهد بهکارگیری نسل دوم هستههای RT با عملکرد بهتر هستیم. هستههای RT جدید 1.5 برابر قدرت بیشتری نسبت به نسل قبل دارند.
اسلایدهای رسمی AMD موید 47 الی 84 درصد افزایش عملکرد هستههای شتاب دهنده Ray Tracing است اما از آنجایی که اعداد یاد شده در وجود FSR فعال هستند، درک درستی از میزان بهبود واقعی آن نداریم.
تغییر جالب دیگر این نسل به فرکانسها مربوط میشود. در ریزمعماری گرافیکی AMD RDNA 3 فرکانس اجزای GPU از نظر وابستگی از همدیگر جدا شدهاند و دیگر تمام GCD با فرکانس یکسانی کار نمیکند. با این کار سایه زنها و اجزای دیگر پردازنده گرافیکی میتوانند با دو فرکانس متفاوت کار کنند. برای نمونه در کارت گرافیک RX 7900 XTX فرکانس سایه زن میتواند 2.3 گیگاهرتز باشد اما اجزای UnCore پردازنده گرافیکی با فرکانس 2.5 گیگاهرتز و سرعت نسبتاً بالاتر کار کنند.
هرچند هنوز تأثیر چنین تغییری روشن نیست، اما میتواند در خدمت کاهش مصرف انرژی و افزایش عملکرد باشد. با این کار اجزای UnCore پردازنده گرافیکی احتمالاً به گلوگاه برای آن تبدیل نمیشوند.
ارتقای موتور مالتی مدیا و خروجی تصویر
AMD در ریزمعماری RDNA 3 اجزای دیگری غیر از هسته را هم ارتقا داده است که بخش خروجی تصویر و موتورهای چند رسانهای از جمله آنها هستند و از فرمتها و قابلیتهای جدیدی پشتیبانی میکنند.
در بخش خروجی تصویر حالا شاهد اضافه شدن پشتیبانی از DisplayPort 2.x و قابلیتهای آن در کنار نرخهای داده UHBR 10 و UHBR 13.5 هستیم که حاصل آن افزایش پهنای باند برای انتقال تصویر باکیفیت یا وضوح بالاتر با نرخ نوسازی بیشتر است. به لطف این تغییر حالا شاهد پشتیبانی از وضوح تصویر بالاتر و فراهم شدن راه برای مانیتورهای 8K هستیم که سال آینده سامسونگ اولین آنها را روانه بازار خواهد کرد.
در بخش موتور چند رسانهای هم پشتیبانی از آخرین و جدیدترین کُدک های ویدئویی اضافه شده است. افزون بر H.264 و H.265، شاهد اضافه شدن پشتیبانی کامل از فشرده سازی و پخش ویدئو AV1 با شتاب بخشی سخت افزاری هستیم. RDNA 3 حداکثر از فشرده سازی و پخش ویدئو AV1 با وضوح 8K نرخ نوسازی 60 هرتز هستیم.
به ادعای AMD موتور مالتی مدیا RDNA 3 به میزان 80 درصد فرکانس بالاتری نسبت به RDNA 2 دارد و امکان فشرده سازی یا پخش تا دو استریم H.264-H.265 به طور هم زمان را میدهد. البته هنوز روشن نیست این توانایی درباره AV1 هم صدق میکند یا نه.
متأسفانه در این نسل خبری از ارتقای کنترلر یا پایانه PCIe نیست و حداکثر از PCIe 4.0 پشتیبانی میشود که طبق معمول حداکثر 16 خط ارتباطی است.
در همین رابطه بخوانید:
- ریزمعماری گرافیکی AMD RDNA 3 معرفی شد؛ طراحی مبتنی بر چیپلت با فناوری 5 نانومتری
- کارت گرافیک RX 7900 XTX و RX 7900 XT معرفی شدند؛ رقیب پرقدرت RTX 40
جمع بندی
ریزمعماری گرافیکی AMD RDNA 3 نسبت به RDNA 2 تغییرات و پیشرفت های پرشماری به خود دیده است که می تواند عقب ماندگی AMD نسبت به انویدیا را تا حدی جبران کند. همچنین کارت های گرافیک سری RX 7000 با داشتن ریزمعماری RDNA 3 می توانند به طرز چشمگیری بهتر و سریع تر از RX 6000 باشند.
با این حال باید تا زمان عرضه کارت های گرافیک خانواده RX 7900 XT منتظر ماند و دید پیشرفت ها نسبت به نسل قبل و البته کارت های گرافیک سری RTX 40 انویدیا چگونه خواهد بود.
روی هم رفته به نظر می رسد RDNA 3 در مسیر درستی گام برداشته باشد اما هنوز بخش های زیادی از DNA خود را از RDNA 1 و البته GCN به ارث برده است که می تواند از نظر بهینگی به پای ریزمعماری های انویدیا نرسد. با این حال طرحی مبتنی بر چیپلت ها می تواند برگ برنده AMD باشد.
بهتر است تا زمان انتشار بررسی ها و مقایسه ها کارت های گرافیک RX 7900 XT و RX 7900 XTX با سری RX 6000 و البته RTX 30 و RTX 40 انویدیا منتظر بمانیم.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت