همان‌طور که می دانید AMD ریزمعماری گرافیکی جدید RDNA 3 را با کارت‌های گرافیک سری RX 7900 معرفی کرده است و ادعاهای بزرگی دارد. اما ریزمعماری RDNA 3 چه تغییرات، تفاوت و پیشرفت‌هایی نسبت به RDNA 2 دارد؟ در ادامه به معرفی ریزمعماری RDNA 3 به همراه تشریح قابلیت‌ها، تغییرات و پیشرفت‌های آن می‌پردازیم، با شهر سخت افزار همراه باشید.

ارتقای AMD RDNA 3

مقایسه ریزمعماری RDNA 3 با RDNA 2

AMD ادعا می‌کند کارت گرافیک پرچم‌دار جدید AMD Radeon RX 7900 XTX در گیمینگ 4K تا 70 درصد سریع‌تر از Radeon RX 6950 XT متعلق نسل قبل است. چنین پیشرفت بزرگی نمی‌تواند اتفاقی باشد و بهبودها و تغییرات گسترده‌ای می‌طلبد. آنطور که AMD می‌گوید، این پیشرفت بزرگ به لطف افزایش 54 درصدی کارایی RDNA 3 به ازای هر وات انرژی مصرفی نسبت به RDNA 2 و البته افزایش فرکانس‌ها و تولید با فناوری ساخت 5 نانومتری TSMC ممکن شده است.

ویژگی های AMD RDNA 3

البته می دانیم افزایش چشمگیر کارایی کارت گرافیک نسبت به نسل قبل، بدون افزایش مصرف انرژی امکان پذیر نیست.

در ادامه به تشریح قابلیت‌های جدید، تغییرات و پیشرفت‌های ریزمعماری گرافیکی AMD RDNA 3 می‌پردازیم و به شما می گوییم این نسل چه تفاوتی با نسل قبل یا RDNA 2 دارد.

استفاده از طراحی چیپلت برای اولین بار

نمای تراشه AMD RDNA 3

AMD با تکیه بر تجربه بسیار موفق خود با پردازنده‌های رایزن، برای اولین بار در پردازنده‌های گرافیکی مخصوص گیمینگ از طراحی موسوم به چیپلت (Chiplet) بهره گرفته است. در این طراحی به جای یک تراشه بزرگ با تنها یک قطعه سیلیکونی (Monolithic)، چندین قطعه سیلیکونی (Die) بر روی یک بُرد مشترک در کنار هم قرار می‌گیرند. این کار مزایایی چون امکان ساخت پردازنده‌های گرافیکی قوی‌تر و کاهش هزینه تولید دارد.

تراشه Navi 3x که نیروبخش پردازنده‌های گرافیکی رده بالا سری Radeon RX 7000 خواهد بود، از دو نوع چیپلت تشکیل شده است. چیپلت اصلی Graphics Compute Die (GCD) نام دارد و اجزای مرتبط با گرافیک یا به طور دقیق‌تر اجزایی چون محاسبه و منطق (ALU)، شتاب بخشی گرافیکی، خروجی تصویر و موتورهای چند رسانه‌ای را در خود جای داده است.

فناوری ساخت تراشه AMD RDNA 3

از آنجایی که قطعه سیلیکونی GCD بزرگ بوده و اجزای کلیدی پردازنده گرافیکی را در خود جای داده است، با فناوری ساخت بروز و پیشرفته 5 نانومتری TSMC تولید می‌شود تا از نظر کارایی، مصرف انرژی و تولید گرما مطلوب‌ترین عملکرد را داشته باشد. مساحت قطعه سیلیکونی GCD برابر با 300 میلی متر مربع است.

در Navi 3x که همان تراشه مورد استفاده در تولید Radeon RX 7900 XTX و Radeon RX 7900 XT است، تنها یک قطعه سیلیکونی GCD وجود دارد.

قطعه سیلیکونی دوم و کوچک‌تر Memory Cache Die (MCD) نام دارد و اجزایی شامل کش سطح سوم (infinity Cache) و رابط حافظه GDDR6 با عرض 64 بیت (از نظر فنی 2x32 بیت) را در خود جای داده است. مزیت بزرگ MCD امکان قرار دادن بیش از عدد آن بر روی پردازنده گرافیکی است که تعداد آن در تراشه Navi 3x شش عدد است.

در حالی که پردازنده گرافیکی پرچم‌دار Radeon RX 7900 XTX از هر شش چیپلت MCD موجود برای رابط حافظه 384 بیتی (6x64) استفاده می‌کند، RX 7900 XT پنج واحد فعال با رابط حافظه 320 بیتی دارد. واحد MCD ششم احتمالاً معیوب است. همچنین حاصل این ترکیب 96 مگابایت حافظه کش سطح سوم در مدل XTX و 80 مگابایت در مدل XT است.

ابعاد تراشه AMD RDNA 3

چیپلت های MCD در ریزمعماری گرافیکی AMD RDNA 3 دارای مساحت 37 میلی متر مربع هستند و با فناوری ساخت 6 نانومتری TSMC تولید می‌شوند. AMD این قطعه‌های سیلیکونی کوچک را با فناوری ساخت نسبتاً ارزان‌تر تولید می‌کند که از مزایای طراحی مبتنی بر چیپلت است.

کش دای AMD RDNA 3

وجود بیش از یک قطعه سیلیکونی در پردازنده گرافیکی بی هزینه هم نیست و دشواری های خاص خود را دارد. این تراشه‌های کوچک (چیپلت) به یک رابط پرسرعت با پایین‌ترین تأخیر برای ارتباط با GPU نیاز دارند که پیاده سازی آن آسان نیست. همچنین نصب و مونتاژ چیپلت های متعدد در کنار یکدیگر هزینه بر و پیچیده است.

ای‌ام دی در ریزمعماری RDNA 3 برای ارتباط میان چیپلت ها از فناوری اختصاصی Infinity Link استفاده کرده است که پهنای باند آن در ارتباط میان GCD و MCD با یکدیگر به 5.3 ترابایت در ثانیه می‌رسد. احتمالاً سهم هر چیپلت MCD حدود 900 گیگابایت در ثانیه باشد.

مقایسه ویژگی های AMD RDNA 3 با RDNA 2

تراشه Navi 3x که در تولید Radeon RX 7900 XTX و Radeon RX 7900 XT استفاده می‌شود، روی هم رفته 58 میلیارد ترانزیستور دارد.

افزایش قدرت و توانایی های هسته ها

پشتیبانی پردازش گرافیکی AMD RDNA 3

پس از آشنایی اجمالی با ساختار فیزیکی اولین تراشه مبتنی بر ریزمعماری RDNA 3، حالا وقت آن است که وارد جزئیات خود پردازنده گرافیکی و بخش‌های محاسباتی (پردازشی) آن شویم تا به تفاوت‌ های RDNA 3 با RDNA 2 پی ببریم.

بهینه سازی بازی در AMD RDNA 3

با وجود اینکه ریزمعماری RDNA 3 بسیاری از عناصر تشکیل دهنده خود را RDNA  2 و RDNA 1 به ارث برده است، اما برخی تفاوت‌های اساسی هم دارد. در واقع میزان تفاوت RDNA 3 با RDNA 2 بسیار بیشتر از RDNA 2 نسبت به RDNA است. خوشبختانه برخلاف RDNA 2 که قسمت هسته یا محاسباتی آن تفاوتی با RDNA 1 نداشت، RDNA 3 دگرگون شده است.

بزرگ‌ترین هسته‌ها در RDNA 3 به واحدهای ALU یا محاسبه و منطق مربوط می‌شود. به طور خلاصه در ریزمعماری آران دی‌ای 3 شاهد افزایش دو برابری تعداد واحدهای ALU به ازای هر واحد CU هستیم که حاصل آن وجود 128 واحد ALU به جای 64 عدد است. با این کار عملاً AMD تعداد هسته‌های گرافیکی را دو برابر کرده است.

طراحی موثر واحدهای پردازشی در AMD RDNA 3

همچنین در ریزمعماری RDNA 3 هر SIMD حالا قادر به اجرای تا دو دستورالعمل به ازای هر سیکل است که اصطلاحاً Dual-issue نامیده می‌شود. در این روش پردازنده قادر به اجرای تعداد بیشتری دستورالعمل به ازای هر سیکل می‌شود. البته همیشه امکان این کار وجود ندارد و صرفاً دستورالعمل های واجد شرایط می‌توانند با هم و طی یک چرخه اجرا شوند.

SIMD ها اجزای سخت افزاری در هر هسته گرافیکی هستند که یک عملیات مشترک را بر روی چندین داده اجرا می‌کنند و بخشی از پردازش موازی هستند. دقت داشته باشید این یک روش موازی سازی در سطح دستورالعمل ها (ILP) است و پردازنده در زمان اجرای دستورالعمل ها باید قادر به استخراج آنهایی باشد که امکان اجرای هم زمان یا موازی با هم را دارند.

جالب اینکه AMD در RDNA 1 به عنوان یکی از تلاش‌های خود برای جبران نواقص ریزمعماری GCN، استفاده از ILP را کنار گذاشت که باعث شد قدرت GCN در عمل (دنیای واقعی) به اندازه اعداد روی کاغذ نباشد. بنابراین این یک قدم رو به عقب است و باید دید چگونه بر قدرت ریزمعماری گرافیکی AMD RDNA 3 تأثیر می‌گذارد.

در حقیقت Dual-issue روش ارزانی برای افزایش قدرت پردازنده‌ها است، اما از آنجایی که همیشه امکان انجام آن وجود ندارد، احتمالاً شدت استفاده از واحد ALU در ریزمعماری گرافیکی AMD RDNA 3 به دلیل حباب‌هایی که در پی همین موضوع رخ می‌دهد، پایین‌تر از RDNA 2 خواهد بود.

همچنین بازگشت ILP و کار کردن مشروط آن باعث می‌شود مقایسه RDNA 3 و RDNA 2 بر اساس قدرت محاسباتی (FLOPS) کار دقیقی نباشد. Radeon RX 7900 XTX بر روی کاغذ 2.6 برابر قدرت محاسبات تک رقم اعشار (FP32) بالاتری نسبت به RX 6950 XTX اما مزیت واقعی آن تا حد زیادی شانسی و وابسته به کُدها است. به همین دلیل AMD  صرفاً بر روی 1.7 برابر عملکرد سریع‌تر تاکید کرده است.

تغییر دیگر RDNA 3 در سطح هسته‌ها، افزایش 50 درصدی اندازه ثبات یا رجیستر Vector General Purpose Register (VGPR) است که با تغییرات دیگر انطباق پذیری خوبی دارد.

ارتقای پردازش هوش مصنوعی در AMD RDNA 3

مهم‌تر اینکه بالاخره در RDNA 3 شاهد شتاب دهنده سخت افزاری مجزا برای هوش مصنوعی (AI) هستیم که پیش‌تر AMD در این زمینه حسابی از انویدیا عقب بود. متأسفانه جزئیات زیادی در این باره ارائه نشده است و صرفاً می دانیم هر واحد CU در ریزمعماری RDNA 3 دارای دو واحد شتاب دهنده هوش مصنوعی است.

روی هم رفته تیم سرخ مدعی شده قدرت RX 7900 XTX در محاسبات هوش مصنوعی 2.7 برابر بیشتر از RX 6950 XT است. برای این مقایسه AMD به قدرت bfloat16 اتکا کرد.

از آنجایی که تاکنون AMD برخلاف DLSS 2 انویدیا از شتاب دهنده هوش مصنوعی به منظور بهبود سرعت و عملکرد فناوری FSR استفاده نکرده است، هنوز اهمیت افزایش قدرت هوش مصنوعی پردازنده‌های گرافیکی RDNA 3 برای گیمرها روشن نیست، با این حال برای استفاده‌های کاری و حرفه‌ای احتمالاً سودمند خواهد بود.

ری تریسینگ در AMD RDNA 3

AMD همچنین در ریزمعماری گرافیکی RDNA 3 شتاب دهنده‌های Ray Tracing را ارتقا داده است و شاهد به‌کارگیری نسل دوم هسته‌های RT با عملکرد بهتر هستیم. هسته‌های RT جدید 1.5 برابر قدرت بیشتری نسبت به نسل قبل دارند.

ریتریسینگ 4K در AMD RDNA 3

اسلایدهای رسمی AMD موید 47 الی 84 درصد افزایش عملکرد هسته‌های شتاب دهنده Ray Tracing است اما از آنجایی که اعداد یاد شده در وجود FSR فعال هستند، درک درستی از میزان بهبود واقعی آن نداریم.

فرکانس کلاک مستقل هسته ها در AMD RDNA 3

تغییر جالب دیگر این نسل به فرکانس‌ها مربوط می‌شود. در ریزمعماری گرافیکی AMD RDNA 3 فرکانس‌ اجزای GPU از نظر وابستگی از همدیگر جدا شده‌اند و دیگر تمام GCD با فرکانس یکسانی کار نمی‌کند. با این کار سایه زن‌ها و اجزای دیگر پردازنده گرافیکی می‌توانند با دو فرکانس متفاوت کار کنند. برای نمونه در کارت گرافیک RX 7900 XTX فرکانس سایه زن می‌تواند 2.3 گیگاهرتز باشد اما اجزای UnCore پردازنده گرافیکی با فرکانس 2.5 گیگاهرتز و سرعت نسبتاً بالاتر کار کنند.

هرچند هنوز تأثیر چنین تغییری روشن نیست، اما می‌تواند در خدمت کاهش مصرف انرژی و افزایش عملکرد باشد. با این کار اجزای UnCore پردازنده گرافیکی احتمالاً به گلوگاه برای آن تبدیل نمی‌شوند.

ارتقای موتور مالتی مدیا و خروجی تصویر

AMD در ریزمعماری RDNA 3 اجزای دیگری غیر از هسته را هم ارتقا داده است که بخش خروجی تصویر و موتورهای چند رسانه‌ای از جمله آنها  هستند و از فرمت‌ها و قابلیت‌های جدیدی پشتیبانی می‌کنند.

موتور چند رسانه ای در AMD RDNA 3

در بخش خروجی تصویر حالا شاهد اضافه شدن پشتیبانی از  DisplayPort 2.x و قابلیت‌های آن در کنار نرخ‌های داده UHBR 10 و UHBR 13.5 هستیم که حاصل آن افزایش پهنای باند برای انتقال تصویر باکیفیت یا وضوح بالاتر با نرخ نوسازی بیشتر است. به لطف این تغییر حالا شاهد پشتیبانی از وضوح تصویر بالاتر و فراهم شدن راه برای مانیتورهای 8K هستیم که سال آینده سامسونگ اولین آنها را روانه بازار خواهد کرد.

اولترا واید 8K با AMD RDNA 3

در بخش موتور چند رسانه‌ای هم پشتیبانی از آخرین و جدیدترین کُدک های ویدئویی اضافه شده است. افزون بر H.264 و H.265، شاهد اضافه شدن پشتیبانی کامل از فشرده سازی و پخش ویدئو AV1 با شتاب بخشی سخت افزاری هستیم. RDNA 3 حداکثر از فشرده سازی و پخش ویدئو AV1 با وضوح 8K نرخ نوسازی 60 هرتز هستیم.

موتور چندرسانه ای دوگانه جدید AMD RDNA 3

به ادعای AMD موتور مالتی مدیا RDNA 3 به میزان 80 درصد فرکانس بالاتری نسبت به RDNA 2 دارد و امکان فشرده سازی یا پخش تا دو استریم H.264-H.265 به طور هم زمان را می‌دهد. البته هنوز روشن نیست این توانایی درباره AV1 هم صدق می‌کند یا نه.

موتور چندرسانه ای AMD RDNA 3

متأسفانه در این نسل خبری از ارتقای کنترلر یا پایانه PCIe نیست و حداکثر از PCIe 4.0 پشتیبانی می‌شود که طبق معمول حداکثر 16 خط ارتباطی است.

در همین رابطه بخوانید:

- ریزمعماری گرافیکی AMD RDNA 3 معرفی شد؛ طراحی مبتنی بر چیپلت با فناوری 5 نانومتری
کارت گرافیک RX 7900 XTX و RX 7900 XT معرفی شدند؛ رقیب پرقدرت RTX 40

جمع بندی

ریزمعماری گرافیکی AMD RDNA 3 نسبت به RDNA 2 تغییرات و پیشرفت های پرشماری به خود دیده است که می تواند عقب ماندگی AMD نسبت به انویدیا را تا حدی جبران کند. همچنین کارت های گرافیک سری RX 7000 با داشتن ریزمعماری RDNA 3 می توانند به طرز چشمگیری بهتر و سریع تر از RX 6000 باشند.

کارت گرافیک AMD Radeon RX 7900 XTX

با این حال باید تا زمان عرضه کارت های گرافیک خانواده RX 7900 XT منتظر ماند و دید پیشرفت ها نسبت به نسل قبل و البته کارت های گرافیک سری RTX 40 انویدیا چگونه خواهد بود.

روی هم رفته به نظر می رسد RDNA 3 در مسیر درستی گام برداشته باشد اما هنوز بخش های زیادی از DNA خود را از RDNA 1 و البته GCN به ارث برده است که می تواند از نظر بهینگی به پای ریزمعماری های انویدیا نرسد. با این حال طرحی مبتنی بر چیپلت ها می تواند برگ برنده AMD باشد.

بهتر است تا زمان انتشار بررسی ها و مقایسه ها کارت های گرافیک RX 7900 XT و RX 7900 XTX با سری RX 6000 و البته RTX 30  و RTX 40 انویدیا منتظر بمانیم.

نظر خود را اضافه کنید.

ارسال نظر بدون عضویت در سایت

0

نظرات (1)

  • مهمان - saeed264

    سلام. مطلب بسیار جالب و تقریبا تخصصی بودند. منکه با یکبار خواندن، احاطه کافی پیدا نکردم. باید با حوصله، دو بار دیگر این مطلب را بخوانم. فقط یک سوال خیلی کلی در نگاه اول به ذهن متبادر می شود و آن اینکه با این همه تغییرات جالب، چرا آخر هر سطر یا پارگراف، مولف به قطعیت در نظردهی نمی رسد؟

ورود به شهرسخت‌افزار

ثبت نام در شهر سخت افزار
ورود به شهر سخت افزار

ثبت نام در شهر سخت افزار

نام و نام خانوادگی(*)
لطفا نام خود را وارد کنید

ایمیل(*)
لطفا ایمیل خود را به درستی وارد کنید

رمز عبور(*)
لطفا رمز عبور خود را وارد کنید

شماره موبایل
Invalid Input

جزو کدام دسته از اشخاص هستید؟(*)

لطفا یکی از موارد را انتخاب کنید