هر آنچه باید درباره معماری RDNA 4 AMD و کارت‌های گرافیک سری Radeon RX 9000 بدانید؛ قابلیت‌ها، زمان عرضه، قیمت و شرایط

ساعتی پیش شرکت AMD رسماً از کارت‌های گرافیک جدید خود، Radeon RX 9070 با قیمت 549 دلار و Radeon RX 9070 XT با قیمت 599 دلار رونمایی کرد. این کارت‌ها از تاریخ 16 اسفند ماه عرضه خواهند شد. اگر می‌خواهید هر آنچه لازم است در مورد این معماری، محصولات پیش‌رو، زمان عرضه، قابلیت‌ها و امکاناتش بدانید مطالعه این مقاله از شهر سخت‌افزار را از دست ندهید.

مقدمه

همانطور که می‌دانید، اطلاعات اولیه در مورد معماری RDNA 4 و کارت‌های سری Radeon RX 9000 در نمایشگاه CES 2025 منتشر شد، اما در جریان ارائه اصلی AMD خبری از این محصولات نبود. تاکنون اطلاعات بسیار محدودی به‌صورت رسمی در دسترس بود، اما اکنون AMD در یک ارائه ویدیویی جزئیات بیشتری درباره ارتقاءهای معماری، مشخصات فنی و سایر ویژگی‌ها منتشر کرده است. این کارت‌ها برای رقابت با سری Blackwell RTX 50 انویدیا و سری Battlemage Arc B اینتل طراحی شده‌اند و احتمالاً به زودی در فهرست برترین کارت‌های گرافیک بازار قرار خواهند گرفت.

هر چه محصول بیشتری در بازار موجود باشد برای گیمرها و کاربران دیگر بهتر است. در واقع این رقابت و موجودی بازار است که مشخص می‌کند چه کارتی چه قیمتی داشته باشد. اما این روزها شرایط بازار کارت گرافیک به حدی عجیب شده که کارتی که یک ماه پیش معرفی شده با قیمت چند برابر MSRP هم به سختی یافت می‌شود.

تأخیر در عرضه و شرایط بازار

ابتدا به ساکن این مورد را در نظر داشته باشید که همانند کارت‌های RTX 50 انویدیا، عرضه کارت‌های گرافیک ای ام دی بر پایه RDNA 4 نیز با تأخیر مواجه شده است. در ابتدا شایعاتی مبنی بر معرفی این کارت‌ها در CES 2025 و عرضه در ژانویه یا فوریه (دی و بهمن ماه) منتشر شده بود، اما در نهایت، ماه مارس (اسفند ماه) به عنوان زمان رسمی عرضه اعلام شد. این تأخیر ممکن است به دلایل متفاوتی رخ داده باشد که باید در مطلب دیگری به بررسی آن بپردازیم. به هر حال، در این میان، انویدیا نیز احتمالاً کارت RTX 5070 خود را هم‌زمان با عرضه RX 9070 XT و RX 9070 معرفی خواهد کرد تا رقابت بازار را داغ‌تر کند.

اما اگر به وضعیت فعلی موجودی کارت‌های گرافیک در بازار نگاهی بیندازید، متوجه خواهید شد که تقریباً همه مدل‌های محبوب یا نایاب شده‌اند یا با قیمت‌های بالاتر از حد معمول فروخته می‌شوند. AMD در گذشته نیز با مشکلاتی در گذار نسل‌های کارت‌های گرافیک خود مواجه بوده است؛ نسل قبلی مدت زیادی در بازار باقی ماند و با محصولات جدید رقابت داشت. این بار اما، وضعیت کاملاً برعکس شده و در کشورهای بدون محدودیت دسترسی، کارت‌های سری RX 7000 تقریباً از بازار حذف شده‌اند و تنها مدل‌های RX 7600 و RX 7600 XT هنوز با قیمت پایه در دسترس هستند.

وضعیت تقاضا و کمبود موجودی

کاهش موجودی، موجب افزایش شدید تقاضا برای کارت‌های گرافیک در همه سطوح، از مدل‌های میان‌رده تا مدل‌های پیشرفته شده است. کارت‌های RTX 5090، RTX 5080 و RTX 5070 Ti انویدیا بلافاصله پس از عرضه به فروش رفتند. حال باید دید که آیا RX 9070 XT و RX 9070 عملکرد بهتری خواهند داشت یا خیر. پیش‌بینی می‌شود که با وجود دو ماه تولید و تأمین موجودی، تقاضا همچنان بیشتر از عرضه باشد و قیمت‌ها افزایش پیدا کنند. احتمالاً تا پایان سال وضعیت بازار به تعادل برسد، اما در کوتاه‌مدت، کمبود کالا و افزایش قیمت ادامه خواهد داشت.

تأثیر هوش مصنوعی بر بازار کارت‌های گرافیک

تردیدی نیست که سودآوری بی‌نظیر و رکوردشکن انویدیا از بخش هوش مصنوعی نقش مهمی در این شرایط دارد. در حالی که AMD در بخش پردازنده‌های مخصوص مراکز داده به اندازه انویدیا فروش ندارد، اما بخش زیادی از ظرفیت تولید TSMC برای تولید پردازنده‌های CPU و GPU مخصوص این حوزه اختصاص داده شده است. در نتیجه، گیمرها در اولویت دوم شرکت‌های ریخته‌گری سیلیکون قرار گرفته‌اند و به طبع، سهم محدودی از تولید تراشه‌ها را دریافت می‌کنند.

اما بهتر است از این بحث عبور کنیم و به بررسی مشخصات معماری RDNA 4، قابلیت‌های جدید و سایر جزئیات بپردازیم. همچنین، قیمت‌گذاری این کارت‌ها را بررسی خواهیم کرد، هرچند در شرایط فعلی، قیمت اعلام‌شده تنها یک عدد روی کاغذ محسوب می‌شود.

مشخصات فنی کارت‌های گرافیک RDNA 4

پیش از هر چیز به مشخصات اعلام شده برای کارت‌های گرافیک با معماری RDNA 4 شرکت AMD برای محصولات آتی آن می‌پردازیم. در جدول زیر که توسط Toms Hardware منتشر شده می‌توانید مشخصات این کارت‌های جدید را ببینید.

مدل کارت گرافیک	RX 9070 XT	RX 9070	RX 9060 XT?	RX 9060?
معماری	Navi 48	Navi 48	Navi 48?	Navi 44?
فناوری ساخت	TSMC N4P	TSMC N4P	TSMC N4P	TSMC N4P?
تعداد ترانزیستور (میلیارد)	53.9	53.9	53.9	22?
اندازه دای (میلی‌متر مربع)	356.5	356.5	356.5	153?
SMs / CUs / Xe-Cores	64	56	32?	20?
شیدر GPU	4096	3584	2048?	1280?
تعداد هسته تنسور یا AI	128	112	64?	40?
تعداد هسته RT	64	56	32?	20?
فرکانس بوست (مگاهرتز)	2970	2520	2790?	2700?
سرعتVRAM (Gbps)	20	20	20?	20?
VRAM (GB)	16	16	12?	8?
عرض گذرگاه حافظه	256	256	192?	128?
L2 / Infinity Cache	64	64	48?	32?
واحدهای رندر خروجی	128	128	96?	64?
واحدهای مپینگ بافت	256	224	128?	80?
TFLOPS FP32 (Boost)	48.7	36.1	22.9?	13.8?
TFLOPS FP16 (FP4/FP8 TFLOPS)	389 (1557)	289 (1156)	183 (731)?	111 (442)?
Bandwidth (GB/s)	640	640	480?	320?
TBP (watts)	304	220	150?	120?
زمان عرضه	اسفند 1403	اسفند 1403	اردیبهشت یا خرداد 1404	اردیبهشت یا خرداد 1404
قیمت (دلار)	599	549	399?	299?

نکته: دو ستون اول جدول فوق در مورد RX 9070 XT و RX 9070 بر اساس اطلاعات رسمی تهیه شده و در مورد ستون‌های مربوط به دو نسخه RX 9060 باید منتظر تایید رسمی بمانیم!

ارتقاءهای معماری و بهبود عملکرد

کارت RX 9070 XT از تراشه Navi 48 به‌طور کامل بهره می‌برد که شامل 64 واحد محاسباتی (CU) است. این مدل با فرکانس بوست 2.97 گیگاهرتز و رابط حافظه 256 بیتی همراه با حافظه GDDR6 با سرعت 20 گیگابیت بر ثانیه عرضه می‌شود. RX 9070 نیز مشخصات مشابهی دارد، اما با 56 واحد محاسباتی و فرکانس بوست 2.52 گیگاهرتز ارائه شده است. برای مقایسه در نظر داشته باشید که کارت‌های سری RTX 50 انویدیا همگی از حافظه GDDR7 استفاده می‌کنند.

علاوه بر این، AMD در معماری RDNA 4 هسته‌های هوش مصنوعی و رهگیری پرتو را به‌طور چشمگیری ارتقا داده است. هسته‌های AI اکنون دو برابر تعداد عملیات FP16 را در هر سیکل پردازشی انجام می‌دهند و از قابلیت Sparse Computing بهره می‌برند که می‌تواند عملکرد را تا دو برابر افزایش دهد.

قیمت‌ کارت‌های گرافیک سری RX 9000 و رقابت با انویدیا

AMD اعلام کرده است که Radeon RX 9070 با قیمت 549 دلار و RX 9070 XT با قیمت 599 دلار عرضه خواهند شد، که آن‌ها را در بخش «میان‌رده» می‌دهد. با این حال، با توجه به شرایط فعلی بازار، قیمت اعلام‌شده از سوی AMD احتمالاً چندان اهمیتی نخواهد داشت. در کوتاه‌مدت، تقریباً قطعی است که تمام کارت‌ها به سرعت فروخته شده و با قیمتی بسیار بالاتر از MSRP و توسط دلالان به فروش خواهند رسید.

در دنیای امروز، تعریف قیمت‌ها برای کارت‌های گرافیک به شکل زیر تغییر کرده است:

ارزان‌قیمت (Budget): بین 250 تا 300 دلار
میان‌رده (Mainstream): بین 400 تا 700 دلار
رده‌بالا (High-End): بین 800 تا 1,000 دلار
پرمیوم یا علاقه‌مندان (Enthusiast): 1,500 دلار به بالا

با توجه به این سطوح باید گفت که AMD با سری RX 9070، مستقیماً بازار میان‌رده را هدف قرار داده و احتمالاً با مدل‌های 9060، بخش میان‌رده‌ی پایین‌تر و حتی بخش اقتصادی بالاتر را پوشش خواهد داد.

با توجه به میزان موجودی کارت‌ها و عملکرد آن‌ها، RDNA 4 ارزش قیمت اعلام‌شده را خواهد داشت. اما مسئله اینجاست که احتمالاً تعداد کافی از این کارت‌ها (دست‌کم برای چند ماه اول) در بازار موجود نخواهد بود. با توجه به این قیمت‌های نسبتاً مناسب، انتظار داشته باشید که دلال‌ها (Scalpers) و خرده‌فروشان قیمت‌ها را بالاتر ببرند.

این وضعیت در واقع تکرار کمبود کارت‌های گرافیکی در دوران ماینینگ ارزهای دیجیتال است، با این تفاوت که این بار هوش مصنوعی (AI) عامل اصلی تقاضا است و این روند ممکن است برای سال‌ها ادامه داشته باشد. امیدواریم که این پیش‌بینی اشتباه باشد، اما تجربه‌ای که تاکنون از عرضه‌ی سری RTX 50 داشتیم، چندان امیدبخش نبوده است.

تاریخ عرضه پردازنده‌های گرافیکی RDNA 4

در حالی که پیش‌تر اعلام شده بود کارت‌های گرافیک RX 9070 در تاریخ ۶ مارس ۲۰۲۵ (پنج‌شنبه 16 اسفند 1403) عرضه خواهند شد، شرکت AMD اخیراً اشاره‌هایی به خانواده RX 9060 نیز داشته است. اما پرسش‌های مهمی در این میان باقی می‌مانند: آیا شاهد چندین مدل مختلف از این خانواده خواهیم بود یا تنها یک کارت گرافیک در این سری عرضه می‌شود؟ آیا نسخه‌های پایین‌رده‌تری نظیر RX 9050 نیز در راه هستند؟

پاسخ قطعی در حال حاضر مشخص نیست، اما آنچه می‌توان با اطمینان گفت این است که این مدل‌ها احتمالاً بین آوریل تا پایان سال ۲۰۲۵ روانه بازار خواهند شد؛ البته امیدواریم زودتر از این زمان عرضه شوند.

گمانه‌زنی‌ها پیرامون ابعاد دای Navi 44 نشان می‌دهند که این تراشه به‌مراتب کوچک‌تر از نسل قبل بوده و احتمالاً جایگزینی برای Navi 33 (سری RX 7600) محسوب می‌شود. در صورتی که این اطلاعات صحت داشته باشد، ممکن است عرضه‌ی این کارت به تعویق بیفتد، به‌ویژه با توجه به اینکه هنوز موجودی RX 7600 و RX 7600 XT در بازار به میزان قابل‌توجهی یافت می‌شود. چنین شرایطی مشابه اتفاقی است که هنگام عرضه RX 7600 رخ داد، زیرا در آن زمان مدل‌های Navi 23 (مانند RX 6650 XT / RX 6600 XT / RX 6600) همچنان با قیمت‌های پایین‌تری در دسترس بودند.

با توجه به نام‌گذاری AMD، انتظار می‌رود که RX 9060 در رقابت مستقیم با سری RTX 5060 انویدیا قرار بگیرد. با این حال، برای این رقابت احتمالاً به تراشه‌ای بزرگ‌تر از آنچه تاکنون در شایعات مطرح شده، نیاز خواهد بود. البته، نباید فراموش کرد که RX 7600 نیز به‌صورت تئوری رقیب RTX 4060 محسوب می‌شود، در حالی که مدل RTX 4050 تاکنون عرضه نشده و احتمال عرضه‌ی RTX 5050 نیز بسیار پایین است.

نسخه اقتصادی بر پایه RDNA 4؟

شاید شما هم با خواندن اطلاعات فوق به این فکر کرده باشید که آیا AMD برنامه‌ای برای تولید یک تراشه‌ی اقتصادی و مقرون‌به‌صرفه در خانواده RDNA 4 دارد؟ بر اساس اطلاعات غیررسمی، این احتمال وجود دارد و حتی می‌توان گفت که چنین اتفاقی محتمل است.

اگر Navi 48 را ملاک قرار دهیم، یک پردازنده‌ی گرافیکی با اندازه‌ای کمتر از نصف Navi 48 می‌تواند قیمت حدود ۲۰۰ تا ۲۵۰ دلار داشته باشد و به انتخابی جذاب برای بازیکنان با بودجه محدود و همچنین تولیدکنندگان سیستم‌های آماده (OEMs) تبدیل شود. با ابعاد تقریبی ۱۵۰ تا ۱۶۰ میلی‌متر مربع، AMD می‌تواند تراشه‌های بیشتری را از هر ویفر سیلیکونی استخراج کند.

اما در صورتی که این کارت‌ها نهایتاً با قیمت ۲۵۰ دلار یا کمتر به فروش برسند، ممکن است این سرمایه‌گذاری چندان سودآور نباشد؛ به‌خصوص در مقایسه با پردازنده‌های گرافیکی مراکز داده که با قیمت‌های بسیار بالاتر، حتی ده‌ها هزار دلار به فروش می‌رسند.

معماری پردازنده‌ی گرافیکی RDNA 4

تصاویر و اسلایدهای منتشرشده‌ی AMD شامل اطلاعات جامعی از مشخصات معماری جدید RDNA 4 و بهینه‌سازی‌های انجام‌شده در این نسل است. تمرکز AMD در این معماری بر افزایش عملکرد هر واحد محاسباتی (CU) در تمامی حوزه‌های پردازشی، از جمله شطرنجی‌سازی (Rasterization)، رهگیری پرتو (Ray Tracing) و محاسبات هوش مصنوعی (AI Compute) بوده است.

بهبودهای عملیات شطرنجی‌سازی

عملکرد Rasterization در این نسل کمترین میزان بهبود را در مقایسه با نسل قبل داشته، اما همچنان طبق ادعای AMD حدود ۴۰ درصد سریع‌تر از RDNA 3 است. در مقابل، عملکرد رهگیری پرتو تقریباً دو برابر شده است. همچنین عملکرد پردازش هوش مصنوعی در محاسبات FP16 متراکم دو برابر شده، در حالی که فرمت‌های با دقت پایین‌تر حتی افزایش عملکرد بیشتری نیز به شما نشان خواهند داد.

جزئیات دقیق بهبودهای مرتبط با رسترسازی هنوز مشخص نیست، اما AMD اعلام کرده که پشتیبانی از درخواست‌های حافظه خارج از ترتیب (Out of Order Memory Requests)، که به‌ویژه در رهگیری پرتو بسیار مؤثر است، می‌تواند در پردازش‌های رسترسازی نیز سودمند باشد.

مدیریت پویای ثبات‌ها (Dynamic Register Allocation) یکی دیگر از تغییرات مهم در RDNA 4 محسوب می‌شود. در معماری RDNA 3 و نسل‌های قبل‌تر، رجیسترها برای سناریوهای بدترین حالت رزرو می‌شدند، اما اکنون این فرایند به‌صورت پویا انجام می‌شود. این بهینه‌سازی به پردازنده اجازه می‌دهد تا در شرایطی که نیاز است، تعداد امواج فعال را افزایش دهد. ای ام دی در یک مثال نشان داده که این تغییر می‌تواند از ۳ موج به ۴ موج افزایش یابد که به معنی افزایش ۳۳ درصدی کارایی در شرایط خاص است.

بهبودهای عملیات رهگیری پرتو

در حوزه رهگیری پرتو، AMD پیشرفت‌های محسوسی را به نمایش گذاشته است. این معماری نرخ برخورد پرتو به مثلث و پر تو به جعبه (Ray/Triangle و Ray/Box Intersection) را در هر واحد RT دو برابر کرده است. همچنین، از قابلیت‌های جدیدی مانند تبدیل بلادرنگ سخت‌افزاری (Hardware Instance Transforms)، بافت‌های محدودکننده‌ی جهت‌دار (Oriented Bounding Boxes) و ساختار بهبودیافته‌ی BVH (Bounding Volume Hierarchy) بهره می‌برد. بهینه‌سازی‌های حافظه‌ای نیز شامل بازگردانی داده‌ها به‌صورت خارج از ترتیب و مدیریت بهبودیافته‌ی پشته سخت‌افزاری پرتوها هستند.

بخش عمده‌ای از بهبودهای رهگیری پرتو ناشی از دو برابر شدن نرخ برخوردها و فشرده‌سازی بهتر BVH است. هرچند عملکرد RDNA 4 در مقایسه با سخت‌افزارهای جدید انویدیا هنوز کاملاً مشخص نیست، اما قطعاً نسبت به نسل‌های RDNA 3 و RDNA 2 پیشرفت چشم‌گیری خواهد داشت. بنابر تحلیل منتشر شده در منبع، این معماری احتمالاً به عملکرد معماری Ada انویدیا نزدیک خواهد شد، هرچند که شاید به سطح Blackwell نرسد.

تغییرات حوزه AI

همان‌طور که پیش‌تر اشاره شد، بزرگ‌ترین تغییرات RDNA 4 در حوزه‌ی هوش مصنوعی اتفاق افتاده است. انویدیا از زمان معرفی سری RTX 20 همواره در حال بهبود هسته‌های تانسوری (Tensor Cores) خود بوده است. حتی پیش از آن، پردازنده‌ی گرافیکی ولتا (Volta) در بخش دیتاسنترها از هسته‌های تانسوری بهره می‌برد. به همین دلیل، انویدیا اکنون در نسل پنجم هسته‌های AI Matrix خود قرار دارد، در حالی که AMD تازه به نسل دوم رسیده است؛ البته با این تفاوت که AMD بسیاری از پیشرفت‌های صورت‌گرفته در معماری CDNA خود را به RDNA 4 انتقال داده است.

عملکرد پردازشی در RDNA 4 نسبت به نسل قبل پیشرفت قابل‌توجهی داشته است:

RDNA 3 قادر بود 512 عملیات FP16 در هر سیکل پردازشی انجام دهد، بدون پشتیبانی از Sparse Computing، و همچنین 1024 عملیات INT4 در هر سیکل.
RDNA 4 این مقدار را در چندین سطح افزایش داده است:
- 2 برابر افزایش در FP16 برای محاسبات متراکم (Dense Operations)
- 4 برابر افزایش در عملیات FP16 با محاسبات پراکنده (Sparse Computing)
- 8 برابر افزایش در FP8، که به‌شدت در حوزه‌ی AI کاربرد دارد

به‌طور خلاصه، RDNA 4 تا 8 برابر توان پردازشی بیشتری در FP8 نسبت به FP16 در RDNA 3 ارائه می‌دهد و INT4 نیز تا 8 برابر بهبود یافته است.

برای نشان دادن تأثیر این تغییرات، AMD یک مقایسه‌ی عملی از عملکرد AI بینRX 9070 XT (با 64 واحد CU) وRX 7900 XT (با 84 واحد CU) انجام داد. در این آزمایش، RX 7900 XT از نظر تعداد واحد‌های پردازشی 31 درصد برتری داشته، اما RX 9070 XT توانست تقریباً 2 برابر عملکرد بهتری ارائه دهد.

این افزایش عملکرد برای پردازش‌های مبتنی بر هوش مصنوعی، یادگیری ماشین، و همچنین فناوری‌هایی مانند FSR 4 و تولید فریم بسیار ارزشمند خواهد بود.

تغییرات در حافظه کش

علاوه بر این، AMD برخی تغییرات در ساختار کش و حافظه‌ی RDNA 4 ایجاد کرده است. جزئیات دقیقی در مورد این تغییرات ارائه نشده، اما تأکید شده که این سومین نسل از Infinity Cache محسوب می‌شود.

حجم حافظه کش همچنان 64 مگابایت است، مشابه چیزی که در RX 7900 GRE و RX 7800 XT (با باس 256 بیتی) دیده‌ایم.
اما تفاوت بزرگ اینجاست که این‌بار کش بخشی از چیپ مونولیتیک (یکپارچه) است، که احتمالاً منجر به بهبود تأخیر (Latency) و افزایش پهنای باند (Throughput) آن خواهد شد.

بهبودهای معماری RDNA 4

معماری RDNA 4 تنها به ارتقاهای هسته‌ای محدود نمی‌شود. در کنار پیشرفت‌های مهم در زمینه رسترسازی (Rasterization)، رهگیری پرتو (Ray Tracing) و محاسبات هوش مصنوعی (AI Compute)، شرکت AMD چندین بخش دیگر را نیز بهینه‌سازی کرده است. یکی از مهم‌ترین تغییرات، بهبود سخت‌افزار رمزگذاری ویدئو است. در نسل گذشته، عملکرد AMD در این زمینه نسبت به Nvidia و Intel ضعیف‌تر بود، اما با RDNA 4 این فاصله کاهش یافته است.

به صورت کلی باید گفت که AMD با RDNA 4 نه‌تنها عملکرد rasterization (شطرنجی‌سازی)، رهگیری پرتو و هوش مصنوعی را ارتقا داده، بلکه رمزگذاری ویدئو، مقیاس‌بندی تصویر، تولید فریم و کاهش بار پردازشی CPU را نیز بهبود بخشیده است. پشتیبانی از PCIe 5.0 و عرضه‌ی FSR 4 نشان می‌دهد که این نسل نسبت به RDNA 3 جهش قابل‌توجهی داشته و AMD در تلاش است تا در رقابت با Nvidia و Intel از نظر کیفیت و کارایی به سطح بالاتری برسد.

AMD اعلام کرده که کیفیت رمزگذاری H.264 (AVC) تا ۲۵ درصد، H.265 (HEVC) تا ۱۱ درصد بهبود یافته و همچنین کارایی رمزگذاری AV1 افزایش یافته است. پشتیبانی بهتر از فرمت‌های AV1 و VP9 در کنار کاهش دسترسی‌های حافظه، از دیگر پیشرفت‌های این نسل محسوب می‌شود.

افزایش قدرت در رمزگذاری ویدئو

علاوه بر افزایش کیفیت، RDNA 4 به موتور چندرسانه‌ای دوگانه (Dual Media Engine) مجهز شده است. انویدیا این ویژگی را در معماری Ada معرفی کرده بود و به نظر می‌رسد AMD نیز از همان مسیر پیروی کرده است. البته این تغییر ممکن است بر تمامی حجم‌های کاری تأثیر یکسانی نداشته باشد، اما AMD ادعا می‌کند که توان رمزگذاری AV1 را دو برابر کرده است.

بهبود کیفیت رمزگذاری ویدئو، به‌ویژه در رمزگذارهای سخت‌افزاری، همیشه با محدودیت‌هایی مواجه است. در حالی که محصولات قبلی انویدیا و اینتل از لحاظ کیفیت عملکرد تقریباً برابر بودند، AMD در نسل RDNA 3 از نظر عملکرد خام سریع‌تر، اما کیفیت پایین‌تر را ارائه می‌کرد. حالا به نظر می‌رسد که RDNA 4 همچنان سرعت بالایی را ارائه می‌دهد، اما از نظر کیفیت نیز به سطح رقبا نزدیک‌تر شده است.

پشتیبانی از Flip Queue و بهبود زمان‌بندی فریم‌ها

یکی دیگر از تغییرات مهم در RDNA 4، افزودن پشتیبانی سخت‌افزاری از Flip Queue است که زمان‌بندی فریم‌های ویدئویی را به GPU واگذار می‌کند. اگرچه انویدیا راهکاری مشابه را با MFG (Multi Frame Generation) ارائه کرده بود، اما AMD این قابلیت را بیشتر بر بهبود پخش ویدئو و کاهش بار پردازشی CPU متمرکز کرده است، نه لزوماً مدیریت فریم‌های تولیدشده.

بهبود وضوح تصویر با RIS 2

AMD نسخه‌ی جدید فناوری Radeon Image Sharpening (RIS) را با نام RIS2 معرفی کرده است. این ویژگی که در سطح درایور اجرا می‌شود، بر اساس الگوریتم CAS (Contrast Aware Sharpening) بهبود یافته و حالا کیفیت بالاتری را ارائه می‌دهد. از لحاظ کاربری، این قابلیت با یک کلیک فعال می‌شود و بر تمامی APIها اعمال می‌گردد.

پشتیبانی از PCIe 5.0: افزایش پهنای باند، اما تأثیر محدود در بازی‌ها

یکی دیگر از تغییرات مهم در RDNA 4، پشتیبانی از رابط PCIe 5.0 است که پهنای باند لینک x16 را دو برابر می‌کند. با این حال، در عمل اکثر حجم‌های کاری از این افزایش پهنای باند بهره‌ی چندانی نمی‌برند. به‌ویژه در بازی‌ها، حتی PCIe 3.0 در تنظیمات x16 نیز به اندازه‌ی کافی کارآمد است و در بهترین حالت PCIe 4.0 ممکن است تأثیر جزئی داشته باشد. با این حال، هوش مصنوعی و برخی کارهای مرتبط با تولید محتوا می‌توانند از این افزایش پهنای باند بهره ببرند. شایعات حاکی از آن هستند که تراشه‌های Navi 48 و حتی RX 9060 XT ممکن است پهنای باند رابط را به x8 یا x4 کاهش دهند.

FSR 4: ارتقای بزرگ در مقیاس‌بندی و تولید فریم با هوش مصنوعی

یکی از مهم‌ترین پیشرفت‌های RDNA 4، معرفی فناوری جدید FidelityFX Super Resolution 4 یا همان FSR 4 است که در چندین جنبه کلیدی متفاوت از نسخه‌های پیشین عمل می‌کند.

۱. استفاده از شتاب‌دهنده‌های هوش مصنوعی: برخلاف نسل‌های گذشته، FSR 4 از واحدهای پردازش هوش مصنوعی در پردازنده‌های گرافیکی RDNA 4 بهره می‌برد. این فناوری در زمان عرضه فقط روی کارت‌های RDNA 4 قابل اجرا خواهد بود، اما ممکن است در آینده AMD تلاش کند آن را به RDNA 3 و حتی RDNA 2 نیز بیاورد؛ هرچند این احتمال کم است.

۲. هماهنگی با FSR 3.1: به نظر می‌رسد که AMD قصد دارد FSR 4 و FSR 3.1 را هم‌زمان ارائه دهد، به این معنی که گزینه‌ی ارتقای کیفیت تصویر از طریق FSR 4 در بازی‌هایی که FSR 3.1 را پشتیبانی می‌کنند نیز در دسترس خواهد بود. این قابلیت احتمالاً از طریق تنظیمات درایور فعال خواهد شد.

۳. پشتیبانی از تولید فریم (Frame Generation): بر اساس اطلاعات موجود، هر دو ویژگی مقیاس‌بندی و تولید فریم در FSR 4 از شتاب‌دهنده‌های هوش مصنوعی بهره می‌برند. AMD همچنین اعلام کرده که RDNA 4 از پردازش گرافیکی عصبی (Neural Rendering) پشتیبانی می‌کند، اما جزئیات بیشتری ارائه نکرده است.

بر اساس یکی از اسلایدهای توضیح دهنده در مورد این بخش، RX 9070 XT تا ۷۷۹ ترافلاپس قدرت شتاب هوش مصنوعی (AI Acceleration) را برای اجرای FSR 4 ارائه می‌دهد. این عدد احتمالاً به عملیات INT4 متراکم یا INT8 پراکنده اشاره دارد، اما هنوز مشخص نیست که الگوریتم دقیقاً از کدام دقت پردازشی استفاده می‌کند. با این وجود، واضح است که FSR 4 نسبت به نسل‌های قبل از نظر توان محاسباتی یک جهش قابل توجه داشته است.

پشتیبانی از HYPR-RX و نسخه‌ی جدید AFMF 2.1

AMD همچنین در اسلایدهای خود در مورد HYPR-RX صحبت کرده، که ترکیبی از قابلیت‌های افزایش عملکرد در سطح درایور است و با یک کلیک فعال می‌شود. این فناوری می‌تواند در برخی سناریوها مفید باشد، اما برای مقایسه‌ی عادلانه‌ی عملکرد، معمولاً از آن صرف‌نظر می‌شود. با این حال، برای گیمرها، فعال کردن HYPR-RX که شامل FSR/RSR، Anti-Lag، Radeon Boost و AFMF 2 است، می‌تواند تأثیر مثبتی داشته باشد.

علاوه بر این، نسخه‌ی جدید AFMF 2.1 نیز منتشر شده که کیفیت تولید فریم را بهبود داده، میزان روح‌زدگی (Ghosting) را کاهش داده و دقت در تشخیص و پردازش عناصر تصویری ظریف را افزایش داده است.

چرا AMD بر استفاده از GDDR6 اصرار دارد؟

یکی از جنبه‌هایی که در معماری RDNA 4 نسبت به نسل قبل تغییر نکرده، نوع حافظه‌ی مورد استفاده است. در حالی که انویدیا در کارت‌های سری RTX 50 Blackwell به سمت استفاده از حافظه‌ی GDDR7 رفته، AMD همچنان به GDDR6 پایبند مانده است. این حافظه که با سرعت 20 گیگابیت بر ثانیه کار می‌کند، در کنار رابط 256 بیتی در کارت‌های RX 9070 XT و RX 9070، پهنای باندی برابر با 640 گیگابایت بر ثانیه ارائه می‌دهد. این مقدار، دقیقا برابر با ظرفیت RX 7900 GRE و RX 7800 XT است و همچنین با RTX 5070 Ti و RTX 4070 Ti Super از انویدیا مطابقت دارد.

در بخش قبلی گفتیم که حافظه کش نامحدود (Infinity Cache) با ظرفیت 64 مگابایت در این نسل نیز بهبود یافته و انتظار می‌رود تاثیر قابل‌توجهی در پهنای باند مؤثر داشته باشد، اگرچه AMD هنوز آمار دقیقی درباره نرخ برخورد کش (Cache Hit Rate) ارائه نکرده است. با توجه به اینکه RX 7900 GRE و RX 7800 XT نیز از همین مقدار کش بهره می‌بردند و توانسته بودند پهنای باند مؤثر را حدود چهار برابر مقدار اسمی افزایش دهند، به نظر می‌رسد کارت‌های مبتنی بر تراشه Navi 48 نیز عملکرد مشابهی خواهند داشت.

اما آیا AMD به GDDR7 نیاز دارد؟

شاید بهبودهای انجام‌شده در Infinity Cache باعث شده که نیاز به استفاده از GDDR7 در این مقطع زمانی کمتر حس شود. به عنوان مثال، انویدیا با استفاده از حافظه GDDR7 با سرعت 28 گیگابیت بر ثانیه، پهنای باند خام را 40 درصد افزایش داده است، اما پس از در نظر گرفتن تأثیر حافظه کش‌های حجیم، تفاوت در پهنای باند مؤثر ممکن است آنقدرها هم زیاد نباشد.

از سوی دیگر، میزان پهنای باند مورد نیاز برای پردازنده‌ای با 64 واحد محاسباتی (CU) محدود است. به عنوان نمونه، RTX 5070 Ti انویدیا دارای 70 واحد پردازش جریانی (SM) است که معادل تقریبی واحدهای CU در AMD محسوب می‌شود. این کارت همچنین دارای حافظه کش L2 با ظرفیت 48 مگابایت است. استفاده از یک حافظه کش L3 بزرگ‌تر (64 مگابایت) همراه با تعداد واحد پردازشی کمتر می‌تواند نیاز به سرعت‌های بالاتر حافظه را کاهش دهد.

AMD همچنان از ماژول‌های 16 گیگابیتی (با چیپ‌های 2 گیگابایتی) GDDR6 استفاده می‌کند و تاکنون گزارشی مبنی بر تلاش شرکت‌های تولیدکننده برای عرضه ماژول‌های 24 گیگابیتی (با چیپ‌های 3 گیگابایتی) منتشر نشده است. این موضوع می‌تواند در آینده به نقطه‌ای مهم برای برتری انویدیا تبدیل شود، چرا که در حال حاضر تنها RTX 5090 Laptop GPU از تراشه‌های GDDR7 با ظرفیت بالاتر بهره می‌برد.

بازگشت به طراحی یکپارچه؛ خداحافظی با چیپلت‌ها

یکی از تغییرات جالب در RDNA 4 این است که AMD (حداقل در این نسل) از طراحی مبتنی بر چیپلت فاصله گرفته است. ممکن است در آینده این رویکرد دوباره مورد استفاده قرار گیرد، اما در حال حاضر Navi 48 و احتمالا Navi 44 از طراحی یکپارچه (Monolithic) بهره می‌برند. همراه با این تغییر، نسل جدید کارت‌های گرافیک AMD از فرآیند ساخت N5 در RDNA 3 به N4P در RDNA 4 ارتقا یافته است.

فرآیند N4P نسبت به N4 افزایش عملکرد و بهبود بهره‌وری انرژی را به همراه دارد و در عین حال نسخه‌ای بهینه‌شده از N5 محسوب می‌شود. شواهد نشان می‌دهند که N4P ممکن است لایه‌های فلزی بیشتری را به ساختار تراشه اضافه کرده باشد، در حالی که N4 نسبت به N5 از EUV بیشتری بهره می‌برد.

البته هنوز مشخص نیست که N4P در مقایسه با 4N و 4NP (فرآیندهای مخصوص انویدیا که در Hopper، Ada و Blackwell مورد استفاده قرار گرفته‌اند) چه تفاوت‌هایی دارد. با این حال، به نظر می‌رسد AMD این بار از نظر فناوری ساخت، در سطحی برابر با انویدیا قرار دارد.

AMD قصد رقابت با کارت‌های پرچمدار انویدیا را ندارد

عدم استفاده از حافظه GDDR7 و همچنین عدم ارائه طراحی بزرگ‌تر، این موضوع را تایید می‌کند. تراشه Navi 48 شامل 53.9 میلیارد ترانزیستور در سطح 356.5 میلی‌متر مربع است، در حالی که تراشه GB203 انویدیا که در RTX 5080 و RTX 5070 Ti به کار رفته، دارای 45.6 میلیارد ترانزیستور در سطح 378 میلی‌متر مربع است. این موضوع می‌تواند نشان‌دهنده استفاده از فرآیند ساخت بهینه‌تر توسط AMD باشد، اما نمی‌توان نتیجه‌گیری قطعی کرد.

تعداد ترانزیستورها برخلاف اندازه‌ی دای، چندان مشخص و دقیق نیستند و روش‌های متفاوتی برای شمارش آن‌ها وجود دارد. شاید AMD به طراحی متراکم‌تری دست یافته باشد، شاید هم نه. در نهایت، همه چیز به عملکرد واقعی کارت‌ها بستگی دارد.

یکی از نکات جالب این است که Navi 31، که پرچمدار نسل RDNA 3 بود، از طراحی چیپلت با یک دای محاسبات گرافیکی (GCD) به اندازه 300 میلی‌متر مربع همراه با شش دای حافظه کش (MCD) به اندازه 37.5 میلی‌متر مربع بهره می‌برد. بررسی‌ها نشان می‌دهد که تراکم تعداد ترانزیستورها در طراحی RDNA 4 نسبت به RDNA 3 تفاوت چندانی ندارد (152 میلیون ترانزیستور بر میلی‌متر مربع در GCD Navi 31 در برابر 151.2 میلیون ترانزیستور بر میلی‌متر مربع در Navi 48).

منتظر مدل رفرنس نباشید!

اگر هنوز برایتان روشن نشده، باید گفت که AMD هیچ مدل مرجعی از سری RX 9070 تولید نخواهد کرد. هرچند تصاویری که در اسلایدهای رسمی AMD نمایش داده شده، شبیه به مدل‌های مرجع (MBA) به نظر می‌رسند، اما در واقع تنها رندرهای گرافیکی هستند و نه تصاویر واقعی از سخت‌افزار نهایی. در فرایند طراحی و تست، قطعا نمونه‌های اولیه‌ای وجود داشته، اما این موضوع چندان اهمیتی ندارد.

تمام کارت‌های گرافیک سری RX 9070 توسط شرکای تجاری (AIB) ساخته خواهند شد. این موضوع دو پیامد دارد:

تنوع گسترده در مشخصات نهایی، از جمله سرعت کلاک، توان مصرفی، تعداد فن‌ها و حتی نورپردازی RGB.
عدم کنترل AMD بر قیمت‌های خرده‌فروشی.

به احتمال زیاد، AMD از شرکای خود می‌خواهد حداقل یک مدل با قیمت رسمی (MSRP) ارائه دهند، اما پس از آن، همه‌چیز در اختیار تولیدکنندگان خواهد بود. همان‌طور که در مورد RTX 5070 Ti نیز مشاهده شد، نبود مدل مرجع از سوی انویدیا باعث شد که مدل‌های گران‌قیمت‌تر با تغییرات جزئی و قیمت‌های بالاتر به بازار عرضه شوند.

در نهایت، اگر عرضه به اندازه کافی پاسخگوی تقاضا نباشد، مدل‌های گران‌قیمت‌تر بازار را پر خواهند کرد. اما اگر عرضه به حد مطلوبی برسد، قیمت‌ها کاهش پیدا خواهند کرد.

درایورها و نرم‌افزارها

آخرین موردی که AMD به آن پرداخت، درایورهای جدید Adrenalin 25.3.1 و برخی قابلیت‌های نرم‌افزاری جدید بود. در حالی که رابط کاربری درایور برای کاربران کارت‌های گرافیک AMD آشنا خواهد بود، برخی تغییرات در پس‌زمینه به همراه ویژگی‌های جدید اضافه شده‌اند. در این میان، هوش مصنوعی در هر دو بخش نقش مهمی ایفا می‌کند. پیش‌تر در مورد FSR 4 و Frame Generation صحبت کردیم، حالا نگاهی به دیگر کاربردهای AI در این درایورها بیندازیم.

نخست، AMD از هوش مصنوعی برای شناسایی خطاهای رندرینگ و مشکلات پایداری استفاده می‌کند. این شرکت ادعا دارد که درایورهای 25.3.1 پایدارترین و بدون خطاترین درایورهایی هستند که تاکنون منتشر کرده است. اینکه این ادعا تا چه حد درست باشد، باید منتظر بمانیم و ببینیم.

علاوه بر این، AMD ویژگی‌هایی مشابه با Chat RTX انویدیا را معرفی کرده است. این قابلیت‌ها توسط نرم‌افزار AMD Install Manager مدیریت می‌شوند که همراه با درایورهای معمولی نصب می‌شود. این ابزار علاوه بر به‌روزرسانی خودکار درایورهای چیپست، چندین قابلیت جدید نیز دارد:

AMD Chat: یک چت‌بات که به سؤالات شما در مورد دمای GPU، عملکرد کارت گرافیک و سایر مشخصات سخت‌افزاری پاسخ می‌دهد. البته حجم این قابلیت 25 گیگابایت است، بنابراین اگر فضای کافی ندارید یا علاقه‌ای به چت با سیستم خود ندارید، شاید بخواهید از نصب آن صرف‌نظر کنید.
AI Apps Manager: لیستی از نرم‌افزارها و ابزارهای نصب‌شده را که از هوش مصنوعی استفاده می‌کنند نمایش می‌دهد. همچنین، این بخش امکان نصب Amuse، ابزار تولید تصویر و ویدیوی مبتنی بر AI اختصاصی AMD، را نیز فراهم می‌کند.
Image Inspector: قابلیتی که برای شناسایی و گزارش خطاهای رندرینگ و باگ‌ها طراحی شده است. این ویژگی که به‌صورت Opt-in (اختیاری) است، از منابع آزاد GPU استفاده کرده و در صورت فعال‌سازی، به‌طور خودکار مشکلات گرافیکی را شناسایی و برای AMD ارسال می‌کند. با این حال، ممکن است حتی با استفاده از منابع کم، تأثیری هرچند جزئی روی عملکرد سیستم داشته باشد.

وضعیت کلی بازار پردازنده‌های گرافیکی

RDNA 4 در واقع همان چیزی است که AMD باید با RDNA 3 انجام می‌داد، اما به‌جای آن، مسیر چیپلت‌های چندگانه را امتحان کرد که در نهایت این تکنیک هم کنار گذاشته شد. در نسل جدید، AMD بالاخره توجه ویژه‌ای به رهگیری پرتو و شتاب‌دهنده‌های هوش مصنوعی در محصولات مصرفی خود نشان داده است. البته، شاید در زمان عرضه RDNA 2 این کمبود قابل توجیه بود، چراکه فناوری RTX انویدیا تازه در حال جا افتادن بود، اما در زمان RDNA 3، AMD باید فراتر از این عمل می‌کرد.

یکی از نکات جالب این است که افزایش قابلیت‌های سخت‌افزاری باعث بزرگ‌تر شدن ابعاد تراشه نشده است. تراشه Navi 48 دارای مساحت 357 میلی‌متر مربع روی نود 5 نانومتری (N4P) است. این در حالی است که Navi 31 با 300 میلی‌متر مربع از نود N5 استفاده می‌کرد و به چیپلت‌های حافظه خارجی و ارتباطات Infinity Fabric متکی بود. حالا که AMD این ارتباطات را حذف کرده و هسته‌ها را بهینه‌سازی کرده، مشخص است که این معماری سال‌ها پیش هم ممکن بود. انویدیا سال‌ها پیش این مسیر را رفت، اما AMD در RDNA 3 همچنان تأکید داشت که "رهگیری پرتو و AI چندان مهم نیستند"، و نتیجه آن را دیدیم. RDNA 4 بالاخره این اشتباه را اصلاح کرده، یا حداقل در تلاش است که اصلاح کند. حالا فقط باید ببینیم عملکرد واقعی این سخت‌افزار چگونه خواهد بود.

رقبای RDNA 4، معماری Blackwell RTX از انویدیا و Arc Battlemage از اینتل خواهند بود. در ماه‌های اخیر، عرضه کارت‌های گرافیک به شدت دچار کمبود شده است (بله، این یک بیان کنایه‌آمیز از یک بحران واقعی است). هر GPU جدیدی که عرضه می‌شود، در همان روزهای اول به اتمام می‌رسد و با قیمتی بسیار بالاتر از MSRP فروخته می‌شود. این روند از Arc B580 شروع شد و با Blackwell انویدیا به اوج خود رسید.

بحران کمبود سیلیکون در صنعت فناوری

شرایط در کوتاه‌مدت بهتر نخواهد شد. مشکل اصلی این است که تقاضا برای تولید تراشه بسیار بیشتر از ظرفیت تولیدی کارخانه‌هاست. TSMC در حال حاضر تأمین‌کننده پردازنده‌های AMD، اپل، اینتل و انویدیا است، اما شرکت‌های بزرگی مانند گوگل، آمازون و متا نیز در صف تولیدات آن قرار دارند.

حتی اگر یک شرکت تعداد مشخصی ویفر را برای تولید در ماه خریداری کند، این‌که چگونه از این ویفرها استفاده کند، همچنان چالشی بزرگ است. برای مثال، AMD می‌تواند با نود N4P، RDNA 4 تولید کند، اما در عین حال، می‌تواند چیپلت‌های Zen 5 برای پردازنده‌های Ryzen و EPYC، CDNA 3 برای دیتاسنترها (MI300X)، یا حتی CDNA 4 برای سرورها را تولید کند که احتمالاً در سال جاری معرفی خواهد شد. این محدودیت برای انویدیا و اینتل هم وجود دارد، چراکه آنها نیز از TSMC برای پردازنده‌های Arrow Lake، Lunar Lake و Battlemage استفاده می‌کنند.

در سال گذشته، انویدیا با فروش 130 میلیارد دلاری رکورد زد، که 91.3 درصد از آن مربوط به بازار دیتاسنتر و تنها 8.7 درصد (11.35 میلیارد دلار) مربوط به گیمینگ بود. طبیعی است که این شرکت سرمایه‌گذاری بیشتری روی پردازنده‌های AI انجام دهد و بازار گیمینگ را در اولویت دوم قرار دهد.

آینده پردازنده‌های گرافیکی؛ امیدها و نگرانی‌ها

خبر خوب این است که ظرفیت تولید سیلیکون در حال افزایش است. البته، بخش زیادی از این ظرفیت جدید صرف تولید پردازنده‌های AI خواهد شد، اما هرچه ظرفیت کلی افزایش یابد، احتمالاً تولید پردازنده‌های گرافیکی مصرفی هم بیشتر خواهد شد. شاید AMD و Intel از این فرصت استفاده کرده و حضور خود را در بازار GPU گیمینگ گسترش دهند، در حالی که انویدیا بیشتر بر روی AI متمرکز می‌شود. شاید هم انویدیا به یاد روزهای ابتدایی خود بیفتد و همچنان به تولید پردازنده‌های گرافیکی گیمینگ ادامه دهد.

در نهایت، آنچه واضح است، این است که تا زمانی که صنعت هوش مصنوعی در حال رشد باشد، پردازنده‌های گرافیکی گیمینگ برای اکثر شرکت‌های بزرگ یک اولویت درجه دو خواهند بود. امیدواریم که این روند مانند ماینینگ ارز دیجیتال، یک موج گذرا باشد، اما بعید است که چنین اتفاقی بیفتد.

مهمان - ضرغام

واقعاً از وجود AMD لذت میبرم. مثل انویدیا هدف اول و آخرش تلکه کردن ملت نیست. امیدوارم این طب هوش مصنوعی هم فروکش کنه بتونیم دو تا کارت خوب بخریم یه دست گیم بزنیم

حدود 1 سال قبل

0 دوست دارم پاسخ
مهمان - یاسر
در پاسخ به: مهمان - ضرغام

تب با ت هست نه ط
با تشکر
غلامعلی حداد عادل

حدود 1 سال قبل

0 دوست دارم پاسخ
مهمان - گلدن

ای بابا چرا باید خوش حال باشیم؟ در بهترین حالت دو سال دیگه میشه خرید اونم با قیمت گزاف

حدود 1 سال قبل

0 دوست دارم پاسخ