ساعتی پیش شرکت AMD رسماً از کارتهای گرافیک جدید خود، Radeon RX 9070 با قیمت 549 دلار و Radeon RX 9070 XT با قیمت 599 دلار رونمایی کرد. این کارتها از تاریخ 16 اسفند ماه عرضه خواهند شد. اگر میخواهید هر آنچه لازم است در مورد این معماری، محصولات پیشرو، زمان عرضه، قابلیتها و امکاناتش بدانید مطالعه این مقاله از شهر سختافزار را از دست ندهید.
مقدمه
همانطور که میدانید، اطلاعات اولیه در مورد معماری RDNA 4 و کارتهای سری Radeon RX 9000 در نمایشگاه CES 2025 منتشر شد، اما در جریان ارائه اصلی AMD خبری از این محصولات نبود. تاکنون اطلاعات بسیار محدودی بهصورت رسمی در دسترس بود، اما اکنون AMD در یک ارائه ویدیویی جزئیات بیشتری درباره ارتقاءهای معماری، مشخصات فنی و سایر ویژگیها منتشر کرده است. این کارتها برای رقابت با سری Blackwell RTX 50 انویدیا و سری Battlemage Arc B اینتل طراحی شدهاند و احتمالاً به زودی در فهرست برترین کارتهای گرافیک بازار قرار خواهند گرفت.
هر چه محصول بیشتری در بازار موجود باشد برای گیمرها و کاربران دیگر بهتر است. در واقع این رقابت و موجودی بازار است که مشخص میکند چه کارتی چه قیمتی داشته باشد. اما این روزها شرایط بازار کارت گرافیک به حدی عجیب شده که کارتی که یک ماه پیش معرفی شده با قیمت چند برابر MSRP هم به سختی یافت میشود.
تأخیر در عرضه و شرایط بازار
ابتدا به ساکن این مورد را در نظر داشته باشید که همانند کارتهای RTX 50 انویدیا، عرضه کارتهای گرافیک ای ام دی بر پایه RDNA 4 نیز با تأخیر مواجه شده است. در ابتدا شایعاتی مبنی بر معرفی این کارتها در CES 2025 و عرضه در ژانویه یا فوریه (دی و بهمن ماه) منتشر شده بود، اما در نهایت، ماه مارس (اسفند ماه) به عنوان زمان رسمی عرضه اعلام شد. این تأخیر ممکن است به دلایل متفاوتی رخ داده باشد که باید در مطلب دیگری به بررسی آن بپردازیم. به هر حال، در این میان، انویدیا نیز احتمالاً کارت RTX 5070 خود را همزمان با عرضه RX 9070 XT و RX 9070 معرفی خواهد کرد تا رقابت بازار را داغتر کند.
اما اگر به وضعیت فعلی موجودی کارتهای گرافیک در بازار نگاهی بیندازید، متوجه خواهید شد که تقریباً همه مدلهای محبوب یا نایاب شدهاند یا با قیمتهای بالاتر از حد معمول فروخته میشوند. AMD در گذشته نیز با مشکلاتی در گذار نسلهای کارتهای گرافیک خود مواجه بوده است؛ نسل قبلی مدت زیادی در بازار باقی ماند و با محصولات جدید رقابت داشت. این بار اما، وضعیت کاملاً برعکس شده و در کشورهای بدون محدودیت دسترسی، کارتهای سری RX 7000 تقریباً از بازار حذف شدهاند و تنها مدلهای RX 7600 و RX 7600 XT هنوز با قیمت پایه در دسترس هستند.
وضعیت تقاضا و کمبود موجودی
کاهش موجودی، موجب افزایش شدید تقاضا برای کارتهای گرافیک در همه سطوح، از مدلهای میانرده تا مدلهای پیشرفته شده است. کارتهای RTX 5090، RTX 5080 و RTX 5070 Ti انویدیا بلافاصله پس از عرضه به فروش رفتند. حال باید دید که آیا RX 9070 XT و RX 9070 عملکرد بهتری خواهند داشت یا خیر. پیشبینی میشود که با وجود دو ماه تولید و تأمین موجودی، تقاضا همچنان بیشتر از عرضه باشد و قیمتها افزایش پیدا کنند. احتمالاً تا پایان سال وضعیت بازار به تعادل برسد، اما در کوتاهمدت، کمبود کالا و افزایش قیمت ادامه خواهد داشت.
تأثیر هوش مصنوعی بر بازار کارتهای گرافیک
تردیدی نیست که سودآوری بینظیر و رکوردشکن انویدیا از بخش هوش مصنوعی نقش مهمی در این شرایط دارد. در حالی که AMD در بخش پردازندههای مخصوص مراکز داده به اندازه انویدیا فروش ندارد، اما بخش زیادی از ظرفیت تولید TSMC برای تولید پردازندههای CPU و GPU مخصوص این حوزه اختصاص داده شده است. در نتیجه، گیمرها در اولویت دوم شرکتهای ریختهگری سیلیکون قرار گرفتهاند و به طبع، سهم محدودی از تولید تراشهها را دریافت میکنند.
اما بهتر است از این بحث عبور کنیم و به بررسی مشخصات معماری RDNA 4، قابلیتهای جدید و سایر جزئیات بپردازیم. همچنین، قیمتگذاری این کارتها را بررسی خواهیم کرد، هرچند در شرایط فعلی، قیمت اعلامشده تنها یک عدد روی کاغذ محسوب میشود.
مشخصات فنی کارتهای گرافیک RDNA 4
پیش از هر چیز به مشخصات اعلام شده برای کارتهای گرافیک با معماری RDNA 4 شرکت AMD برای محصولات آتی آن میپردازیم. در جدول زیر که توسط Toms Hardware منتشر شده میتوانید مشخصات این کارتهای جدید را ببینید.
مدل کارت گرافیک |
RX 9070 XT |
RX 9070 |
RX 9060 XT? |
RX 9060? |
---|---|---|---|---|
معماری |
Navi 48 |
Navi 48 |
Navi 48? |
Navi 44? |
فناوری ساخت |
TSMC N4P |
TSMC N4P |
TSMC N4P |
TSMC N4P? |
تعداد ترانزیستور (میلیارد) |
53.9 |
53.9 |
53.9 |
22? |
اندازه دای (میلیمتر مربع) |
356.5 |
356.5 |
356.5 |
153? |
SMs / CUs / Xe-Cores |
64 |
56 |
32? |
20? |
شیدر GPU |
4096 |
3584 |
2048? |
1280? |
تعداد هسته تنسور یا AI |
128 |
112 |
64? |
40? |
تعداد هسته RT |
64 |
56 |
32? |
20? |
فرکانس بوست (مگاهرتز) |
2970 |
2520 |
2790? |
2700? |
سرعتVRAM (Gbps) |
20 |
20 |
20? |
20? |
VRAM (GB) |
16 |
16 |
12? |
8? |
عرض گذرگاه حافظه |
256 |
256 |
192? |
128? |
L2 / Infinity Cache |
64 |
64 |
48? |
32? |
واحدهای رندر خروجی |
128 |
128 |
96? |
64? |
واحدهای مپینگ بافت |
256 |
224 |
128? |
80? |
TFLOPS FP32 (Boost) |
48.7 |
36.1 |
22.9? |
13.8? |
TFLOPS FP16 (FP4/FP8 TFLOPS) |
389 (1557) |
289 (1156) |
183 (731)? |
111 (442)? |
Bandwidth (GB/s) |
640 |
640 |
480? |
320? |
TBP (watts) |
304 |
220 |
150? |
120? |
زمان عرضه |
اسفند 1403 |
اسفند 1403 |
اردیبهشت یا خرداد 1404 |
اردیبهشت یا خرداد 1404 |
قیمت (دلار) |
599 |
549 |
399? |
299? |
- نکته: دو ستون اول جدول فوق در مورد RX 9070 XT و RX 9070 بر اساس اطلاعات رسمی تهیه شده و در مورد ستونهای مربوط به دو نسخه RX 9060 باید منتظر تایید رسمی بمانیم!
ارتقاءهای معماری و بهبود عملکرد
کارت RX 9070 XT از تراشه Navi 48 بهطور کامل بهره میبرد که شامل 64 واحد محاسباتی (CU) است. این مدل با فرکانس بوست 2.97 گیگاهرتز و رابط حافظه 256 بیتی همراه با حافظه GDDR6 با سرعت 20 گیگابیت بر ثانیه عرضه میشود. RX 9070 نیز مشخصات مشابهی دارد، اما با 56 واحد محاسباتی و فرکانس بوست 2.52 گیگاهرتز ارائه شده است. برای مقایسه در نظر داشته باشید که کارتهای سری RTX 50 انویدیا همگی از حافظه GDDR7 استفاده میکنند.
علاوه بر این، AMD در معماری RDNA 4 هستههای هوش مصنوعی و رهگیری پرتو را بهطور چشمگیری ارتقا داده است. هستههای AI اکنون دو برابر تعداد عملیات FP16 را در هر سیکل پردازشی انجام میدهند و از قابلیت Sparse Computing بهره میبرند که میتواند عملکرد را تا دو برابر افزایش دهد.
قیمت کارتهای گرافیک سری RX 9000 و رقابت با انویدیا
AMD اعلام کرده است که Radeon RX 9070 با قیمت 549 دلار و RX 9070 XT با قیمت 599 دلار عرضه خواهند شد، که آنها را در بخش «میانرده» میدهد. با این حال، با توجه به شرایط فعلی بازار، قیمت اعلامشده از سوی AMD احتمالاً چندان اهمیتی نخواهد داشت. در کوتاهمدت، تقریباً قطعی است که تمام کارتها به سرعت فروخته شده و با قیمتی بسیار بالاتر از MSRP و توسط دلالان به فروش خواهند رسید.
در دنیای امروز، تعریف قیمتها برای کارتهای گرافیک به شکل زیر تغییر کرده است:
- ارزانقیمت (Budget): بین 250 تا 300 دلار
- میانرده (Mainstream): بین 400 تا 700 دلار
- ردهبالا (High-End): بین 800 تا 1,000 دلار
- پرمیوم یا علاقهمندان (Enthusiast): 1,500 دلار به بالا
با توجه به این سطوح باید گفت که AMD با سری RX 9070، مستقیماً بازار میانرده را هدف قرار داده و احتمالاً با مدلهای 9060، بخش میانردهی پایینتر و حتی بخش اقتصادی بالاتر را پوشش خواهد داد.
با توجه به میزان موجودی کارتها و عملکرد آنها، RDNA 4 ارزش قیمت اعلامشده را خواهد داشت. اما مسئله اینجاست که احتمالاً تعداد کافی از این کارتها (دستکم برای چند ماه اول) در بازار موجود نخواهد بود. با توجه به این قیمتهای نسبتاً مناسب، انتظار داشته باشید که دلالها (Scalpers) و خردهفروشان قیمتها را بالاتر ببرند.
این وضعیت در واقع تکرار کمبود کارتهای گرافیکی در دوران ماینینگ ارزهای دیجیتال است، با این تفاوت که این بار هوش مصنوعی (AI) عامل اصلی تقاضا است و این روند ممکن است برای سالها ادامه داشته باشد. امیدواریم که این پیشبینی اشتباه باشد، اما تجربهای که تاکنون از عرضهی سری RTX 50 داشتیم، چندان امیدبخش نبوده است.
تاریخ عرضه پردازندههای گرافیکی RDNA 4
در حالی که پیشتر اعلام شده بود کارتهای گرافیک RX 9070 در تاریخ ۶ مارس ۲۰۲۵ (پنجشنبه 16 اسفند 1403) عرضه خواهند شد، شرکت AMD اخیراً اشارههایی به خانواده RX 9060 نیز داشته است. اما پرسشهای مهمی در این میان باقی میمانند: آیا شاهد چندین مدل مختلف از این خانواده خواهیم بود یا تنها یک کارت گرافیک در این سری عرضه میشود؟ آیا نسخههای پایینردهتری نظیر RX 9050 نیز در راه هستند؟
پاسخ قطعی در حال حاضر مشخص نیست، اما آنچه میتوان با اطمینان گفت این است که این مدلها احتمالاً بین آوریل تا پایان سال ۲۰۲۵ روانه بازار خواهند شد؛ البته امیدواریم زودتر از این زمان عرضه شوند.
گمانهزنیها پیرامون ابعاد دای Navi 44 نشان میدهند که این تراشه بهمراتب کوچکتر از نسل قبل بوده و احتمالاً جایگزینی برای Navi 33 (سری RX 7600) محسوب میشود. در صورتی که این اطلاعات صحت داشته باشد، ممکن است عرضهی این کارت به تعویق بیفتد، بهویژه با توجه به اینکه هنوز موجودی RX 7600 و RX 7600 XT در بازار به میزان قابلتوجهی یافت میشود. چنین شرایطی مشابه اتفاقی است که هنگام عرضه RX 7600 رخ داد، زیرا در آن زمان مدلهای Navi 23 (مانند RX 6650 XT / RX 6600 XT / RX 6600) همچنان با قیمتهای پایینتری در دسترس بودند.
با توجه به نامگذاری AMD، انتظار میرود که RX 9060 در رقابت مستقیم با سری RTX 5060 انویدیا قرار بگیرد. با این حال، برای این رقابت احتمالاً به تراشهای بزرگتر از آنچه تاکنون در شایعات مطرح شده، نیاز خواهد بود. البته، نباید فراموش کرد که RX 7600 نیز بهصورت تئوری رقیب RTX 4060 محسوب میشود، در حالی که مدل RTX 4050 تاکنون عرضه نشده و احتمال عرضهی RTX 5050 نیز بسیار پایین است.
نسخه اقتصادی بر پایه RDNA 4؟
شاید شما هم با خواندن اطلاعات فوق به این فکر کرده باشید که آیا AMD برنامهای برای تولید یک تراشهی اقتصادی و مقرونبهصرفه در خانواده RDNA 4 دارد؟ بر اساس اطلاعات غیررسمی، این احتمال وجود دارد و حتی میتوان گفت که چنین اتفاقی محتمل است.
اگر Navi 48 را ملاک قرار دهیم، یک پردازندهی گرافیکی با اندازهای کمتر از نصف Navi 48 میتواند قیمت حدود ۲۰۰ تا ۲۵۰ دلار داشته باشد و به انتخابی جذاب برای بازیکنان با بودجه محدود و همچنین تولیدکنندگان سیستمهای آماده (OEMs) تبدیل شود. با ابعاد تقریبی ۱۵۰ تا ۱۶۰ میلیمتر مربع، AMD میتواند تراشههای بیشتری را از هر ویفر سیلیکونی استخراج کند.
اما در صورتی که این کارتها نهایتاً با قیمت ۲۵۰ دلار یا کمتر به فروش برسند، ممکن است این سرمایهگذاری چندان سودآور نباشد؛ بهخصوص در مقایسه با پردازندههای گرافیکی مراکز داده که با قیمتهای بسیار بالاتر، حتی دهها هزار دلار به فروش میرسند.
معماری پردازندهی گرافیکی RDNA 4
تصاویر و اسلایدهای منتشرشدهی AMD شامل اطلاعات جامعی از مشخصات معماری جدید RDNA 4 و بهینهسازیهای انجامشده در این نسل است. تمرکز AMD در این معماری بر افزایش عملکرد هر واحد محاسباتی (CU) در تمامی حوزههای پردازشی، از جمله شطرنجیسازی (Rasterization)، رهگیری پرتو (Ray Tracing) و محاسبات هوش مصنوعی (AI Compute) بوده است.
بهبودهای عملیات شطرنجیسازی
عملکرد Rasterization در این نسل کمترین میزان بهبود را در مقایسه با نسل قبل داشته، اما همچنان طبق ادعای AMD حدود ۴۰ درصد سریعتر از RDNA 3 است. در مقابل، عملکرد رهگیری پرتو تقریباً دو برابر شده است. همچنین عملکرد پردازش هوش مصنوعی در محاسبات FP16 متراکم دو برابر شده، در حالی که فرمتهای با دقت پایینتر حتی افزایش عملکرد بیشتری نیز به شما نشان خواهند داد.
جزئیات دقیق بهبودهای مرتبط با رسترسازی هنوز مشخص نیست، اما AMD اعلام کرده که پشتیبانی از درخواستهای حافظه خارج از ترتیب (Out of Order Memory Requests)، که بهویژه در رهگیری پرتو بسیار مؤثر است، میتواند در پردازشهای رسترسازی نیز سودمند باشد.
مدیریت پویای ثباتها (Dynamic Register Allocation) یکی دیگر از تغییرات مهم در RDNA 4 محسوب میشود. در معماری RDNA 3 و نسلهای قبلتر، رجیسترها برای سناریوهای بدترین حالت رزرو میشدند، اما اکنون این فرایند بهصورت پویا انجام میشود. این بهینهسازی به پردازنده اجازه میدهد تا در شرایطی که نیاز است، تعداد امواج فعال را افزایش دهد. ای ام دی در یک مثال نشان داده که این تغییر میتواند از ۳ موج به ۴ موج افزایش یابد که به معنی افزایش ۳۳ درصدی کارایی در شرایط خاص است.
بهبودهای عملیات رهگیری پرتو
در حوزه رهگیری پرتو، AMD پیشرفتهای محسوسی را به نمایش گذاشته است. این معماری نرخ برخورد پرتو به مثلث و پر تو به جعبه (Ray/Triangle و Ray/Box Intersection) را در هر واحد RT دو برابر کرده است. همچنین، از قابلیتهای جدیدی مانند تبدیل بلادرنگ سختافزاری (Hardware Instance Transforms)، بافتهای محدودکنندهی جهتدار (Oriented Bounding Boxes) و ساختار بهبودیافتهی BVH (Bounding Volume Hierarchy) بهره میبرد. بهینهسازیهای حافظهای نیز شامل بازگردانی دادهها بهصورت خارج از ترتیب و مدیریت بهبودیافتهی پشته سختافزاری پرتوها هستند.
بخش عمدهای از بهبودهای رهگیری پرتو ناشی از دو برابر شدن نرخ برخوردها و فشردهسازی بهتر BVH است. هرچند عملکرد RDNA 4 در مقایسه با سختافزارهای جدید انویدیا هنوز کاملاً مشخص نیست، اما قطعاً نسبت به نسلهای RDNA 3 و RDNA 2 پیشرفت چشمگیری خواهد داشت. بنابر تحلیل منتشر شده در منبع، این معماری احتمالاً به عملکرد معماری Ada انویدیا نزدیک خواهد شد، هرچند که شاید به سطح Blackwell نرسد.
تغییرات حوزه AI
همانطور که پیشتر اشاره شد، بزرگترین تغییرات RDNA 4 در حوزهی هوش مصنوعی اتفاق افتاده است. انویدیا از زمان معرفی سری RTX 20 همواره در حال بهبود هستههای تانسوری (Tensor Cores) خود بوده است. حتی پیش از آن، پردازندهی گرافیکی ولتا (Volta) در بخش دیتاسنترها از هستههای تانسوری بهره میبرد. به همین دلیل، انویدیا اکنون در نسل پنجم هستههای AI Matrix خود قرار دارد، در حالی که AMD تازه به نسل دوم رسیده است؛ البته با این تفاوت که AMD بسیاری از پیشرفتهای صورتگرفته در معماری CDNA خود را به RDNA 4 انتقال داده است.
عملکرد پردازشی در RDNA 4 نسبت به نسل قبل پیشرفت قابلتوجهی داشته است:
- RDNA 3 قادر بود 512 عملیات FP16 در هر سیکل پردازشی انجام دهد، بدون پشتیبانی از Sparse Computing، و همچنین 1024 عملیات INT4 در هر سیکل.
- RDNA 4 این مقدار را در چندین سطح افزایش داده است:
- 2 برابر افزایش در FP16 برای محاسبات متراکم (Dense Operations)
- 4 برابر افزایش در عملیات FP16 با محاسبات پراکنده (Sparse Computing)
- 8 برابر افزایش در FP8، که بهشدت در حوزهی AI کاربرد دارد
بهطور خلاصه، RDNA 4 تا 8 برابر توان پردازشی بیشتری در FP8 نسبت به FP16 در RDNA 3 ارائه میدهد و INT4 نیز تا 8 برابر بهبود یافته است.
برای نشان دادن تأثیر این تغییرات، AMD یک مقایسهی عملی از عملکرد AI بینRX 9070 XT (با 64 واحد CU) وRX 7900 XT (با 84 واحد CU) انجام داد. در این آزمایش، RX 7900 XT از نظر تعداد واحدهای پردازشی 31 درصد برتری داشته، اما RX 9070 XT توانست تقریباً 2 برابر عملکرد بهتری ارائه دهد.
این افزایش عملکرد برای پردازشهای مبتنی بر هوش مصنوعی، یادگیری ماشین، و همچنین فناوریهایی مانند FSR 4 و تولید فریم بسیار ارزشمند خواهد بود.
تغییرات در حافظه کش
علاوه بر این، AMD برخی تغییرات در ساختار کش و حافظهی RDNA 4 ایجاد کرده است. جزئیات دقیقی در مورد این تغییرات ارائه نشده، اما تأکید شده که این سومین نسل از Infinity Cache محسوب میشود.
- حجم حافظه کش همچنان 64 مگابایت است، مشابه چیزی که در RX 7900 GRE و RX 7800 XT (با باس 256 بیتی) دیدهایم.
- اما تفاوت بزرگ اینجاست که اینبار کش بخشی از چیپ مونولیتیک (یکپارچه) است، که احتمالاً منجر به بهبود تأخیر (Latency) و افزایش پهنای باند (Throughput) آن خواهد شد.
بهبودهای معماری RDNA 4
معماری RDNA 4 تنها به ارتقاهای هستهای محدود نمیشود. در کنار پیشرفتهای مهم در زمینه رسترسازی (Rasterization)، رهگیری پرتو (Ray Tracing) و محاسبات هوش مصنوعی (AI Compute)، شرکت AMD چندین بخش دیگر را نیز بهینهسازی کرده است. یکی از مهمترین تغییرات، بهبود سختافزار رمزگذاری ویدئو است. در نسل گذشته، عملکرد AMD در این زمینه نسبت به Nvidia و Intel ضعیفتر بود، اما با RDNA 4 این فاصله کاهش یافته است.
به صورت کلی باید گفت که AMD با RDNA 4 نهتنها عملکرد rasterization (شطرنجیسازی)، رهگیری پرتو و هوش مصنوعی را ارتقا داده، بلکه رمزگذاری ویدئو، مقیاسبندی تصویر، تولید فریم و کاهش بار پردازشی CPU را نیز بهبود بخشیده است. پشتیبانی از PCIe 5.0 و عرضهی FSR 4 نشان میدهد که این نسل نسبت به RDNA 3 جهش قابلتوجهی داشته و AMD در تلاش است تا در رقابت با Nvidia و Intel از نظر کیفیت و کارایی به سطح بالاتری برسد.
AMD اعلام کرده که کیفیت رمزگذاری H.264 (AVC) تا ۲۵ درصد، H.265 (HEVC) تا ۱۱ درصد بهبود یافته و همچنین کارایی رمزگذاری AV1 افزایش یافته است. پشتیبانی بهتر از فرمتهای AV1 و VP9 در کنار کاهش دسترسیهای حافظه، از دیگر پیشرفتهای این نسل محسوب میشود.
افزایش قدرت در رمزگذاری ویدئو
علاوه بر افزایش کیفیت، RDNA 4 به موتور چندرسانهای دوگانه (Dual Media Engine) مجهز شده است. انویدیا این ویژگی را در معماری Ada معرفی کرده بود و به نظر میرسد AMD نیز از همان مسیر پیروی کرده است. البته این تغییر ممکن است بر تمامی حجمهای کاری تأثیر یکسانی نداشته باشد، اما AMD ادعا میکند که توان رمزگذاری AV1 را دو برابر کرده است.
بهبود کیفیت رمزگذاری ویدئو، بهویژه در رمزگذارهای سختافزاری، همیشه با محدودیتهایی مواجه است. در حالی که محصولات قبلی انویدیا و اینتل از لحاظ کیفیت عملکرد تقریباً برابر بودند، AMD در نسل RDNA 3 از نظر عملکرد خام سریعتر، اما کیفیت پایینتر را ارائه میکرد. حالا به نظر میرسد که RDNA 4 همچنان سرعت بالایی را ارائه میدهد، اما از نظر کیفیت نیز به سطح رقبا نزدیکتر شده است.
پشتیبانی از Flip Queue و بهبود زمانبندی فریمها
یکی دیگر از تغییرات مهم در RDNA 4، افزودن پشتیبانی سختافزاری از Flip Queue است که زمانبندی فریمهای ویدئویی را به GPU واگذار میکند. اگرچه انویدیا راهکاری مشابه را با MFG (Multi Frame Generation) ارائه کرده بود، اما AMD این قابلیت را بیشتر بر بهبود پخش ویدئو و کاهش بار پردازشی CPU متمرکز کرده است، نه لزوماً مدیریت فریمهای تولیدشده.
بهبود وضوح تصویر با RIS 2
AMD نسخهی جدید فناوری Radeon Image Sharpening (RIS) را با نام RIS2 معرفی کرده است. این ویژگی که در سطح درایور اجرا میشود، بر اساس الگوریتم CAS (Contrast Aware Sharpening) بهبود یافته و حالا کیفیت بالاتری را ارائه میدهد. از لحاظ کاربری، این قابلیت با یک کلیک فعال میشود و بر تمامی APIها اعمال میگردد.
پشتیبانی از PCIe 5.0: افزایش پهنای باند، اما تأثیر محدود در بازیها
یکی دیگر از تغییرات مهم در RDNA 4، پشتیبانی از رابط PCIe 5.0 است که پهنای باند لینک x16 را دو برابر میکند. با این حال، در عمل اکثر حجمهای کاری از این افزایش پهنای باند بهرهی چندانی نمیبرند. بهویژه در بازیها، حتی PCIe 3.0 در تنظیمات x16 نیز به اندازهی کافی کارآمد است و در بهترین حالت PCIe 4.0 ممکن است تأثیر جزئی داشته باشد. با این حال، هوش مصنوعی و برخی کارهای مرتبط با تولید محتوا میتوانند از این افزایش پهنای باند بهره ببرند. شایعات حاکی از آن هستند که تراشههای Navi 48 و حتی RX 9060 XT ممکن است پهنای باند رابط را به x8 یا x4 کاهش دهند.
FSR 4: ارتقای بزرگ در مقیاسبندی و تولید فریم با هوش مصنوعی
یکی از مهمترین پیشرفتهای RDNA 4، معرفی فناوری جدید FidelityFX Super Resolution 4 یا همان FSR 4 است که در چندین جنبه کلیدی متفاوت از نسخههای پیشین عمل میکند.
۱. استفاده از شتابدهندههای هوش مصنوعی: برخلاف نسلهای گذشته، FSR 4 از واحدهای پردازش هوش مصنوعی در پردازندههای گرافیکی RDNA 4 بهره میبرد. این فناوری در زمان عرضه فقط روی کارتهای RDNA 4 قابل اجرا خواهد بود، اما ممکن است در آینده AMD تلاش کند آن را به RDNA 3 و حتی RDNA 2 نیز بیاورد؛ هرچند این احتمال کم است.
۲. هماهنگی با FSR 3.1: به نظر میرسد که AMD قصد دارد FSR 4 و FSR 3.1 را همزمان ارائه دهد، به این معنی که گزینهی ارتقای کیفیت تصویر از طریق FSR 4 در بازیهایی که FSR 3.1 را پشتیبانی میکنند نیز در دسترس خواهد بود. این قابلیت احتمالاً از طریق تنظیمات درایور فعال خواهد شد.
۳. پشتیبانی از تولید فریم (Frame Generation): بر اساس اطلاعات موجود، هر دو ویژگی مقیاسبندی و تولید فریم در FSR 4 از شتابدهندههای هوش مصنوعی بهره میبرند. AMD همچنین اعلام کرده که RDNA 4 از پردازش گرافیکی عصبی (Neural Rendering) پشتیبانی میکند، اما جزئیات بیشتری ارائه نکرده است.
بر اساس یکی از اسلایدهای توضیح دهنده در مورد این بخش، RX 9070 XT تا ۷۷۹ ترافلاپس قدرت شتاب هوش مصنوعی (AI Acceleration) را برای اجرای FSR 4 ارائه میدهد. این عدد احتمالاً به عملیات INT4 متراکم یا INT8 پراکنده اشاره دارد، اما هنوز مشخص نیست که الگوریتم دقیقاً از کدام دقت پردازشی استفاده میکند. با این وجود، واضح است که FSR 4 نسبت به نسلهای قبل از نظر توان محاسباتی یک جهش قابل توجه داشته است.
پشتیبانی از HYPR-RX و نسخهی جدید AFMF 2.1
AMD همچنین در اسلایدهای خود در مورد HYPR-RX صحبت کرده، که ترکیبی از قابلیتهای افزایش عملکرد در سطح درایور است و با یک کلیک فعال میشود. این فناوری میتواند در برخی سناریوها مفید باشد، اما برای مقایسهی عادلانهی عملکرد، معمولاً از آن صرفنظر میشود. با این حال، برای گیمرها، فعال کردن HYPR-RX که شامل FSR/RSR، Anti-Lag، Radeon Boost و AFMF 2 است، میتواند تأثیر مثبتی داشته باشد.
علاوه بر این، نسخهی جدید AFMF 2.1 نیز منتشر شده که کیفیت تولید فریم را بهبود داده، میزان روحزدگی (Ghosting) را کاهش داده و دقت در تشخیص و پردازش عناصر تصویری ظریف را افزایش داده است.
چرا AMD بر استفاده از GDDR6 اصرار دارد؟
یکی از جنبههایی که در معماری RDNA 4 نسبت به نسل قبل تغییر نکرده، نوع حافظهی مورد استفاده است. در حالی که انویدیا در کارتهای سری RTX 50 Blackwell به سمت استفاده از حافظهی GDDR7 رفته، AMD همچنان به GDDR6 پایبند مانده است. این حافظه که با سرعت 20 گیگابیت بر ثانیه کار میکند، در کنار رابط 256 بیتی در کارتهای RX 9070 XT و RX 9070، پهنای باندی برابر با 640 گیگابایت بر ثانیه ارائه میدهد. این مقدار، دقیقا برابر با ظرفیت RX 7900 GRE و RX 7800 XT است و همچنین با RTX 5070 Ti و RTX 4070 Ti Super از انویدیا مطابقت دارد.
در بخش قبلی گفتیم که حافظه کش نامحدود (Infinity Cache) با ظرفیت 64 مگابایت در این نسل نیز بهبود یافته و انتظار میرود تاثیر قابلتوجهی در پهنای باند مؤثر داشته باشد، اگرچه AMD هنوز آمار دقیقی درباره نرخ برخورد کش (Cache Hit Rate) ارائه نکرده است. با توجه به اینکه RX 7900 GRE و RX 7800 XT نیز از همین مقدار کش بهره میبردند و توانسته بودند پهنای باند مؤثر را حدود چهار برابر مقدار اسمی افزایش دهند، به نظر میرسد کارتهای مبتنی بر تراشه Navi 48 نیز عملکرد مشابهی خواهند داشت.
اما آیا AMD به GDDR7 نیاز دارد؟
شاید بهبودهای انجامشده در Infinity Cache باعث شده که نیاز به استفاده از GDDR7 در این مقطع زمانی کمتر حس شود. به عنوان مثال، انویدیا با استفاده از حافظه GDDR7 با سرعت 28 گیگابیت بر ثانیه، پهنای باند خام را 40 درصد افزایش داده است، اما پس از در نظر گرفتن تأثیر حافظه کشهای حجیم، تفاوت در پهنای باند مؤثر ممکن است آنقدرها هم زیاد نباشد.
از سوی دیگر، میزان پهنای باند مورد نیاز برای پردازندهای با 64 واحد محاسباتی (CU) محدود است. به عنوان نمونه، RTX 5070 Ti انویدیا دارای 70 واحد پردازش جریانی (SM) است که معادل تقریبی واحدهای CU در AMD محسوب میشود. این کارت همچنین دارای حافظه کش L2 با ظرفیت 48 مگابایت است. استفاده از یک حافظه کش L3 بزرگتر (64 مگابایت) همراه با تعداد واحد پردازشی کمتر میتواند نیاز به سرعتهای بالاتر حافظه را کاهش دهد.
AMD همچنان از ماژولهای 16 گیگابیتی (با چیپهای 2 گیگابایتی) GDDR6 استفاده میکند و تاکنون گزارشی مبنی بر تلاش شرکتهای تولیدکننده برای عرضه ماژولهای 24 گیگابیتی (با چیپهای 3 گیگابایتی) منتشر نشده است. این موضوع میتواند در آینده به نقطهای مهم برای برتری انویدیا تبدیل شود، چرا که در حال حاضر تنها RTX 5090 Laptop GPU از تراشههای GDDR7 با ظرفیت بالاتر بهره میبرد.
بازگشت به طراحی یکپارچه؛ خداحافظی با چیپلتها
یکی از تغییرات جالب در RDNA 4 این است که AMD (حداقل در این نسل) از طراحی مبتنی بر چیپلت فاصله گرفته است. ممکن است در آینده این رویکرد دوباره مورد استفاده قرار گیرد، اما در حال حاضر Navi 48 و احتمالا Navi 44 از طراحی یکپارچه (Monolithic) بهره میبرند. همراه با این تغییر، نسل جدید کارتهای گرافیک AMD از فرآیند ساخت N5 در RDNA 3 به N4P در RDNA 4 ارتقا یافته است.
فرآیند N4P نسبت به N4 افزایش عملکرد و بهبود بهرهوری انرژی را به همراه دارد و در عین حال نسخهای بهینهشده از N5 محسوب میشود. شواهد نشان میدهند که N4P ممکن است لایههای فلزی بیشتری را به ساختار تراشه اضافه کرده باشد، در حالی که N4 نسبت به N5 از EUV بیشتری بهره میبرد.
البته هنوز مشخص نیست که N4P در مقایسه با 4N و 4NP (فرآیندهای مخصوص انویدیا که در Hopper، Ada و Blackwell مورد استفاده قرار گرفتهاند) چه تفاوتهایی دارد. با این حال، به نظر میرسد AMD این بار از نظر فناوری ساخت، در سطحی برابر با انویدیا قرار دارد.
AMD قصد رقابت با کارتهای پرچمدار انویدیا را ندارد
عدم استفاده از حافظه GDDR7 و همچنین عدم ارائه طراحی بزرگتر، این موضوع را تایید میکند. تراشه Navi 48 شامل 53.9 میلیارد ترانزیستور در سطح 356.5 میلیمتر مربع است، در حالی که تراشه GB203 انویدیا که در RTX 5080 و RTX 5070 Ti به کار رفته، دارای 45.6 میلیارد ترانزیستور در سطح 378 میلیمتر مربع است. این موضوع میتواند نشاندهنده استفاده از فرآیند ساخت بهینهتر توسط AMD باشد، اما نمیتوان نتیجهگیری قطعی کرد.
تعداد ترانزیستورها برخلاف اندازهی دای، چندان مشخص و دقیق نیستند و روشهای متفاوتی برای شمارش آنها وجود دارد. شاید AMD به طراحی متراکمتری دست یافته باشد، شاید هم نه. در نهایت، همه چیز به عملکرد واقعی کارتها بستگی دارد.
یکی از نکات جالب این است که Navi 31، که پرچمدار نسل RDNA 3 بود، از طراحی چیپلت با یک دای محاسبات گرافیکی (GCD) به اندازه 300 میلیمتر مربع همراه با شش دای حافظه کش (MCD) به اندازه 37.5 میلیمتر مربع بهره میبرد. بررسیها نشان میدهد که تراکم تعداد ترانزیستورها در طراحی RDNA 4 نسبت به RDNA 3 تفاوت چندانی ندارد (152 میلیون ترانزیستور بر میلیمتر مربع در GCD Navi 31 در برابر 151.2 میلیون ترانزیستور بر میلیمتر مربع در Navi 48).
منتظر مدل رفرنس نباشید!
اگر هنوز برایتان روشن نشده، باید گفت که AMD هیچ مدل مرجعی از سری RX 9070 تولید نخواهد کرد. هرچند تصاویری که در اسلایدهای رسمی AMD نمایش داده شده، شبیه به مدلهای مرجع (MBA) به نظر میرسند، اما در واقع تنها رندرهای گرافیکی هستند و نه تصاویر واقعی از سختافزار نهایی. در فرایند طراحی و تست، قطعا نمونههای اولیهای وجود داشته، اما این موضوع چندان اهمیتی ندارد.
تمام کارتهای گرافیک سری RX 9070 توسط شرکای تجاری (AIB) ساخته خواهند شد. این موضوع دو پیامد دارد:
- تنوع گسترده در مشخصات نهایی، از جمله سرعت کلاک، توان مصرفی، تعداد فنها و حتی نورپردازی RGB.
- عدم کنترل AMD بر قیمتهای خردهفروشی.
به احتمال زیاد، AMD از شرکای خود میخواهد حداقل یک مدل با قیمت رسمی (MSRP) ارائه دهند، اما پس از آن، همهچیز در اختیار تولیدکنندگان خواهد بود. همانطور که در مورد RTX 5070 Ti نیز مشاهده شد، نبود مدل مرجع از سوی انویدیا باعث شد که مدلهای گرانقیمتتر با تغییرات جزئی و قیمتهای بالاتر به بازار عرضه شوند.
در نهایت، اگر عرضه به اندازه کافی پاسخگوی تقاضا نباشد، مدلهای گرانقیمتتر بازار را پر خواهند کرد. اما اگر عرضه به حد مطلوبی برسد، قیمتها کاهش پیدا خواهند کرد.
درایورها و نرمافزارها
آخرین موردی که AMD به آن پرداخت، درایورهای جدید Adrenalin 25.3.1 و برخی قابلیتهای نرمافزاری جدید بود. در حالی که رابط کاربری درایور برای کاربران کارتهای گرافیک AMD آشنا خواهد بود، برخی تغییرات در پسزمینه به همراه ویژگیهای جدید اضافه شدهاند. در این میان، هوش مصنوعی در هر دو بخش نقش مهمی ایفا میکند. پیشتر در مورد FSR 4 و Frame Generation صحبت کردیم، حالا نگاهی به دیگر کاربردهای AI در این درایورها بیندازیم.
نخست، AMD از هوش مصنوعی برای شناسایی خطاهای رندرینگ و مشکلات پایداری استفاده میکند. این شرکت ادعا دارد که درایورهای 25.3.1 پایدارترین و بدون خطاترین درایورهایی هستند که تاکنون منتشر کرده است. اینکه این ادعا تا چه حد درست باشد، باید منتظر بمانیم و ببینیم.
علاوه بر این، AMD ویژگیهایی مشابه با Chat RTX انویدیا را معرفی کرده است. این قابلیتها توسط نرمافزار AMD Install Manager مدیریت میشوند که همراه با درایورهای معمولی نصب میشود. این ابزار علاوه بر بهروزرسانی خودکار درایورهای چیپست، چندین قابلیت جدید نیز دارد:
- AMD Chat: یک چتبات که به سؤالات شما در مورد دمای GPU، عملکرد کارت گرافیک و سایر مشخصات سختافزاری پاسخ میدهد. البته حجم این قابلیت 25 گیگابایت است، بنابراین اگر فضای کافی ندارید یا علاقهای به چت با سیستم خود ندارید، شاید بخواهید از نصب آن صرفنظر کنید.
- AI Apps Manager: لیستی از نرمافزارها و ابزارهای نصبشده را که از هوش مصنوعی استفاده میکنند نمایش میدهد. همچنین، این بخش امکان نصب Amuse، ابزار تولید تصویر و ویدیوی مبتنی بر AI اختصاصی AMD، را نیز فراهم میکند.
- Image Inspector: قابلیتی که برای شناسایی و گزارش خطاهای رندرینگ و باگها طراحی شده است. این ویژگی که بهصورت Opt-in (اختیاری) است، از منابع آزاد GPU استفاده کرده و در صورت فعالسازی، بهطور خودکار مشکلات گرافیکی را شناسایی و برای AMD ارسال میکند. با این حال، ممکن است حتی با استفاده از منابع کم، تأثیری هرچند جزئی روی عملکرد سیستم داشته باشد.
وضعیت کلی بازار پردازندههای گرافیکی
RDNA 4 در واقع همان چیزی است که AMD باید با RDNA 3 انجام میداد، اما بهجای آن، مسیر چیپلتهای چندگانه را امتحان کرد که در نهایت این تکنیک هم کنار گذاشته شد. در نسل جدید، AMD بالاخره توجه ویژهای به رهگیری پرتو و شتابدهندههای هوش مصنوعی در محصولات مصرفی خود نشان داده است. البته، شاید در زمان عرضه RDNA 2 این کمبود قابل توجیه بود، چراکه فناوری RTX انویدیا تازه در حال جا افتادن بود، اما در زمان RDNA 3، AMD باید فراتر از این عمل میکرد.
یکی از نکات جالب این است که افزایش قابلیتهای سختافزاری باعث بزرگتر شدن ابعاد تراشه نشده است. تراشه Navi 48 دارای مساحت 357 میلیمتر مربع روی نود 5 نانومتری (N4P) است. این در حالی است که Navi 31 با 300 میلیمتر مربع از نود N5 استفاده میکرد و به چیپلتهای حافظه خارجی و ارتباطات Infinity Fabric متکی بود. حالا که AMD این ارتباطات را حذف کرده و هستهها را بهینهسازی کرده، مشخص است که این معماری سالها پیش هم ممکن بود. انویدیا سالها پیش این مسیر را رفت، اما AMD در RDNA 3 همچنان تأکید داشت که "رهگیری پرتو و AI چندان مهم نیستند"، و نتیجه آن را دیدیم. RDNA 4 بالاخره این اشتباه را اصلاح کرده، یا حداقل در تلاش است که اصلاح کند. حالا فقط باید ببینیم عملکرد واقعی این سختافزار چگونه خواهد بود.
رقبای RDNA 4، معماری Blackwell RTX از انویدیا و Arc Battlemage از اینتل خواهند بود. در ماههای اخیر، عرضه کارتهای گرافیک به شدت دچار کمبود شده است (بله، این یک بیان کنایهآمیز از یک بحران واقعی است). هر GPU جدیدی که عرضه میشود، در همان روزهای اول به اتمام میرسد و با قیمتی بسیار بالاتر از MSRP فروخته میشود. این روند از Arc B580 شروع شد و با Blackwell انویدیا به اوج خود رسید.
بحران کمبود سیلیکون در صنعت فناوری
شرایط در کوتاهمدت بهتر نخواهد شد. مشکل اصلی این است که تقاضا برای تولید تراشه بسیار بیشتر از ظرفیت تولیدی کارخانههاست. TSMC در حال حاضر تأمینکننده پردازندههای AMD، اپل، اینتل و انویدیا است، اما شرکتهای بزرگی مانند گوگل، آمازون و متا نیز در صف تولیدات آن قرار دارند.
حتی اگر یک شرکت تعداد مشخصی ویفر را برای تولید در ماه خریداری کند، اینکه چگونه از این ویفرها استفاده کند، همچنان چالشی بزرگ است. برای مثال، AMD میتواند با نود N4P، RDNA 4 تولید کند، اما در عین حال، میتواند چیپلتهای Zen 5 برای پردازندههای Ryzen و EPYC، CDNA 3 برای دیتاسنترها (MI300X)، یا حتی CDNA 4 برای سرورها را تولید کند که احتمالاً در سال جاری معرفی خواهد شد. این محدودیت برای انویدیا و اینتل هم وجود دارد، چراکه آنها نیز از TSMC برای پردازندههای Arrow Lake، Lunar Lake و Battlemage استفاده میکنند.
در سال گذشته، انویدیا با فروش 130 میلیارد دلاری رکورد زد، که 91.3 درصد از آن مربوط به بازار دیتاسنتر و تنها 8.7 درصد (11.35 میلیارد دلار) مربوط به گیمینگ بود. طبیعی است که این شرکت سرمایهگذاری بیشتری روی پردازندههای AI انجام دهد و بازار گیمینگ را در اولویت دوم قرار دهد.
آینده پردازندههای گرافیکی؛ امیدها و نگرانیها
خبر خوب این است که ظرفیت تولید سیلیکون در حال افزایش است. البته، بخش زیادی از این ظرفیت جدید صرف تولید پردازندههای AI خواهد شد، اما هرچه ظرفیت کلی افزایش یابد، احتمالاً تولید پردازندههای گرافیکی مصرفی هم بیشتر خواهد شد. شاید AMD و Intel از این فرصت استفاده کرده و حضور خود را در بازار GPU گیمینگ گسترش دهند، در حالی که انویدیا بیشتر بر روی AI متمرکز میشود. شاید هم انویدیا به یاد روزهای ابتدایی خود بیفتد و همچنان به تولید پردازندههای گرافیکی گیمینگ ادامه دهد.
در نهایت، آنچه واضح است، این است که تا زمانی که صنعت هوش مصنوعی در حال رشد باشد، پردازندههای گرافیکی گیمینگ برای اکثر شرکتهای بزرگ یک اولویت درجه دو خواهند بود. امیدواریم که این روند مانند ماینینگ ارز دیجیتال، یک موج گذرا باشد، اما بعید است که چنین اتفاقی بیفتد.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت