اینتل سرانجام از سومین نسل معماری گرافیکی خود با نام Xe3 رونمایی کرد؛ معماری که قرار است در پردازندههای نسل جدید Panther Lake و سری محصولات Core Ultra 300 مورد استفاده قرار گیرد. به گفته اینتل، Xe3 نسبت به معماری نسل قبل خود یعنی Xe2 تا بیش از 50 درصد عملکرد بهتری ارائه میدهد. این معماری در آینده با نسخهای ارتقا یافته به نام Xe3P نیز همراه خواهد شد که برای پردازندههای قدرتمندتر و کارتهای گرافیکی مجزا طراحی شده است.
اینتل در سال گذشته با معرفی معماری Xe2 موفق شد جهشی بزرگ نسبت به نسل اول گرافیکهای خود با نام Xe1 یا Alchemist ایجاد کند. این معماری در دو سری از محصولات مهم این شرکت به کار گرفته شد. پردازندههای Lunar Lake در سری محصولات Core Ultra 200 و کارتهای گرافیک مجزای سری Arc B یا Battlemage. معماری Xe2 عملکرد مناسبی در بازیها، رندرینگ و حتی کاربردهای هوش مصنوعی ارائه کرد. حالا اینتل با Xe3 گامی فراتر برداشته تا در کنار ارتقای معماری، از نرمافزار و درایورهای بروز برای بهینهسازی عملکرد گرافیکی محصولات خود استفاده کند.
معرفی معماری Xe3 اینتل
براساس گزارش Wccftech، گرافیکهای مجتمع Xe3 که در پردازندههای Panther Lake به کار گرفته خواهند شد، تحت برند Arc B-Series یا سری Arc B شناخته میشوند. معماری Xe3 که نسخهای پیشرفتهتر از Xe2 محسوب میشود در کنار ارتقای قابل توجه قدرت پردازشی، دارای ساختاری بهینهتر نیز هست تا توان مصرفی پایینتری داشته باشد. قرار است در آینده نسخه ارتقا یافتهای این معماری با نام Xe3P نیز عرضه شود که در نسل بعدی کارتهای گرافیکی مجزا احتمالاً با عنوان Arc C-Series یا در پردازندههای Nova Lake مورد استفاده قرار خواهد گرفت.
افزایش واحدهای پردازشی و تغییر در ساختار
یکی از تغییرات مهم رخ داده در معماری Xe3، ارتقای ساختار Render Slice بوده است. در معماری Xe2 هر Render Slice شامل 4 هستهی Xe و 4 واحد رهگیری پرتو (Ray Tracing) بود. اما در معماری جدید Xe3، این مقدار به 6 هسته Xe و 6 واحد RT افزایش یافته است. به این ترتیب در هر واحد رندر شاهد افزایش ظرفیت 50 درصدی هستیم.
این تغییر به اینتل اجازه میدهد تا پیکربندیهای مختلفی از گرافیک را در پردازندههای Panther Lake به کار بگیرد. گرافیکهای 8C و 16C دارای چهار هسته Xe خواهند بود و برای گرافیک پرچمدار 16C نیز 12 هسته Xe در نظر گرفته شده است. برای مقایسه بهتر باید گفت در پردازندههای Arrow Lake و Lunar Lake حداکثر هشت هسته Xe وجود داشت.
معرفی دو پیکربندی اصلی 4 Xe و 12 Xe
اینتل در پردازندههای Panther Lake برای گرافیکهای مبتنی بر معماری Xe3 دو پیکربندی اصلی در نظر گرفته است. پیکربندی نخست 4 Xe نام دارد و در دو نسخه 8C و 16C عرضه خواهد شد. نسخه 8C با استفاده از فناوری سه نانومتری اینتل با عنوان Intel 3 به مرحله تولید میرسد اما برای تولید نسخه 16C از فناوری سه نانومتری و N3E شرکت TSMC بهره گرفته خواهد شد. چهار هسته Xe، یک Render Slice، 32 واحد XMX برای شتابدهی هوش مصنوعی، چهار مگابایت کش L2، یک Geo Pipeline، چهار نمونهبردار یا Samplers، چهار واحد رهگیری پرتو و دو واحد Pixel Backends، مشخصات این نسخه هستند.
پیکربندی دیگر نیز 12 Xe نام دارد و تنها با استفاده از فناوری N3E شرکت TSMC تولید خواهد شد. 12 هسته Xe، دو Render Slice، 96 واحد XMX برای شتابدهی هوش مصنوعی، 16 مگابایت کش L2، دو Geo Pipeline، 12 Samplers، 12 واحد رهگیری پرتو و چهار واحد Pixel Backends، مشخصات این نسخه را تشکیل میدهند.
به گفته اینتل افزایش ظرفیت کش L2 در مدل 12 Xe باعث کاهش چشمگیر ترافیک روی SoC شده است؛ به طوری که در بهترین حالت در هنگام اجرای بازیها شاهد کاهش 36 درصدی ترافیک در بازیها بودهایم. این میزان به طور میانگین 25 درصد کاهش داشته است.
اینتل اعلام کرده است هر هسته گرافیکی در معماری Xe3 شامل هشت Vector Engine با پهنای 512 بیت، هشت XMX Engine با پهنای 2048 بیت است و شامل افزایش 33 درصدی حافظه کش استراکی L1/SLM میشود. هستههای Xe Vector نیز در این معماری دارای تا 25 درصد رشته بیشتر، قابلیت اختصاص Variable Register و پشتیبانی از FP8 Dequantization هستند.
رهگیری پرتوی بهبود یافته
واحدهای XMX در معماری Xe3 مسئول پردازش فرآیندهای مبتنی بر هوش مصنوعی هستند. در پیکربندی 12 Xe شاهد حضور 96 واحد XMX هستیم که توان محاسباتی 120 TOPS فراهم میکند. در پیکربندی 4 Xe نیز این توان به 40 TOPS میرسد. برای مقایسه بهتر باید گفت که گرافیک یکپارچه 8 Xe iGPU با استفاده از معماری Xe2 توان محاسباتی 67 TOPS را در اختیار داشت. به این ترتیب باید گفت که معماری Xe3 در این سطح مشابه 25 درصد بهبود عملکرد را در این بخش از خود نشان میدهد.
آنطور که اینتل اعلام کرده است در معماری Xe به ازای هر هسته پردازشی با عملکردهای زیر روبرو خواهیم بود:
- XMX TF32: 1024 ops/clk
- XMX FP16: 2048 ops/clk
- XMX BF16: 2048 ops/clk
- XMX INT8: 4096 ops/clk
- XMX INT4: 8192 ops/clk
- XMX INT2: 8192 ops/clk
در معماری Xe3 از واحدهای رهگیری پرتو بهبود یافته استفاده شده که دارای مدیریت پویا یا Dynamic Ray Management برای رهگیری ناهمزمان پرتوهاست. این سیستم با کنترل بهتر زمانبندی ارسال پرتوها، از ایجاد ترافیک در خطوط پردازشی جلوگیری کرده و بازدهی را بالا میبرد. از میان دیگر قابلیتهای جدید این معماری میتوان به ارتقای دو برابری قدرت Anisotropic Filtering و همچنین Stencil Test اشاره کرد.
در بخش رسانه یا Media Engine این معماری از کدکهای جدید و متنوعی همچون AV1 Encode/Decode، VVC Decode (H.266)، HEVC (H.265)، AVC 10-bit و Sony XAVC-H / HS / S پشتیبانی دارد.
ارتقای 50 درصدی عملکرد گرافیکی در بنچمارکهای اولیه
بر اساس بنچمارکهای اولیه، معماری Xe3 در مقایسه با Xe2 بهبودهای قابل توجه و چشمگیری دارد. از میان مهمترین آنها میتوان به بهبود 50 درصدی عملکرد کلی نسبت به معماری Xe2 در پردازندههای Lunar Lake، افزایش بیش از 40 درصدی بازدهی انرژی نسبت به پردازندههای Arrow Lake-H، ارتقای بین 2 تا 2.7 برابری سرعت در Anisotropic Filtering و رندرینگ مشها و ارتقای 7 برابری در Depth Testing، اشاره کرد.
معماری جدید Xe3 گامی بزرگ برای اینتل در مسیر رقابت با گرافیکهای مجتمع AMD و حتی برخی GPUهای مجزا محسوب میشود. اینتل با افزایش واحدهای محاسباتی، بهبود عملکرد هوش مصنوعی، ارتقای رهگیری پرتو و بهینهسازی نرمافزاری، تلاش کرده تا ضعفهای معماری نسل قبل خود را جبران کند. این معماری به صورت پیشفرض در پردازندههای Panther Lake در اختیار کاربران قرار میگیرد.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت