در این بررسی قصد داریم یکی از قدرتمندترین کارتهای گرافیک Geforce GTX 1070 8GB را معرفی و از زوایای مختلف به بررسی عملکرد آن بپردازیم. GALAX Geforce GTX 1070 HOF 8GB با برخورداری از جدیدترین نسخه کولر فوقالعاده قدرتمند و کم صدای TriMax، مدرنترین و بادوامترین قطعات صنعتی موجود به کار رفته در مدار رگولاتور ولتاژ، طراحی کاملاً منحصر به فرد PCB و البته نورپردازی با RGB LED بدون شک یکی از بهترینها در نوع خوب محسوب میشود.
مقدمه
از آنجا که برای اولین بار است که محصولی از کمپانی Galaxytech جهت نقد و بررسی به لابراتوار تخصصی شهر سخت افزار ارسال میشود لازم میدانیم بهصورت مختصر نیز که شده به معرفی این کمپانی بپردازیم.
کمپانی Galaxytech که محصولات این آن با برندهای KFA2 در بازار اروپا و GALAX در سایر نقاط دنیا به فروش میرسند در سال 1994 تأسیس و در ابتدا بهصورت OEM و به گونهای در پشت صحنه تولید کننده اصلی کارتهای گرافیک بسیاری از کمپانیهای خوشنام آن زمان محسوب میشد؛ اما از سال 2000 این کمپانی رویه خود را عوض کرد و کارتهای گرافیک با برند خود یعنی GALAXY را تولید و روانه بازار کرد. کیفیت ساخت بسیار بالا، کولرهای انحصاری بسیار قدرتمند و البته خاص و زیبا، به همراه طراحی PCB منحصر به فرد و در کلاس فوق حرفهای کارتهای گرافیک سری HOF (Hall Of Fame) این کمپانی به همراه نتایج بسیار درخشان این مدلها در نقد و بررسیهای وب سایتهای معتبر و ثبت رکوردهای جهانی مختلف اورکلاک توسط این مدلها باعث شد تا کارتهای گرافیک ساخت این کمپانی بهمرور زمان اعتبار ویژهای بین گیمرها و اورکلاکرهای حرفهای کسب کنند.
در حال حاضر سبد محصولات این کمپانی تنها به کارتهای گرافیک حرفهای سری HOF محدود نمیشود و مدلهای تحت عنوان EXOC-SNPR، EX، OC و حتی با طراحی مرجع نیز از تولیدات این کمپانی به شمار میروند. علاوه بر این به تازگی درایوهای SSD فوقالعاده پرسرعت سری HOF و گیمینگ سری GAMER L به همراه ماژولهای حافظه رم DDR4 سری HOF با فرکانسهای فوقالعاده بالا 3200/3600/4000MHz نیز به سبد محصولات این کمپانی اضافه شده است.
در ادامه اجازه دهید برای یادآوری و البته آشنایی کاربران جدید با جو حال حاضر، گذری به تاریخچه عرضه و قیمت گذاری کارتهای گرافیک جدید مبتنی بر پاسکال بزنیم:
همانطور که اطلاع دارید کارتهای گرافیک مبتنی بر این معماری با مدل تجاری GTX 10xx معرفی شدهاند و تا به امروز و بهصورت رسمی مدل Geforce GTX TITAN X Pascal 12GB بهعنوان پرچم دار، مدلهای Geforce GTX 1080 8GB و Geforce GTX 1070 8GB بهعنوان کارتهای رده بالای گیمینگ این معماری و Geforce GTX 1060 3GB/6GB نیز بهعنوان مدل میان رده این خانواده روانه بازار شدهاند. البته زمزمههایی نیز مربوط به معرفی مدل بسیار قدرتمند Geforce GTX 1080 Ti 12GB که مدل محدود شده Geforce GTX TITAN X Pascal محسوب میشود و کارت گرافیک فوقالعاده خوش قیمت و اقتصادی Geforce GTX 1050 Ti در ماههای پیش رو شنیده میشود. این چند مدل معرفی شده بهصورت کلی دارای 3 تراشه گرافیکی (GPU) مختلف هستند. مدلهای پرچم دار به تراشه بسیار قدرتمند GP102 با بیش از 3584 CUDA Core مجهز شدهاند. مدلهای رده بالا تراشه بسیار کارآمد GP104 مجهز به حداکثر 2560 CUDA Core را با خود به همراه دارند و تنها مدل میان رده این معماری نیز با تراشه GP106 و 1280 CUDA Core عرضه شده است.
مدلهای رده بالای مبتنی بر این معماری همانند روال پیشین کمپانی انویدیا شامل یک مدل با امکانات و قابلیتهای کامل ولی باقیمت نسبتاً بالا (Geforce GTX 1080) و یک مدل تا حدودی محدود شده ولی باقیمت بسیار مناسب و وسوسه کننده (Geforce GTX 1070) میشوند.
در واقع Geforce GTX 1070 8GB حدوداً $400 دلاری تنها با 640 CUDA Core کمتر، برخورداری از حافظههای GDDR5 8000MHz به جای حافظههای GDDR5X 10000MHz به کار رفته در Geforce GTX 1080 و حدوداً 100MHz فرکانس پایه کمتر GPU بیش از %37 از Geforce GTX 1080 8GB باقیمت حدودی $640 ارزانتر است. این در حالی است که در تستهای عملی اختلاف کارایی بین این دو مدل بهصورت میانگین حداکثر %20 است. این بدین معناست که همواره برای داشتن بهترینها باید هزینه به مراتب بیشتری بپردازید؛ اما در صورتی که همواره به دنبال خرید قطعات مقرون بهصرفه و با نسبت کارایی به قیمت بالا هستید Geforce GTX 1070 8GB انتخاب زیرکانهتری محسوب میشود.
اما در این بررسی قصد داریم یکی از قدرتمندترین کارتهای گرافیک Geforce GTX 1070 8GB را معرفی و از زوایای مختلف به بررسی عملکرد آن بپردازیم. GALAX Geforce GTX 1070 HOF 8GB با برخورداری از جدیدترین نسخه کولر فوقالعاده قدرتمند و کم صدای TriMax، مدرنترین و بادوامترین قطعات صنعتی موجود به کار رفته در مدار رگولاتور ولتاژ، طراحی کاملاً منحصر به فرد PCB و البته نورپردازی با RGB LED و طراحی ظاهری بسیار دلفریب و وسوسه کننده در کنار %8 اورکلاک کارخانهای فرکانس هسته GPU بدون شک یکی از بهترینها در نوع خوب محسوب میشود.
همچنین یکی دیگر از نقاط قوت و در واقع وجه تمایز کارتهای گرافیکی سری HOF کمپانی GALAX با مدلهای مشابه تجهیز آنها به امکانات مورد نیاز اورکلاکرهای حرفهای نظیر Bios های با امکانات خاص و تعبیه سوئیچهای مخصوص برای غیرفعال کردن پروتکشن های ایمنی است که البته در ادامه بهصورت مفصل با معرفی امکانات و قابلیتهای خاص این کارت گرافیک با شما همراه خواهیم بود.
برای همین منظور برای یادآوری هم که شده ابتدا به معرفی معماری Nvidia Pascal و تشریح مهمترین ویژگیها و قابلیتهای آن میپردازیم، سپس شما را با تراشه گرافیکی (GPU) به کار رفته در این کارت گرافیک (GP104-200) و مشخصات فنی این محصول آشنا میکنیم. در ادامه نیز پس از معرفی و بررسی سخت افزاری این کارت گرافیک و تشریح بخشهای مختلف آن با تستهای کارایی گیمینگ و GPGPU، تستهای حرارتی، نویز صوتی و مدیریت مصرف انرژی و در نهایت تستهای اورکلاکینگ عیار کیفیت و کارایی این مدل را از ابعاد مختلف محک میزنیم. با ما همراه باشید.
نکته مهم: تمامی مراحل نگارش این بررسی اعم از تست ها، عکس ها، ویدئوها، نمودارها و تحلیل ها همگی در لابراتوار تخصصی شهرسخت افزار انجام شده است. این بررسی هیچ منبع داخلی و خارجی ندارد.
معرفی معماری nVIDIA Pascal (بخش اول)
-
مقدمه و تشریح معماری
اگر بخواهیم با یک دید کلی در مورد معماری جدید Pascal انویدیا اظهار نظر کنیم میتوان اینگونه بیان کرد که معماری پاسکال (معماری پیاده سازی شده در تراشه GP104) به نوعی ترکیبی از تکنولوژیهای قبلی و جدید انویدیا محسوب میشود. معماری Maxwell و محصولات مبتنی بر آن بدون شک یکی از موفقترین پروژههای این کمپانی چه در سطح مصرف کنندگان عادی و چه در سطح حرفهای و محصولات Workstation محسوب میشدند و همین امر باعث شده تا انویدیا در محصولات مصرف کنندههای عادی (برای مثال Gamer ها و کاربران عادی) مبتنی بر معماری Pascal را نیز با کمترین تغییرات، نسبت به معماری Maxwell روانه بازار کند. در معماری پاسکال تمامی زیرساختهای پایه نظیر واحدهای محاسبه و منطق (ALUs)، واحدهای ساخت بافتها (Texture units)، واحدهای تصویرسازی (ROPs) و حافظههای Cache همگی تقریباً شبیه همانهایی هستند که قبلاً در GM2xx پیاده سازی شده بودند.
در واقع انویدیا در GPU های سطح به اصطلاح Consumer یا مصرف کنندگان عادی با معماری Pascal سعی کرده تا با افزایش سرعت Clock هسته و تعداد Shader Processor ها قدرت پردازش اطلاعات را در GP104 به مرز 8.9TFLOPs برساند و در نهایت به استفاده از حافظههای پرسرعت و جدید GDDR5X و البته بهروزرسانی رابط حافظه این پردازنده گرافیکی بسیار قدرتمند را بهخوبی تغذیه کند.
(Nvidia GP104 (Pascal Architecture
در تصویر بالا بلاک دیاگرام تراشه گرافیکی (GPU) به کار رفته در کارت گرافیکی GTX 1080 را ملاحظه میکنید. این تراشه (GP104) پس از GP102 (تراشه گرافیکی به کار رفته در NVIDIA Titan X Pascal) قدرتمندترین پردازنده گرافیکی (در سطح مصرف کنندگان عادی) مبتنی بر معماری Pascal محسوب میشود. در این تراشه 2560 CUDA Core در قالب 20 واحد SM در فرکانس بیش از 1733MHz فعالیت میکنند. GP104 به صورت کلی و همانند GM204 (تراشه گرافیکی به کار رفته در GTX 980) از 4 واحد بسیار بزرگ GPC) Graphics Processing Cluster) تشکیل شده که هر یک از این واحدها 5 واحد SM یا همان Streaming Multiprocessors را درون خود جای دادهاند. این در حالی است که هر یک از واحدهای GPC تراشه GM204 دارای 4 واحد SM بودند. در تصویر زیر میتوانید بلاک دیاگرام تراشه GM204 را نیز ملاحظه کنید:
(NVIDIA GM204 (MaxwellArchitecture
در واقع به صورت کلی تفاوت ساختاری میان تراشه گرافیکی GP104 (تراشه به کار رفته در GTX 1080) و GM204 (تراشه به کار رفته در GTX 980) در همین 1 عدد واحد SM بیشتر در GPC ها خلاصه میشود؛ اما اجازه دهید برای یادآوری هم که شده کمی بیشتر وارد جزئیات ساختاری واحدهای GPC و SM شویم.
NVIDIA GP104 - GPC
خب همانطور که اشاره شد هر واحد GPC در معماری پاسکال 5 واحد SM را درون خود جای داده است که هر یک از واحدهای SM دارای 128 عدد CUDA core (واحدهای کوچک مربع شکل سبز رنگ) و 8 عدد Texture Unit (واحدهای مستطیل شکل به رنگ آبی تیره) هستند. حال برای محاسبه CUDA Core های کل این تراشه کافی است 128 را در تعداد SM های هر واحد GPC ا(عدد 5) ضرب کنید و نتیجه به دست آمده را مجدداً در تعداد واحدهای GPC این تراشه (عدد 4) ضرب کنید. نتیجه به دست آمده عدد 2560 عدد CUDA Core خواهد بود. حال اگر همین روال را برای واحدهای Texture Unit نیز تکرار کنید به عدد 160 خواهید رسید. پس 1 واحد SM بیشتر در هر GPC باعث افزایش 512 عددی CUDA core ها و همینطور افزایش 32 عدد واحدهای Texture Unit تراشه GP104 نسبت به GM204 شده است. از سوی دیگر بر خلاف GM204 که دارای 4 کنترلر حافظه 64bits (جمعاً 256bits) و 16 ROP Units به ازای هر کنترلر حافظه (جمعاً 64 عدد) بود، در GP104 هشت کنترلر حافظه 32bits تعبیه شده (جمعاً 256bits) که هر یک از این کنترلرها توسط 8 عدد ROP Units تغذیه میشوند. کاملاً مشخص است که رابط حافظه و تعداد واحدهای ROP تغییر نکرده است ولی انویدیا با در نظر گرفتن حافظههای بسیار پرسرعت GDDR5X با فرکانس مؤثر 10000MHz برای این تراشه قدرتمند، پهنای باند تئوری بیش از 320GB/sec را برای آن فراهم کرده است.
NVIDIA GP104 –SM Unit
در تصویر بالا نیز جزئیات هر واحد SM را ملاحظه میکنید. واحدهای SM معماری پاسکال دقیقاً مشابه معماری مکسول طراحی شدهاند.
اما بهعنوان جمع بندی نهایی همانطور که در جدول بالا ملاحظه میکنید روی هم رفته 4 عدد واحد SM بیشتر و به ازای آن 512 عدد CUDA Core و 32 عدد Texture Unit بیشتر به همراه بیش از 517MHz سرعت کلاک بیشتر GPU و 3000MHz سرعت کلاک بیشتر حافظه که در عمل باعث افزایش 43% پهنای باند حافظه و توان عملیاتی واحدهای ROP میشود، روی کاغذ باعث افزایش 78% کارایی خام GTX 1080 در برابر GTX 980 میشوند. البته این در حالی است که با وجود افزایش 38% تعداد ترانزیستورها و البته به لطف تکنولوژی ساخت TSMC's 16 nm FinFET اندازه Die در تراشه GP104 حدوداً بیش از 21% کوچکتر شده و توان مصرفی این مجموعه نیز تنها 9% افزایش یافت است.
معماری پاسکال: طراحی شده برای سرعت
همانطور که اشاره شد یکی از مهمترین عواملی که باعث افزایش کارایی در معماری پاسکال شده است افزایش بیش از 45% سرعت کلاک GPU نسبت به معماری مکسول است. این میزان افزایش سرعت کلاک در عمل باعث بالا رفتن توان مصرفی تراشه خواهد شد ولی به لطف تکنولوژی 16nm FinFET به کار رفته در ساخت میلیونها ترانزیستور به کار رفته در این تراشه و البته از آن مهمتر بهینه سازیهای فراوان پیاده سازی شده در تایمینگ بخشهای مختلف این تراشه مدرن، تراشههای گرافیکی مبتنی بر معماری Pascal یکی از پربازدهترین GPU های حال حاضر محسوب میشوند.
GPU Boost 3.0
چند سالی میشود که تراشههای گرافیکی ساخت کمپانی انویدیا این قابلیت را دارند که علاوه بر فرکانس پایه هسته GPU، با توجه به دمای هسته و البته میزان Load آن، در فرکانسهای بالاتر از این مقدار نیز فعالیت کنند. در واقع این مکانیسم که تحت عنوان GPU Boost معرفی شده است یک فرآیند خودکار اورکلاک محسوب میشود و تأثیر بسزایی نیز در افزایش کارایی تراشههای گرافیکی دارد. انویدیا در معماری Pascal از نسخه سوم این مکانیسم رونمایی کرده است. در ادامه قابلیتهای جدید این نسخه را بررسی میکنیم.
یکی از اساسیترین تغییرات در GPU Boost 3.0 تحت عنوان per voltage point frequency offsets معرفی شده است. در این تکنیک بر خلاف نسل قبل که با فعال شدن حالت GPU Boost، ولتاژ هسته GPU نیز یک باره و یا حداکثر در چند بازه محدود افزایش مییافت در نسخه جدید برای هر مقدار افزایش فرکانس نسبت به فرکانس پیش فرض، ولتاژ مخصوص تعیین شده است. این امر باعث کاهش تلفات انرژی و کنترل بیش از پیش حرارت متصاعد شده از GPU میشود. در نتیجه این امکان فراهم میشود که فرکانس Boost نسبت به مدلهای مشابه نسل قبل به صورت محسوسی افزایش یابد؛ اما این امر شاید تا حدودی اورکلاک کارتهای گرافیک مبتنی بر این معماری را پیچیدهتر کند. برای مثال در این معماری برای اعمال ولتاژ بیشتر به GPU دیگر گزینهای برای تغییر مقادیر مختلف ولتاژ با واحد ولت مشاهده نمیشود و این امکان فراهم شده است که میزان انحراف ولتاژ از محدوده ولتاژ پیش فرض را تنها با تعیین درصد انحراف تعیین کرد. همچنین در این معماری گزینهای برای غیرفعال کردن محدودیتهای مرتبط با میزان Load بر روی GPU نیز در نظر گرفته شده است. پس در واقع یکی از مهمترین پارامترهایی که در این معماری دست یابی به فرکانسهای بالاتر را تسهیل میکند بدون شک دمای GPU خواهد بود.
GDDR5X Memory
پشتیبانی تراشههای گرافیکی مبتنی بر معماری پاسکال از حافظههای GDDR5X با فرکانس بیش از 10GHz بدین معناست که این تراشهها و کنترلر حافظه تعبیه شده در آنها قابلیت تشخیص بیتهای 0 و 1 را در فاصله زمانی کمتر از 100 picoseconds (ps) را دارا میباشند. این بدان معنا است که برای حفظ پارامترهای Signaling در این فرکانس بسیار بالا، طراحی کنترلر حافظه، مدارهای مرتبط با بخش ورودی و خروجی و از آن مهمتر طراحی PCB برای داشتن ارتباطی پایدار و بدون افت کارایی باید دچار تغییرات فراوانی شده باشند.
در واقع در طراحی کانال ارتباطی میان Die تراشه گرافیکی و چیپ ها حافظه باید به کوچکترین جزئیات نیز توجه شود. در اینگونه ارتباطات، سرعت عملیاتی و واقعی رابط حافظه تنها توسط ضعیفترین سیگنال گذرگاه تعیین میشود. در طراحی جدید هر سیگنال در امتداد مسیر بسته خود از GPU تا چیپ های حافظه به صورت دقیق بررسی و مورد مطالعه قرار گرفته تا هر گونه افت دامنه سیگنال، تداخل و ناپیوستگیهای موجود شناسایی شده و تمهیدات لازم برای به حداقل رساندن آنها به کار گرفته شود.
به گفته انویدیا تمامی تمهیداتی که در کانالهای ارتباطی و مدارهای ورودی و خروجی این معماری اجرا شده تنها برای پایداری ارتباط با فرکانس تا 10GHz عملیاتی نشدهاند. بلکه این طراحی بهگونهای است که حتی محصولات آینده و با پهنای باند بهمراتب بالاتر از این را نیز در بر میگیرد. در واقع همین حالا نیز برخی از تولید کنندگان چیپ های حافظه از برنامه برای تولید حافظههای GDDR5X با سرعت بیش از 16Gbps خبر میدهند. حافظههایی که در مقایسه با پرسرعتترین چیپ های GDDR5 حال حاضر بیش از 2 برابر سریعتر خواهند بود!
در تصویر بالا سیگنال ارتباطی حافظههای GDDR5X را در فرکانس 10GHz و سایر بهینه سازیهای پیاده سازی شده در مدارهای ورودی و خروجی و کانالهای ارتباطی را ملاحظه میکنید.
Enhanced Memory Compression
همانند معماری Maxwell تراشهای جدید مبتنی بر معماری Pascal نیز از تکنیک فشرده سازی بدون افت کیفیت (lossless memory compression) اطلاعات حافظه، جهت کاهش وابستگی به پهنای باند بالای ارتباط، پشتیبانی میکنند. کاهش نیاز به پهنای بالا فراهم شده توسط فشرده سازی اطلاعات حافظه به صورت کلی این مزیتها را در پی دارد:
- کاهش حجم اطلاعات نوشته شده در حافظه
- کاهش حجم اطلاعات منتقل شده از حافظه به L2 Cache
- کاهش حجم اطلاعات رد و بدل شده بین واحدهای مختلف GPU مانند Texture Unit و حافظه frame buffer
Pipeline های فشرده سازی GPU در این معماری از چندین الگوریتم مختلف فشرده سازی پشتیبانی میکنند و البته در شرایط مختلف به صورت هوشمند و در کمترین زمان ممکن بهترین الگوریتم را برای فشرده سازی اطلاعات انتخاب میکنند. یکی از این مهمترین و مدرنترین این تکنیکهای فشرده سازی الگوریتم Delta Color Compression است.
در این الگوریتم GPU تفاوتهای میان پیکسلها را در یک بلوک محاسبه میکند و این بلوک را بهعنوان مجموعهای از پیکسلهای مرجع بهعلاوه ارزش دلتا نسبت به مقدار مرجع ذخیره میکند. اگر دلتاها کوچک باشند پس تعداد بیتهای کمتری به ازای هر پیکسل برای ذخیره شدن در حافظه نیاز خواهد بود. اگر نتیجه (مقدار حافظه اشغال شده) جمع بندی شده دادههای مرجع بهعلاوه ارزش عدد دلتا، نصف حالت فشرده سازی نشده باشد، در این حالت تکنیک فشرده سازی اطلاعات با استفاده از الگوریتم Delta Color Compression موفق بوده است و در نهایت اطلاعات با نصف حجم اصلی خود ذخیره شدهاند (2:1 compression)
در تراشه گرافیکی GP104 قابلیتها و توان عملیاتی الگوریتم فشرده سازی Delta Color Compression به میزان قابل توجهی بهینه سازی شده است:
- بازدهی و توان عملیاتی فشرده سازی حالت 2:1 در مقایسه با نسل قبل به میزان قابل توجهی افزایش داشته است
- اضافه شدن حالت فشرده سازی 4:1 برای پوشش مواردی که به ازای هر پیکسل بهعلاوه دلتا مورد نظر بسیار کوچک هستند و این قابلیت را دارند تا در ¼ فضای حالت فشرده سازی نشده خود ذخیره شوند.
- اضافه شدن حالت فشرده سازی 8:1 که به زبان ساده به نوعی ترکیب حالت 4:1 و 2:1 محسوب میشود
فشرده سازی رنگ در معماری Pascal، فشرده سازی رنگ در معماری Maxwell، تصویر اصلی بدون فشرده سازی
در تصویر بالا صحنهای از بازی معروف Project CARS را ملاحظه میکنید که به روشنی عملکرد تکنیک فشرده سازی رنگ را در معماری Pascal در مقایسه با معماری Maxwell نشان میدهد.
در این تصویر نقاطی که فشرده سازی رنگ در آن با موفقیت عملیاتی شده به رنگ ارغوانی ملاحظه میکنید. کاملاً مشخص است که معماری مکسول تقریباً قسمت اعظمی از رنگهای تصویر را فشرده سازی کرده ولی از پس فشرده سازی پوشش گیاهی و بخشهایی از اتومبیل بر نیامده است؛ اما در معماری پاسکال تنها بخشی از سمت چپ تصویر فشرده سازی نشده است.
روی هم رفته و در تستهای عملی صورت گرفته عملکرد فشرده سازی رنگ در معماری پاسکال باعث افزایش 20 درصدی بازدهی پهنای باند حافظه نسبت به معماری Maxwell میشود. حال اگر این میزان را با افزایش بیش از 40 درصدی پهنای باند حافظه به لطف چیپ های پرسرعت GDDR5X 10GHz جمع کنیم به این نتیجه خواهید رسیم که پهنای باند عملیاتی در معماری Pascal بیش از 1.7 برابر نسبت به معماری Maxwell بیشتر شده است.
محاسبات ناهمزمان (Asynchronous Compute)
بار پردازش بازیهای رایانهای مدرن به صورت فزایندهای در حال پیچیده شدن است. یکی از مهمترین عوامل این امر پردازش چند کار مستقل و البته ناهمزمان است که به صورت تنگاتنگ با یکدیگر تعامل دارند تا در نهایت به کمک هم تصویر نهایی را رندر کنند.
چند مثال درباره بار پردازش غیر همزمان:
- پردازش فیزیک و صدا مبتنی بر GPU
- تصاویر رندر شده همراه با Postprocessing
- پردازش ناهمزمان پیچ و تاب و زمان: نوعی تکنیک استفاده شده در واقعیت مجازی که تصویر نهایی را با توجه به وضعیت سر دقیقاً قبل از نمایش نهایی تصویر بازسازی میکند
این نوع پردازشهای غیر همزمان دو سناریو جدید برای طراحان GPU به وجود میآورد که باید در نظر گرفته شوند.
سناریو اول شامل بار پردازشهایی است که با یکدیگر تداخل دارند. انواع خاصی از بارهای پردازش که به صورت کامل تمام منابع GPU را اشغال نمیکنند. در این مواقع GPU باید به صورت هوشمند منابع خود را بین هر دو بار پردازش به اشتراک بگذارد و این کار بهگونهای مدیریت کند تا بازدهی پردازش اطلاعات نیز قابل قبول باشد. پردازش گرافیکی تصویر در کنار پردازش فیزیک دبه صورت همزمان یک مثال خوب برای این سناریو محسوب میشود.
برای بارهای پردازش که با یکدیگر تداخل دارند معماری پاسکال پشتیبانی از تکنیک dynamic load balancing را در چنته دارد. در تراشههای گرافیکی مبتنی بر معماری Maxwell این نوع از پردازشها توسط پارتیشن بندی استاتیک (static partitioning) زیرمجموعههایی از GPU که پردازش گرافیکی و پردازش همه منظوره را انجام میدهند صورت میگیرند. این تکنیک به شرطی کارآمد است که تعادل کار بین دو بار پردازش، تقریباً منطبق با نسبت پارتیشن بندی مورد نظر باشد. با این حال اگر بار پردازش همه منظوره بیش از پردازش گرافیکی طول بکشد و هر دو برای پایان نهایی این پردازش نیاز به تکمیل شدن بار پردازش خود داشته باشند. بخشی از GPU که برای پردازش گرافیکی پارتیشن بندی شده بود عملاً بلااستفاده میماند.
در تکنولوژی سخت افزاری dynamic load balancing پیاده سازی شده در معماری Pascal این امکان وجود دارد که هر دو بار پردازش نام برده در صورت وجود منابع خالی در GPU به صورت پویا از منابع نام برده برای افزایش کارایی و بازدهی عملیاتی استفاده کنند.
Simultaneous Multi-Projection Engine
موتور پردازش همزمان چند تصویره یا همان Simultaneous Multi-Projection Engine یک واحد سخت افزاری جدید است که در بخش PolyMorph Engine در انتهای geometry pipeline و درست در مقابل واحد تصویرسازی (Raster Unit) قرار دارد. همانطور که از اسم آن پیداست، وظیفه واحد (Simultaneous Multi-Projection (SMP ایجاد بینش های متفاوت از یک جریان شکل هندسی است که همین امر SMP را تبدیل به یکی از مراحل سایه زنی بالادستی کرده است.
این بخش قادر است تا حداکثر 16 طرح و بینش مختلف از پیش تنظیم شده یک شکل هندسی را پردازش کند. در تمام حالات ممکن خلق تصاویر، پردازش اطلاعات توسط شتاب دهندههای سخت افزاری انجام میشود و جریان پردازش اطلاعات هیچ گاه پردازنده گرافیکی را ترک نمیکند. از آنجا که پردازش توسعه چند تصویره پس از واحدهای مربوط به ترسیم هندسی تصویر اتفاق میافتد، برنامههای سازگار با این تکنیک، تمامی عملیاتی که باید در واحدهای سایه زدن بالادستی انجام میشدند را بهمراتب کاهش میدهند. این عملیات حذف شده بهویژه در زمانی که GPU با تکنیکهای تصویرسازی هندسی پیچیده مثل Tessellation روبرو میشود پراهمیت هستند. در برخی موارد خاص، موتور SMP میتواند عملیات مربوط به پردازش هندسی تصاویر را تا حداکثر 32 برابر کاهش دهد.
همانطور که در تصویر بالا ملاحظه میکنید یکی از نمونههای کاربردی SMP اصلاح میدان دید مطلوب در صفحه نمایشهای 3 گانه به صورت فراگیر است.
همچنین همانطور که مطلع هستید به لطف تکنولوژیهای جدید صفحه نمایشهای LED و OLED شاهد عرضه صفحه نمایشهای خمیده (Curved) و عینکهای واقعیت مجازی (VR) مجهز به عدسیها و صفحه نمایشهای مختلف هستیم که هر یکی از این تکنولوژیهای نمایش تصویر نیاز به تصویرسازی مختص به خود هستند. در تصویر زیر انواع مختلف تکنولوژیهای نمایش تصویر موجود در حال حاضر و یا در حال توسعه آینده نزدیک را ملاحظه میکنید.
پردازندههای گرافیکی کنونی از تمامی این صفحه نمایشها پشتیبانی میکنند ولی به صورت کاملاً ناکارآمد و یا با مراحل متعدد پردازش تصویر و پیچ و تاب دادنهای مختلف برای مطابقت با خروجی نهایی مورد نیاز. GPU های با معماری Maxwell دارای برخی قابلیتهای ابتدایی Multi-Resolution بودند که در واقع پیش نمایشی از مدل عملیاتی واحد SMP در معماری Pascal محسوب میشد. پردازندههای گرافیکی مبتنی بر معماری مکسول میتوانستند دقیقاً 90 درجه تصویر را بچرخانند (بهعنوان مثال برای نگاشت مکعب) و یا با گرفتن یک جهت تصویر واحد مقیاس آن را با رزولوشن بخشهای مختلف نمایشگر تطبیق دهند. این تکنیکها علیرغم مثمر ثمر بودن برای برخی کاربردها نظیر VXGI، ولی در بسیاری از حالتهای مختلف نمایشگرهای جدید ناکارآمد هستند و بازدهی کارایی مناسبی ندارند.
به لطف موتور Simultaneous Multi-Projection Engine و قابلیتهای آن در اداره نمایش چندین تصویر با پیچ و تاب و چرخش مختلف در آن واحد، پردازندههای گرافیکی مبتنی بر معماری Pascal این قابلیت را دارند تا به صورت کاملاً کارآمد و با بازدهی کارایی بالا در سریعترین زمان ممکن بهترین خروجی را برای نمایشگرهای نام برده فراهم کنند. این موتور پردازش هندسی مدرن با پشتیانی از تکنیکهایی نظیر Projections in 3D Graphics، Perspective Surround، Single Pass Stereo و Lens Matched Shading قادر است تا در حالتهای مدرن نمایش تصاویر در عینکهای واقعیت مجازی (VR) بهترین کیفیت ممکن در کنار کارایی بسیار بهتر از پردازندههای گرافیکی نسلهای قبل ارائه دهد.
رابط جدید و بهبود یافته SLI
گیمرهای حرفهای برای دستیابی به کارایی فوقالعاده بالا در وضعیتهایی که از چند نمایشگر با رزولوشنهای بالای 4K و 5K استفاده میکنند به پیکربندیهای 2 یا چندگانه Multi GPU تحت عنوان SLI تکیه میکنند. یکی از مهمترین اجزاء در پیکربندی SLI نیز پل SLI یا همان SLI Bridge است که در واقع یک رابط دیجیتال برای جابجایی اطلاعات تصویر بین کارتهای گرافیک Geforce در این سیستم محسوب میشود.
کارتهای گرافیکی رده بالای Nvidia Geforce که از پیکربندیهای 3 و 4 گانه SLI پشتیبانی میکنند دارای 2 عدد از این رابطها بر روی PCB خود هستند. علت وجود رابط دوم در این حالتها ارتباط میان سایر کارتهای گرافیک با کارت گرافیک اصلی (کارت گرافیکی که ورودی یا ورودیهای تصاویر مانیتورها به آن متصل شده است) جهت هماهنگی و ارسال اطلاعات مرتبط با رندر فریمها است و تا قبل از معماری Pascal هر یکی از این رابطها به صورت مستقل عمل میکردند.
اما در معماری Pascal این دو رابط به یکدیگر لینک شدهاند تا پهنای باند ارتباط میان دو کارت گرافیک افزایش یابد. این حالت جدید dual-link SLI این قابلیت را فراهم میکند که هر دو رابط SLI در کنار هم نمایشگرهای با رزولوشنهای بالا و یا پیکربندیهای فراگیر مجهز به 3 نمایشگر را با سرعت بهمراتب بیشتر نسبت به نسلهای قبل تغذیه کنند.
Dual-link SLI تنها توسط پلهای جدید تحت عنوان SLI HB پشتیبانی میشود. این پلهای جدید ارتباط سریع میان دو کارت گرافیک را تسهیل میکنند، هر دو رابط SLI را در این ارتباط شرکت میدهند و موجب فعال شدن وضعیت ارتباط با سرعت کلاک 650MHz میان دو کارت گرافیک GTX 1080 میشود (این نکته را مد نظر داشته باشید که پیکربندی SLI توسط پلهای قدیمی نیز امکان پذیر است ولی در این حالت حداکثر سرعت کلاک ارتباط 400MHz خواهد بود و حداکثر کارایی این پیکربندی آشکار نخواهد شد).
البته لازم به ذکر است پلهای SLI مجهز به LED در پیکربندی دوگانه GTX 1080 از فرکانس 650MHz و پهنای باند بالای این ارتباط پشتیبانی میکنند.
پس مدنظر داشته باشید که برای ارتباط پرسرعت و پشتیبانی از نمایشگرهای 4K و 5K و همینطور ترکیب فراگیر چند نمایشگر به صورت همزمان باید از پلهای جدید مجهز به LED و یا SLI HB در پیکربندیهای دوگانه GTX 1080 استفاده شود. در جدول زیر میتوانید با توجه به نیازهای خود، نوع پل SLI مورد نظر را شناسایی کنید.
با پهنای باند بالای ارائه شده توسط رابط جدید SLI و پلهای جدید SLI HB گیمرها نسبت به نسل قبلی SLI بهمراتب اجرای روانتری را در بازیهای جدید تجربه خواهند کرد. در گراف زیر نمودار FrameTime اجرای بازی Shadow of Mordor را در رزولوشن 11520x2160 مشاهده میکنید.
همانطور که ملاحظه میکنید در حالتی که از پل جدید SLI HB استفاده شده است (گراف آبی رنگ) روی هم رفته FrameTime پایینتر و از آن مهمتر spike ها نیز بهمراتب کمتر هستند. این بدان معناست که Frame Rate بالاتر و پایداری این پارامتر نیز بهمراتب بهتر از قبل شده است.
حالتهای جدید پیکربندی Multi-GPU
در مقایسه با نسخههای قبلی DirectX کمپانی مایکروسافت چند تغییر در DirectX 12 جدید ایجاد کرده که عملکرد پیکربندیهای Multi-GPU را نیز تحت تأثیر قرار میدهند. در بالاترین سطح دو انتخاب اساسی برای توسعه دهندگان جهت استفاده از پیکربندیهای Multi-GPU در سخت افزاریهای انویدیا در DirectX 12 وجود دارد: حالت (Multi Display Adapter (MDA و حالت (Linked Display Adapter (LDA.
برای حالت LDA نیز دو شکل متفاوت تعریف شده است: حالت Implicit LDA که NVIDIA برای SLI از آن استفاده میکند و حالت Explicit LDA که در اصل توسعه دهندگان بسیاری از مسئولیتهای GPU را برای دستیابی به یک پیکربندی موفق و با بازدهی بسیار بالا مدیریت میکنند. در واقع هدف از توسعه حالتهای MDA و LDA Explicit این بوده که توسعه دهندگان بازیهای رایانهای کنترل بیشتری بر روی عملکرد GPU داشته باشند.
در جدول زیر خلاصه قابلیتها و ملزومات این 3 حالت را در پردازندههای گرافیکی Nvidia ملاحظه میکنید:
در حالت LDA تمامی حافظههای Frame Buffer کارتهای گرافیک مستقل شرکت کننده در این پیکربندی با یکدیگر مرتبط خواهند بود تا مجموعهای بسیار بزرگ از حافظه در اختیار توسعه دهنده قرار بگیرد (البته در این ارتباط برخی استثنائات وجود دارد). با این حال در صورتی که اطلاعات مورد نیاز یک GPU در حافظه GPU دیگر ذخیره شده باشد ممکن است نوعی افت کارایی پیش آید. در حالت MDA، حافظه هر GPU به صورت اختصاصی برای همان GPU قابل دسترس است و قابلیت دسترسی مستقیم به حافظه GPU های دیگر را ندارد.
حالت LDA برای وضعیتهایی در نظر گرفته شده است که در آن GPU ها دقیقاً شبیه به یکدیگر هستند در حالی که در حالت MDA محدودیتهای بهمراتب کمتری وجود دارد. برای مثال حتی این امکان وجود دارد که کارتهای گرافیک مجزا با تراشههای گرافیکی مجتمع جفت شوند و یا حتی GPU های با مدلهای مختلف و یا حتی با سازندگان مختلف با یکدیگر جفت شوند. ولی در این حالت توسعه دهنده باید با دقت بیشتری تمامی عملیات و دستورالعملهایی را که برای ارتباط میان GPU ها لازم است را مدیریت کند.
در حالت پیشفرض کارت گرافیک GFEFORCE GTX 1080 تنها از حالت دوگانه (i2-Way) پیکربندی SLI پشتیبانی میکند و حالتهای l3-Way و l4-Way پیکربندی SLI از این پس توسط انویدیا توصیه نمیشود. هم زمان با تکامل هر چه بیشتر بازیها بسیار دشوار خواهد بود تا حالتهای 3 و 4 گانه SLI در حالت عملیاتی افزایش کارایی محسوسی برای کاربران عادی و گیمرها به ارمغان بیاورند. برای مثال در بسیاری از بازیها در پیکربندیهای 3 و 4 گانه این CPU است که گلوگاه کارایی میشود و از طرف دیگر بازیهایی که از تکنولوژیهایی استفاده میکنند که استخراج فریم به فریم و البته متقارن آنها بسیار مشکل است نیز روز بهروز در حال افزایش است. البته مدلهای دیگر برای استفاده از پیکربندیهای l3-Way و l4-Way نیز وجود دارد:
- استفاده از حالتهای MDA و LDA Explicit
- 2Way SLI + dedicated PhysX GPU
معرفی معماری nVIDIA Pascal (بخش دوم)
-
Fast Sync
Fast Sync نوع با زمان تأخیر بهمراتب کمتر تکنولوژی قدیمی (Vertical Sync (V-SYNC است که مانع از به اصطلاح tearing یا گسستگی تصویر در هنگام بیشتر شدن نرخ FPS از Refresh Rate نمایشگر میشود.
در تصویر زیر یک طرح کلی خام از چگونگی رندر شدن یک فریم در pipeline تراشههای گرافیکی Nvidia را ملاحظه میکنید:
موتور گرافیکی بازی وظیفه تولید فریمها و ارسال آن به DirectX را بر عهده دارند. از دیگر وظایف موتور بازی محاسبه animation time (کد گذاری داخل هر فریم که در نهایت رندر میشود) است. در ادامه سرعت ترسیم و دیگر اطلاعات به درایور و GPU ابلاغ میشوند تا به تصویر رندر شده حقیقی تبدیل شوند. این اطلاعات سپس به حافظه Frame Buffer ارسال شده و در نهایت نیز جهت اسکن به نمایشگر منتقل میشوند.
اما در پردازندههای گرافیکی مبتنی بر معماری Pascal این روال کمی تغییر کرده است.
یک سؤال: در برخی بازیهای کنونی مثل Counter-Strike: Global Offensive که نرخ FPS گاهی اوقات به بیش از صدها فریم در ثانیه میرسد، بهتر است V-SYNC فعال باشد یا غیرفعال؟
در حالتی که V-SYNC روشن است نرخ FPS هیچ گاه از نرخ Refresh Rate نمایشگر تجاوز نمیکند. این امر در عمل باعث جلوگیری از گسستگی تصویر میشود ولی از طرفی باعث افزایش محسوس زمان تأخیر ورودی میشود.
اما در وضعیتی که V-SYNC خاموش است نرخ FPS به صورت افسار گسیخته افزایش مییابد. در این حالت زمان تأخیر ورودی بسیار پایین است ولی در عمل گسستگی (بریدهبریده شدن) در تصویر خروجی مشاهده میشود.
این دو وضعیت یک چالش بسیار سخت برای گیمرهای کنونی محسوب میشود! و البته انتخاب بین این دو وضعیت نیز در شرایط مختلف همانطور که اشاره شد معایب و مزایای خاص خود را به همراه دارد.
انویدیا با بازنگری در نحوه عملکرد این فرآیند قدیمی در قدم اول در مسیر پردازش تصویر، بخشهای مرتبط با رندر فریم و نمایش تصویر را از یکدیگر جدا کرده است. این امر به بخشهای مرتبط با رندر اجازه میدهد تا بهطور مداوم و با حداکثر سرعت به رندر اطلاعات ارسال شده توسط موتور بازی و درایور بپردازند و این فریمها بتوانند موقتاً در حافظه Frame Buffer ذخیره شوند.
Rendered Frames - FAST SYNC
همانطور که اشاره شد انویدیا در مسیر رندر تصاویر، یخش های مرتبط با رندر و بخشهای مربوط به نمایش تصاویر را از یکدیگر جدا کرده است. این امر اجازه میدهد تا تصویر خروجی با استفاده از راهکارهای جدید مختلف مدیریت شود که این امر مزایای فراوانی برای گیمرها در پی خواهد داشت.
FAST SYNC یکی از اولین کاربردهایی است که این رویکرد جدید همراه خواهد داشت.
با FAST SYNC دیگر کنترل و کندسازی جریان پردازش گرافیکی (flow control) وجود نخواهد داشت، عملکرد موتور گرافیکی همانند وضعیتی است که V-SYNC غیرفعال است و همه اینها به این دلیل است که دیگر مسیر پردازش تصویر، پدیده تجمع فریمها در حافظه Frame Buffer وجود ندارد. زمان تأخیر تقریباً همانند زمانی که V-SYNC غیرفعال است پایین است و از همه بهتر تصویر نیز دیگر گسستگی مشاهده نخواهد شد! چون FAST SYNC انتخاب میکند که کدام یکی از فریمهای رندر شده باید توسط نمایشگر اسکن شود. FAST SYNC به مسیر پردازش تصویر این اجازه را میدهد تا با حداکثر سرعت به پردازش تصاویر بپردازد و تعیین میکند تا کدام فریم برای اسکن به نمایشگر ارسال شود، در حالی که بهطور همزمان همه فریمها حفظ میشوند و تصویر نیز بدون گسستگی در نمایشگر اسکن میشود.
تجربهای که FAST SYNC ارائه میدهد بسته به نرخ FPS از نظر کیفیت و وضوح تصویر همانند وضعیتی است که V-SYNC فعال است. همچنین زمان تأخیر ورودی نیز بسیار پایین و مانند وضعیتی است که V-SYNC خاموش است.
Decoupled Buffers
اما شاید برای شما نیز سؤال شده باشد که FAST SYNC چگونه کار میکند؟
تصور کنید 3 ناحیه در حافظه Frame Buffer تعبیه شده است که دارای 3 عملکرد متفاوت میباشند. 2 بخش بافر اول همانند تکنیک double-buffered V-SYNC در GPU های نسل قبل عمل میکنند. باور جلویی (Front Buffer) تصاویری که برای اسکن به نمایشگر فرستاده میشوند را در خود ذخیره میکند. بافر پشتی (Back Buffer) اطلاعاتی را همراه دارد که در حال رندر شدن هستند و تا زمانی که این فرآیند شکل گیری تصاویر به پایان نرسند اجازه اسکن شدن را ندارند. استفاده از V-SYNC مرسوم در گیم های با نرخ FPS بالا اصلاً زمان تأخیر ورودی مناسبی نخواهد داشت چون موتور بازی باید منتظر وقفه ایجاد شده توسط Refresh Rate نمایشگر بماند تا قبل از اینکه فریمهای جدید در Back Buffer بارگذاری شوند، با تلنگر Back Buffer اجازه ارسال اطلاعات به نمایشگر را صادر کند. این روال تمامی مراحل را کند میکند و در عمل Back Buffer را به یک عامل ایجاد زمان تأخیر تبدیل میکند.
FAST SYNC بافر سومی تحت عنوان (Last Rendered Buffer (LRB را همراه خود دارد که وظیفه آن ذخیره تمامی تصاویر رندر شدهای است که در Back Buffer کامل شدهاند. در نتیجه داشتن یک کپی از فریمهایی که اخیراً توسط Back Buffer رندر شده تا زمانی که Front Buffer کار اسکن تصویر را کامل کند در این نقطه Last Rendered Buffer نیز در Front buffer کپی میشود و این روند ادامه مییابد. عملاً و در واقع رونویسی بافر ناکارآمد خواهد بود و در اصل نام این Buffer ها در طی این فرآیند تغییر میکند.
بافری که تصویر را اسکن میکند FB، بافری که به صورت فعال در حین رندر کردن تصاویر است BB و بافری که حاوی تصاویری است که اخیراً رندر شدهاند نیز LRB نامیده میشود. واحد جدید flip logic نیز در معماری Pascal این فرآیند را کنترل و مدیریت میکند. نمونه کاملی از این فرآیند همانند روال زیر خواهد بود:
- Scan from FB
- Render to BB
- When Render completes
- BB becomes LRB
- LRB becomes BB and render continues
- When Render completes
- BB becomes LRB
- LRB becomes BB and render continues
- When Render completes
- BB becomes LRB
- LRB becomes BB and render continues
- When scan completes
- LRB becomes FB
- Start scanning from the new FB
در نمودار بالا تست این قابلیت را در بازی Counter-Strike: Global Offensive ملاحظه میکنید که توسط دوربینهای بسیار پرسرعت تصویربرداری شده است. به روشنی مشخص است که Fast Sync تنها با حدوداً 8ms زمان تأخیر بیشتر نسبت به حالتی که V-SYNC غیرفعال است مانع از گسستگی شدن تصویر شده است! این در حالی است فعال بودن V-SYNC سنتی عملاً بیش از 9 برابر زمان تأخیر ورودی را افزایش داده است.
نکته: Fast Sync بهترین عملکرد را در بازیهای با نرخ FPS بالا مبتنی بر DirectX 9 دارد.
جهت فعال سازی این قابلیت باید در نرم افزار NVIDIA Control Panel و در بخش مربوط به مدیریت تنظیمات سه بعدی (Manage 3D settings) گزینه FAST را برای پارامتر Vertical sync انتخاب کنید. توجه داشته باشید که عملکرد این پارامتر در حال پیش فرض به موتور گرافیکی گیم سپرده شده است.
HDR
نمایشگرهای جدید با محدوده دینامیکی بالا (HDR) یکی از بزرگترین پیشرفتهای 20 سال اخیر در کیفیت پیکسل صفحه نمایش محسوب میشوند. طیف رنگ BT.2020 حداکثر 75% از رنگهای قابل روئیت توسط چشم انسان را پوشش میدهد (33% بیشتر از طیف رنگ sRGB). این یعنی افزایش 2 برابری محدوده رنگها. علاوه بر این نمایشگرهای HDR حداکثر روشنایی بهمراتب بیشتری نسبت به نمایشگرهای نسل قبل دارند (بیش از 1000 nits در نمایشگرهای LCD) و همینطور درخشندگی بهمراتب بیشتر (l>10:000 to 1).
(Standard Dynamic Range Image (SDR
(High Dynamic Range Image (HDR 1000
با محدوده بیشتر روشنایی و اشباع رنگ، محتوای HDR نمایش واقعگرایانهتری از جهان واقعی خواهند داشت: رنگهای مشکی عمیقتر و رنگهای سفید روشنتر از قبل به نظر میرسند. تغییرات ایجاد شده در تولید رنگ باعث ایجاد تصاویر واقعیتر میشود که حقیقتاً حیرت انگیز است. کاربران سرانجام میتوانند طیف رنگهای قرمز و نارنجی را در آتش و یا انفجار مشاهده کنند. همچنین به خاطر درخشندگی (Contrast) بیشتر در نمایشگرهای HDR کاربران میتوانند جزئیات بیشتری را در نقاط کاملاً تاریک و یا با نور بسیار زیاد مشاهده کنند.
کارتهای گرافیکی مبتنی بر معماری Pascal همانند نمونههای مشابه نسل قبل (Maxwell) از تمامی نمایشگرهای HDR پشتیبانی میکنند و به لطف کنترلر نمایشگر تعبیه شده در آنها از قابلیتهای 12b color، طیف رنگ گسترده (BT.2020،(SMPTE 2084 (Perceptual Quantization و HDMI 2.0b 10/12b برای 4K HDR نیز برخوردار هستند؛ اما در معماری Pascal برخی قابلیتهای جدید به این مجموعه اضافه شده است:
- 4K@60 10/12b HEVC Decode (برای ویدئوهای HDR)
- 4K@60 10b HEVC Encode (برای ضبط و یا استریم ویدئوهای HDR)
- DP1.4-Ready HDR Metadata Transport (برای اتصال به نمایشگرهای HDR با رابط Display Port)
تلویزیونهای HDR در حال حاضر موجود هستند و قابلیتهایی که به آن اشاره شد این امکان را فراهم میسازند تا کاربران به واسطه دستگاه HDR Gamestream که در آینده نزدیک به بازار عرضه خواهد شد بدون اتصال مستقیم PC خود به تلویزیون بازیهای HDR را بر روی این نمایشگرها اجرا و از آنها لذت ببرند.
همچنین انویدیا در حال کار با توسعه دهندگان است تا HDR را به بازیهای رایانهای نیز ببرند. انویدیا با فراهم کردن API، درایورهای لازم و همچنین راهنمایی لازم، توسعه دهندگان را پشتیبانی میکند تا بتوانند تصاویر رندر شده HDR سازگار با این نوع نمایشگرها را با بهترین کیفیت و وضوح ممکن ارائه کنند. بازیهای با محتوای HDR مثل Obduction, The Witness, Lawbreakers, Rise of the Tomb Raider, Paragon, The Talos Principle و Shadow Warrior 2 در حال حاضر عرضه شده و یا در آینده نزدیک عرضه خواهند شد.
Video and Display
پردازندههای گرافیکی مبتنی بر معماری Pascal با پشتیبانی از گواهی نامه (PlayReady 3.0 (SL3000 و رمزگشایی HEVC با استفاده از شتاب دهندههای سخت افزاری برای اولین بار قابلیت مشاهده ویدئوهای 4K premium را توسط PC فراهم کردهاند. در ماههای آینده کاربران مجهز به پردازندههای گرافیکی Pascal این امکان را خواهند داشت تا در Netflix و یا دیگر ارائه دهندگان محتوای باکیفیت، با رزولوشن 4K محتواهای مختلف را استریم و مشاهده کنند.
به لطف برخورداری GeForce GTX 1080 از گواهی نامه Display Port 1.2 و به همراه داشتن قابلیتهای DP 1.3/1.4 پشتیبانی از نمایشگرهای با رزولوشنهای 4K در 120Hzا، 5K در 60Hz و 8K در 60Hz (به واسطه دو کابل مجزا) فراهم شده است.
جدول زیر به صورت خلاصه قابلیتها و ویژگیهای خروجی تصویر Geforce GTX 1080 را در مقایسه با Geforce GTX 980 نشان میدهد:
مدل Founders Edition کارت گرافیک Geforce GTX 1080 دارای 3 خروجی تصویر Display Port، یک خروجی تصویر HDMI 2.0b و یک پورت Dual Link DVI است که قادر به ارائه 4 تصویر به صورت همزمان هستند.
در جدول زیر نیز به صورت خلاصه قابلیتهای Geforce GTX 1080 را در رمزگذاری و رمزگشایی Codec های مختلف ویدئویی در مقایسه با Geforce GTX 980 مشاهده میکنید:
VRWorks Graphics
گیمینگ واقعیت مجازی زمان پاسخ دهی بسیار پایین و از آن مهمتر نرخ Frame Rate بالایی را برای داشتن تجربهای دل چسب و همه جانبه توسط کاربران طلب میکند. این در حالی است که کیفیت بازیهای اخیر مبتنی بر VR خوب به نظر میرسد ولی هنوز به مرحلهای نرسیده است که از نظر کیفیت با بازیهای مدرن غیر VR برابری کنند. یکی از مهمترین دلایل این امر الزامات مربوط به نرخ Frame Rate بالا است که هم اکنون پردازندههای گرافیکی با قدرت کم توانایی ارائه آن را باکیفیت بالا و همراه با افکتهای واقعگرایانه ندارند.
بهمنظور همسان سازی کیفیت گرافیکی بازیهای مبتنی بر VR و غیر VR، انویدیا در پردازندههای گرافیکی مبتنی بر معماری Pascal چندین تکنولوژی جدید جهت افزایش کارایی رندر گرافیکی در کاربردهای VR توسعه داده است. این تکنولوژیها در نهایت سبب شدهاند تا Geforce GTX 1080 در کاربردهای VR بیش از دو برابر سریعتر از Geforce TITAN X باشد. با این افزایش کارایی در پردازندههای گرافیکی مبتنی بر معماری Pascal از این پس توسعه دهندگان بازیهای VR میتوانند کیفیت گرافیکی نظیر بازیهای مدرن غیر VR را برای محتوای گرافیکی ساخت خود فراهم کنند.
VRWorks Audio
تکنولوژیهای شنیداری در گیم و واقعیت مجازی مرسوم کنونی، موقعیت دقیقی از منبع صدا را در یک محیط مجازی ارائه میدهند. برای مثال اگر در یک بازی ژانر شوتر، دشمن از سمت راست شما به طرفتان شلیک کند شما نیز در عمل همین حس را خواهد داشت. دلیل این امر پخش شدن بلندتر صدای شلیک از بلندگوی سمت راست اسپیکر شما نسبت به اسپیکر سمت چپ است و البته این صدا کمی زودتر نیز از بلندگوی سمت راست شنیده میشود. این شبیه سازی در تقدم رسیدن و تقدم انرژی اولین موج صدا برای رسیدن به شنونده را اصطلاحاً Direct Sound مینامند. تفاوتها در انرژی و تقدم رسیدن Direct Sound به هر گوش شنونده نیز Binaural Effects نامیده میشود.
اما در جهان واقعی صداها در جهات مختلفی پخش میشوند و ممکن است به صورت مستقیم به گوش شنونده نرسند. بعضی از این صداها ممکن است در اثر انعکاس برخورد موج صدا به سطوح مختلف به گوش شنونده برسند. به این گونه از امواج، صدای غیرمستقیم، صدای منعکس شده و یا طنین صدا اطلاق میشود. نوع صدای غیرمستقیم به اندازه، شکل و خواص متریال محیط اطراف آن بستگی دارد. برای مثال، وقتی که در حمام کوچک با دیوار کاشی شده و کفپوش قدم میزنید، صدای قدم برداشتن شما بلندتر و با پژواک بیشتری به گوش میرسد تا زمانی که در همان محیط ولی با دیوارهای گچی و کف پوشیده شده با فرش قدم میزنید. در واقع متریال مختلف در انعکاس صدا در جهات مختلف نقش بسیار مهمی دارند. بعضی متریال مانند کاشی و کفپوشها باعث انعکاس حجم زیادی از انرژی صوتی میشوند و بعضی از متریال مانند موکت و فرش حجم اعظمی از انرژی صوتی را جذب خود میکنند.
NVIDIA VRWorks Audio از تکنیک Ray tracing که در گرافیک کامپیوتری جهت رندر و ترسیم تصاویر استفاده میشود برای ردیابی مسیر انتشار اصوات در یک صحنه مجازی استفاده میکند. VRWorks Audio انرژی اصوات منتشر شده را از طریق محیط اطراف شبیه سازی میکند. برای این منظور یک موج برای ردیابی مسیرهای مستقیم و یا غیرمستقیم بین منبع اصوات و شنونده ارسال میشود. وقتی این امواج به سطوح مختلف محیط آن صحنه برخورد میکنند ممکن است جذب شده، منعکس شده و یا با توجه به زاویه برخورد خود پراکنده شوند و همانطور که اشاره شد جنس متریال سطوح نیز در این امر دخیل است.
VRWorks Audio در واقع Binaural Effects را در Direct sound ایجاد میکنند که قبلاً نیز گیمرها آن را تجربه کردهاند؛ اما وجه تمایز این تکنولوژی با موارد مشابه پشتیبانی آن از جلوههای صوتی انتشار غیرمستقیم امواج صوتی است که به شنونده اطلاعات مربوط به ابعاد و ساختار فضایی که در آن حضور دارد را نیز میدهد.
تکنولوژی VRWorks Audio از همان موتور NVIDIA OptiX ray tracing engine استفاده میکند که نرم افزارهای مبتنی بر تکنیک Ray tracing برای پردازش اطلاعات بهره میبرند. موتور OptiX در بازیهای رایانهای سازگار با آن میتواند باعث افزایش سرعت بسیاری از عملیات مثل پردازش دقیق Ambient Occlusion و نورپردازی شود. با تکنولوژی VRWorks Audio، گیمرهای واقعیت مجازی صدای 3 بعدی فراگیرتری را تجربه خواهند کرد که در کنار کیفیت بالای گرافیکی ارائه شده توسط پردازندههای گرافیکی مبتنی بر معماری Pascal، آنها را در محیط مجازی گیم ها غرق خواهد کرد!
PhysX for VR Touch & Environmental Simulation
مدل سازی واقعگرایانه تعاملات لمسی و حرکات در محیط پیرامونی برای ارائه تجربه کاملی از واقعیت مجازی دو امر حیاتی محسوب میشوند. امروزه واقعیت مجازی نوعی تعامل قابل لمس از محیط ارائه میکنند که بر اساس ترکیبی از ردیابی موقعیتی، کنترل دست و تکنولوژیهای حسی و لمسی کار میکنند. تکنولوژی NVIDIA’s PhysX Constraint Solver زمانی که کنترلر دست با یک جسم مجازی تعامل پیدا میکند را شناسایی کرده و موتور بازی را قادر میسازد تا در نهایت پاسخ فیزیکی بصری و لمسی دقیقی را در خروجی ارائه دهد.
تکنولوژی PhysX همچنین رفتار فیزیکی دنیای مجازی اطراف شما را طوری مدل سازی میکند که همه فعل و انفعالات مثل انفجار و یا پاشش آب زمانی که یک دست وارد آب میشود دقیق و همانند فعل و انفعالات دنیای واقعی به نظر برسد.
معرفی تراشه گرافیکی nVIDIA GP104-200 و مشخصات کارت گرافیک
-
معرفی تراشه گرافیکی nVIDIA GP104-200 و مشخصات فنی کارت گرافیک
تراشه گرافیکی (GPU) استفاده شده در کارت گرافیک Geforce GTX 1070 که با اسم رمز GP104-200 شناخته میشود تنها یک تفاوت عمده با نمونه به کار رفته در کارت گرافیک (Geforce GTX 1080 (GP104-400 دارد و آن هم غیرفعال شدن یکی از واحدهای بزرگ GPC یا همان Graphics Processing Cluster است. با غیرفعال شدن یکی از این 4 واحد تعداد CUDA core ها نیز به 1920 عدد و تعداد واحدهای Texture Unit نیز از 160 به 120 واحد تقلیل یافته است. علاوه بر این فرکانس پایه هسته GP104 نیز در Geforce GTX 1070 نسبت به Geforce GTX 1080 حدوداً 100MHz کمتر شده و به 1506MHz رسیده است. این در حالی است که در بخشهای مربوط به رابط حافظه و واحدهای ROP تغییری مشاهده نمیشود.
اما تغییرات به همین جا ختم نمیشوند و انویدیا به جای استفاده از حافظههای با تکنولوژی GDDR5X در این مدل از 8GB حافظه GDDR5 با فرکانس مؤثر 8000MHZ استفاده کرده است. این تغییرات در عمل باعث کاهش پهنای باند حافظه از 320GB/s به 256GB/s در Geforce GTX 1070 شده است.
روی هم رفته نیز تمامی تغییرات نام برده باعث شدهاند تا TDP یا توان مصرفی Geforce GTX 1070 به حداکثر 150W برسد. این در حالی است که این میزان در Geforce GTX 1080 حداکثر 180W اعلام شده است.
حال اگر قیمت $599 مدل Geforce GTX 1080 8GB را باقیمت به مراتب کمتر $379 کارت گرافیک Geforce GTX 1070 مقایسه کنید بدون شک به این موضوع پی خواهید برد که این میزان تغییرات در کارایی، ارزش خلق یک مدل به مراتب ارزانتر و خوش قیمتتر را داشته است!
در مدل GALAX Geforce GTX 1070 HOF 8GB تنها فرکانس پایه هسته GPU حدوداً 8% اورکلاک شده و به 1620MHz رسیده است و فرکانس تراشههای حافظه همانند مدل مرجع 8000MHz تعیین شده است.
در جدول زیر مشخصات فنی این کارت گرافیک را در مقایسه با مدل مرجع و سایر مدلهای هم تراز مشاهده میکنید:
بسته بندی و محتویات داخل جعبه
-
بسته بندی و محتویات داخل جعبه
برخلاف رنگ تیره پس زمینه جعبه اکثر مدلهای مشابه، این مدل جعبهای با پس زمینه سفید دارد. بر روی جعبه نیز عنصر مشترک نیمی از کارتهای گرافیک این کمپانی که یک مرد گیمر است به همراه عبارت "?WHAT’ S YOUR GAME” در مرکز، لوگو تجاری کمپانی GALAX در بالا و سمت راست و لوگو VRREADY کمپانی انویدیا در بالا و سمت چپ برجسته ترین مندرجات روی این جعبه محسوب میشوند.
در بخش پایین روی این جعبه جذاب نیز لوگوی مدل تجاری کمپانی انویدیا و تکنولوژیهای انحصاری آن در سمت راست و لوگو و مدل تجاری به همراه قابلیتهای خاص GALAX GTX 1070 HOF در سمت چپ درج شدهاند.
بر روی پشت جعبه نیز به محتویات داخل جعبه، برخی تکنولوژیهای انحصاری کارتهای گرافیک مبتنی بر پردازندههای گرافیکی انویدیا و نرم افزار Xtreme Tuner Plus جهت اورکلاک و مانیتورینگ پارامترهای مختلف این کارت گرافیک اشاره شده است. این در حالی است که در مدلهای مشابه از پشت جعبه معمولاً جهت تشریح قابلیتهای سخت افزاری و ویژگی خاص قطعات استفاده میشود!
این جعبه با ابعاد 480mm x 238mm x 84mm با تمامی محتویات داخلش حدود 2.0Kg وزن دارد که هم از نظر ابعاد و هم از نظر وزن از تمامی مدلهای مشابه برندهای رقیب حجیمتر و سنگینتر است.
با باز کردن پوشش مقوایی با این جعبه مشکی رنگ روبرو خواهید شد که این کارت گرافیک را به واسطه یک پوشش ضد UV، در میان یک فوم اسفنجی جای داده است. سایر متعلقات این کارت گرافیک در زیر این فوم تعبیه شدهاند.
محتویات داخل جعبه نیز به غیر از خود کارت گرافیک شامل دفترچههای راهنمای نصب و راه اندازی و DVD حاوی درایورها و نرم افزارهای جانبی، 2 عدد مبدل دو کانکتور 4 پین مولکس به 8Pin PCI-Express، درآویز مخصوص برای هشدار عدم مزاحمت توسط اطرافیان در حین گیمینگ و اورکلاک! و نگه دارنده آلومینیومی قابل تنظیم به همراه اتصالات مخصوص آن میشود.
این نگه دارنده آلومینیومی قابل تنظیم به گونهای طراحی شده که تقریباً در تمامی کیس های استاندارد به راحتی نصب میشود و در عمل با تحمل وزن کارت گرافیک مانع از آسیب دیدن اسلات های PCI-Express مادربرد به جهت وزن بالای این مدل میشود.
نمای ظاهری و بررسی اولیه
-
نمای ظاهری و بررسی اولیه
همانند مدل مشابه نسلهای قبل این خانواده GALAX Geforce GTX 1070 HOF نیز ظاهری کاملاً سفید رنگ دارد. ترکیب رنگ سفید. نقرهای به همراه تعبیه لوگوی بسیار خاص و زیبای HOF در مرکز هر 3 فن کولر این کارت گرافیک جلال و شکوه بینظیری به این مدل بخشیده است.
همانند اکثر کارتهای گرافیک رده بالای کنونی برای بخش پشت PCB این مدل نیز یک صفحه فلزی مخصوص در نظر گرفته شده است. این صفحه فلزی برای محافظت از قطعات و اتصالات این بخش و کمک به دفع سریعتر حرارت PCB در نظر گرفت شده است. درج لوگو و برند تجاری Hall Of Fame بر روی این صفحه آلومینیومی آنودایز شده و البته طرحهای ناموزون و خاص روی آن بیش از پیش به زیباییهای این مدل افزوده است.
همچنین بر روی بخش مرکزی و دقیقاً پشت اتصالات مربوط به پردازنده گرافیکی، اخطار مربوط به داغ بودن این سطح فلزی درج شده است!
در تصویر بالا لوگو برجسته HOF تعبیه شده در زیر کولر این کارت گرافیک را ملاحظه میکنید.
همانطور که اشاره شد این کارت گرافیک نیز همانند اکثر مدلهای مشابه خود در برندهای رقیب به نورپردازی با RGB LED مجهز شده است. در تصاویر بالا نشانهای تجاری Hall Of Fame یکی دقیقاً در بخش فوقانی PCB و دیگری در بخش پشت PCB را ملاحظه میکنید که به نور پس زمینه RGB LED مجهز شدهاند.
به دلیل طول زیاد و وزن بالای این مدل، انتهای PCB این کارت گرافیک به دو نوع براکت مختلف جهت اتصال به نگه دارندههای مخصوص تعبیه شده در کیس های رده بالا مجهز شده است.
در این مدل نیز تمامی پورتهای خروجی تصویر با درپوش پلاستیکی مخصوص پوشیده شدهاند تا عواملی مانند گرد و خاک، رطوبت و یا هر گونه جسم خارجی باعث خوردگی، آسیب و یا اکسیداسیون آنها نشود.
این مدل در ظاهر Dual Slot به نظر میرسد ولی به دلیل ارتفاع زیاد کولر بسیار بزرگ آن از سطح PCB، عرض آن به حدود 55mm رسیده است که در عمل آن را به یک کارت گرافیکی Triple Slot تبدیل کرده است.
همچنین این کارت گرافیک با داشتن طول 330mm یکی از بزرگترین مدلهای Geforce GTX 1070 موجود در بازار محسوب میشود. پس حتماً قبل از خرید این کارت گرافیک مشخصات فنی کیس خود را به جهت قابلیت پشتیبانی از کارتهای گرافیک با طول بیش از 330mm بررسی کنید.
دقیقاً همانند مدل مرجع، Geforce GTX 1070 G1 GAMING نیز به یک پورت Dual Link DVI-D، یک پورت HDMI 2.0 و 3 پورت DisplayPort 1.4 مجهز شده است. لازم به ذکر است از این 5 خروجی تصویر، 4 خروجی قابلیت ارائه تصویر بهصورت هم زمان را دارا میباشند. همچنین به لطف معماری فوقالعاده مدرن پاسکال، امکان پشتیبانی از رزولوشن 7680x4320 @60Hzا(8K) نیز به واسطه اتصال این کارت گرافیک به نمایشگر توسط دو کانکتور DP 1.3 فراهم شده است.
در بخش بالایی پنل پورتهای خروجی تصویر یک سوئیچ فشاری تحت عنوان Hyper Boost را مشاهده میکنید. با فعال شدن این سوئیچ فنها با حداکثر سرعت شروع به چرخش میکنند و با خنک نگاه داشتن تراشه گرافیکی (GPU) باعث میشوند تا حتی در Load های سنگین نیز همواره حداکثر فرکانس Boost هسته GPU عملیاتی شود.
همانند تمامی کارتهای گرافیک مدرن کنونی این مدل نیز از رابط PCI-Express 3.0 x16 پشتیبانی میکند و با سرعت فوقالعاده بالای (126.032Gbit/s (15.754GB/s با دیگر منابع سیستم در ارتباط است.
در تصویر بالا کانکتورهای پل SLI-HB این کارت گرافیک را ملاحظه میکنید. همانطور که در صفحه معرفی معماری پاسکال به آن اشاره شد به دلیل تغییرات صورت گرفته در نسخه جدید DirectX 12 و الگوریتمهای مربوط به پیکربندیهای Multi-GPU معماری پاسکال، کارتهای گرافیک مبتنی بر این معماری طبق توصیه انویدیا تنها از پیکربندی دوگانه (2Way SLI) پشتیبانی میکنند.
بر خلاف مدل مرجع انرژی مورد نیاز این کارت گرافیک 150W از طرق دو کانکتور 8Pin PCI-Express تأمین میشود. روی کاغذ این دو کانکتور (150W + 150W) به همراه مقدار توان جذب شده توسط اسلات (PCI-Express (75W روی هم رفته 375W توان را از منبع تغذیه سیستم برای این مدل اورکلاک شده فراهم میکنند. این میزان که حدوداً 2.5 برابر بیشتر از انرژی مورد نیاز برای مدل مرجع این کارت گرافیک است نشان از پتانسیل فوقالعاده بالای این مدل در Extreme Overclocking دارد.
نگاهی نزدیکتر (جدیدترین نسخه کولر GALAX TriMax)
-
نگاهی نزدیکتر (جدیدترین نسخه کولر GALAX TriMax)
مشابه این کولر را قبلاً در GALAX Geforce GTX 970 HOF نیز مشاهده کرده بودیم. طراحی و رنگ و لعاب بینظیر، نویز صوتی فوقالعاده پایین و عملکرد خیره کننده این کولر آن را به یکی از قدرتمندترین کولرهای حال حاضر کارتهای گرافیک تبدیل کرده است؛ اما اجازه دهید برای بررسی دقیقتر کولر و متعلقات آن را از روی PCB باز کنیم.
همانطور که ملاحظه میکنید این کولر به واسطه 6 پیچ فنر دار به PCB متصل میشود؛ اما این کولر به خودی خود از چه اجزائی تشکیل شده است؟
بهطور کلی این کولر از 4 بخش فنها و فریم نگه دارنده آنها، هیتسینک آلومینیومی مجهز به 5 عدد هیت پایپ مسی، هیتسینک آلومینیومی مخصوص ماسفت های مدار رگولاتور ولتاژ و تراشههای حافظه و صفحه فلزی محافظه پشت PCB تشکیل شده است.
هیتسینک این مجموعه شامل چهار Heat-Pipe مسی آبکاری شده با قطر 8mm و یک هیت پایپ 6mm دیگر از همین نوع است که حرارت را به واسطه یک هسته کاملاً مسطح مسی از سطح Die پردازنده گرافیکی (GPU) به دو مجموعه پرههای آلومینیومی مجهز به بیش از 70+60 تیغه منتقل میکنند.
همانطور که ملاحظه میکنید بر خلاف اکثر کولرهای مدرن کارت گرافیک حال حاضر که از تکنیک Direct Touch برای جذب مستقیم حرارت از سطح Dire پردازنده گرافیکی به هیت پایپها استفاده میکنند، کمپانی GALAX در کولر TriMax کماکان به واسطه یک ورق کاملاً مسی و البته خمیر حرارتی بسیار مرغوب حرارت را از سطح Die پردازنده گرافیکی به هیت پایپها منتقل میکند.
در تصویر بالا 5 هیت پایپ این کولر قدرتمند را از نمای نزدیک ملاحظه میکنید.
یکی از نقاط قوت این کولر منحصر به فرد تجهیز آن به یک هیتسینک آلومینیومی مجزا برای جذب و دفع سریعتر حرارت از تراشههای حافظه و ماسفت های مدار رگولاتور ولتاژ است.
همانطور که در تصویر بالا ملاحظه میکنید تمامی نقاط تماس این هیتسینک به قطعات نام برده توسط پدهای حرارتی مخصوص پوشیده شده است.
همانطور که اشاره شد دفع حرارت از روی هیتسینک ها بهوسیله 3 عدد فن 90mm فوقالعاده کم صدا صورت میگیرد.
جریان مورد نیاز این فنها توسط یک کانکتور 4Pin از Header مخصوص تعبیه شده بر روی PCB فراهم میشود.
همچنین جریان مورد نیاز RGB LED تعبیه شده بر روی بخش فوقانی PCB نیز توسط یک کانکتور 4Pin مخصوص دیگر تأمین میشود.
یکی از نکات قابل توجه در مورد این کولر تعبیه پدهای اسفنجی ضد لرزش در پشت فنهای این کولر است. این پدها در عمل مانع انتقال لرزش فنها به هیتسینک و ایجاد سر و صدا در اثر لغزشهای احتمالی میشوند.
فنهای این کولر مدل GA92S2H ساخت کمپانی APISTEK هستند. طبق مشخصات فنی ارائه شده توسط کمپانی سازنده این مدل از نوع Hydrolic Bearing با ولتاژ کاری 12V DC و حداکثر جریان مصرفی 0.35A است. همچنین حداکثر سرعت چرخش این فنهای PWM نیز در تستهای ما حدود 3000RPM ثبت شده است.
در تصاویر بالا نیز صفحه محافظ فلزی تعبیه شده در پشت PCB را ملاحظه میکنید. این صفحه که از جنس آلومینیوم آنودایز شده است توسط 8 عدد پیچ بر روی PCB نصب میشود در عمل هم از قطعات تعبیه شده در پشت PCB محافظت میکند و هم به نوعی بهعنوان هیتسینک حرارت منتقل شده توسط قطعات به PCB را جذب میکند تا با سرعت بیشتری دفع شود. همانطور که ملاحظه میکنید سطح پشتی این صفحه با عایق الکتریکی پوشیده شده است.
نگاهی نزدیکتر (مدار رگولاتور ولتاژ و تراشههای حافظه)
-
نگاهی نزدیکتر (مدار رگولاتور ولتاژ و تراشههای حافظه)
حتی در همان نگاه اول نیز میتوان تشخیص داد که طراحی و نوع قطعات به کار رفته در این مدل در مقایسه با مدل مرجع کاملاً متفاوت است و بهطور کلی با یک برد بسیار خاص و البته غیرمتعارف روبرو هستیم. PCB یک دست سفید این کارت گرافیک از نوع 12 لایه و از جنس دی الکتریک فایبرگلاس است. همچنین مدار 8l+3Phase مجهز به PWM Controller دیجیتال متشکل از خازنهای جامد ژاپنی، چوک های فریتی کاملاً بیصدا با ظرفیت جریانهای بسیار بالا و ماسفت های مجتمع از نوع DrMOS جایگزین مدار 4l+1Phase برد مرجع شده است.
کیفیت و تکنیک لحیم کاری در پشت PCB به معنای واقعی کلمه مثال زدنی و بینظیر است! همچنین مهمترین قطعاتی که در این بخش مشاهده میشوند خازنهای تانتالیوم فیلتر نهایی و تثبیت کننده ولتاژ هسته GPU هستند.
در تصویر بالا در نمایی بسته 8 شریان تأمین کننده جریان مورد نیاز تراشه گرافیکی (GPU) این کارت گرافیک را به همراه 3 شریان تغذیه کننده انرژی مورد نیاز تراشههای حافظه (3 چوک اول از سمت چپ) را ملاحظه میکنید.
همانطور که میدانید مدلهای مرجع Geforce GTX 1070 تقریباً در اکثر بخشهای مدار تغذیه از خازنهای Tantalum بهره میبرند؛ اما GALAX همسو با اکثر شرکای تجاری کمپانی انویدیا اکثر این خازنها را با خازنهای جامد ژاپنی فوقالعاده باکیفیت و با عمر بسیار بالا تعویض کرده است. در واقع علیرغم عمر بسیار بالا و جریان نشتی بسیار کم، یکی از نقاط ضعف خازنهای Tantalum ظرفیت محدود آنها و تحمل کم در برابر جریانهای بالای شارژ و دشارژ است. به بیانی دیگر در اکثر مواقع نیز مهندسین طراح مدارهای الکترونیکی به دلیل کوچکتر بودن این خازنها تنها در زمانی که با محدودیتهای شدید فضا روبرو هستند و یا جریان نشتی ولو کم باعث ناپایدار شدن مدار میشود از این نوع خازنها استفاده میکنند. کمپانی GALAX با جایگزین کردن خازنهای جامد 1200uf به جای خازنهای تانتالیوم 470uf در عمل باعث پایداری بیشتر سطح ولتاژ و افزایش پتانسیل عبور جریان شده است.
ماسفت های به کار رفته در مدار رگولاتور ولتاژ تراشه گرافیکی (GPU) از نوع PowIRstage IR3555 ساخت کمپانی International Rectifier هستند. این چیپ ها هر 4 بخش مهم یک شریان کنترل شونده ولتاژ با تکنیک PWM، یعنی Driver MOSFET، Control MOSFET، Synchronous MOSFET و دیود شاتکی محافظ را بهصورت مجتمع درون خود جای دادهاند. همچنین به گفته کمپانی سازنده هر یک از این چیپ ها قابلیت تحمل 60A جریان DC را نیز دارا میباشند و در بدترین شرایط نیز بازدهی انرژی بسیار بالایی دارند.
علاوه بر این پشتیبانی از پروتکشن های VCC under voltage lockout (UVLO)، Over temperature protection (OTP)، Cycle-by-cycle self-preservation over current protection (OCP)، Preliminary overvoltage protection (Pre-OVP) و برخورداری از سخت افزار محلی لازم برای مانیتورینگ Real Time جریان خروجی و حرارت چیپ به همراه پشتیبانی از فرکانس PWM تا 1.0MHz از ویژگیهای ممتاز این ماسفت ها محسوب میشود.
در 3 شریان تأمین کننده ولتاژ تراشههای حافظه به دلیل جریان به مراتب پایینتر از ترکیب ماسفت های Low RDS-on مدل MDU1511 ساخت کمپانی Magnachip بهعنوان ماسفت های Low-Side و از مدل MDU1514 نیز بهعنوان ماسفت های High-Side استفاده شده است. توانایی تحمل جریان ID حداکثر 100A در دمای Tc=25c از جمله ویژگیهای ممتاز این ماسفت ها به شمار میرود.
در تصویر بالا تراشه PWM Controller مدل IR3595 ساخت کمپانی Infineon را ملاحظه میکنید. این تراشه که ذاتاً یک 8Phase Digital Multi-Phase GPU Controller است با پشتیبانی از تکنیک nVIDIA’s PWM VID control یکی از بهترین انتخابها برای کارتهای گرافیک رده بالای مبتنی بر پردازندههای گرافیکی کمپانی Nvidia محسوب میشود. همچنین پشتیبانی از فرکانس سوئیچینگ حداکثر 2MHz و پروتکشن های OVP, UVP, OC Warn, OCP, OT Warn و OTP از دیگر قابلیتهای این تراشه به شمار میرود.
مدیریت مدار 3Phase تراشههای حافظه نیز بر عهده تراشه 3l+1Phase Buck Controller مدل Up9509q ساخت کمپانی uPI Semiconductor است. از جمله امکانات ویژه این تراشه همراه داشتن MOSFET Driver با قابلیت Shoot-Through Protection و Bootstrap Schottky Diode بهصورت مجتمع در پکیج خود است.
در تصویر بالا نیز قطعات مدار رگولاتور ولتاژ بخش PLL این کارت گرافیک را ملاحظه میکنید. تراشه APW7142 ساخت کمپانی uPI Semiconductor که در واقع یک Synchronous-Rectified Buck Converter مدرن محسوب میشود به تنهایی به غیر قطعات مربوط فیلتر خروجی تمامی بخشهای یک مدار رگولاتور ولتاژ 1Phase را اعم از ماسفت های Low/High Side، تراشه PWM Controller و Mosfet Driver و سایر مدار محافظ را درون پکیج بسیار کوچک خود گنجانده است. از جمله ویژگیهای این تراشه منحصر به فرد میتوان به حداکثر جریان خروجی مستقیم 3A، حداکثر فرکانس سوئیچینگ 500KHz و بازدهی مصرف انرژی بیش از %95 اشاره کرد. در تصویر زیر میتوانید بلاک دیاگرام این تراشه همه کاره را ملاحظه میکنید:
یکی از قابلیتهایی که در مدلهای نسل قبلی کارتهای گرافیک سری HOF نیز مشاهده میشد سوئیچ Dual Bios است. اورکلاکرهای حرفهای میتوانند تنظیمات مورد نظر خود را در دو تراشه Bios جداگانه ذخیره و در کوتاهترین زمان ممکن آنها را فراخوانی کنند.
در تصویر بالا نیز DIP Switch سه پل تعبیه شده در پشت PCB را مشاهده میکنید. این سوئیچ در Extreme Overclocking و جهت غیرفعال کردن پروتکشن های OCP، OVP و OPP کاربرد دارد.
یکی از ملزومات دیگر اورکلاکرهای حرفه ای مانیتورینگ ولتاژ بخش های مختلف کارت گرافیک در حین این فرآیند است. GALAX در گوشه سمت راست PCB چهار گره مختلف جهت نمونه برداری ولتاژ هسته GPU، تراشه های حافظه، PCI و ولتاژ 5 ولت در نظر گرفته است.
در تصویر بالا نیز قلب این کارت گرافیک یا همان پردازنده گرافیکی (GPU) مدل GP104-200 را ملاحظه میکنید. در این GPU همانطور که اشاره شد 7.2 میلیارد ترانزیستور که بر پایه تکنولوژی 16nm FinFET کمپانی تایوانی TSMC ساخته شدهاند بر روی Die بهاندازه 314mm² مجتمع شدهاند.
بر خلاف مدل مرجع کمپانی GALAX از تراشههای حافظه GDDR5 ساخت کمپانی آمریکایی MICRON در این کارت گرافیک استفاده کرده است. هر یک از این تراشهها دارای حجم (8Gb (1GB و رابط 32bits هستند که روی هم رفته هشت عدد از آنها 8GB حافظه GDDR5 8000MHz با رابط کلی 256bits و پهنای باند معادل 256GB/s برای تراشه گرافیکی قدرتمند این کارت گرافیک فراهم میکنند.
متد و سیستم تست
-
متد و سیستم تست
تستهای کارت گرافیک در لابراتوار تخصصی شهر سخت افزار بهصورت کلی به چند بخش تقسیم میشوند:
- تستهای حرارتی
- تستهای مدیریت مصرف انرژی (توان مصرفی کل سیستم)
- تستهای کارایی (GPGPU (General Purpose Graphics Processing Unit
- تستهای کارایی گیمینگ
- تست اورکلاکینگ
برای مقایسه نتایج نیز از نتایج موجود در آرشیو لابراتوار استفاده شده است.
در جدول زیر مشخصات فنی سیستم Testbed لابراتوار شهر سختافزار را ملاحظه میکنید:
پارامترهای Bios در حالت پیشفرض تنظیمشدهاند (بهاستثنای فعال کردن قابلیت XMP)، دمای محیط در حین تست بهصورت ثابت بر روی 25 درجه سانتیگراد (با تلورانس 1 درجه) تثبیت شده و تنظیمات مدیرت مصرف انرژی در سیستمعامل نیز در وضعیت Balanced تنظیمشده است. همچنین تمامی نرم افزارهای امنیتی و قابلیت Windows Defender نیز غیرفعال شدهاند.
لازم به ذکر است تکنولوژی NVIDIA PhysX موجود در کارتهای گرافیک Geforce در تمامی تستهای کارت گرافیک لابراتوار غیرفعال شده است.
همچنین لیست نرمافزارهای Benchmark، Monitoring و Game ها که مبتنی API های مدرن DirectX 11، DirectX 12 و OpenGL میباشند به این شرح است:
- 3DMark Download v2.1.2973 + Time Spy
- 3DMARK 11 v1.0.132
- GTA V
- Crysis 3
- Call of Duty Black Ops III
- Battlefield Hardline
- Batman Arkham Knight
- Quantum Break
- Ashes of the Singularity
- Bioshock Infinite
- GRID 2
- Dirt Rally
- Sniper Elite III
- The Witcher 3 - Wild Hunt
- Unigine Valley 1.0
- Unigine Heaven 4.0
- Assassins Creed Syndicate
- AIDA64 Extreme Edition 5.75.3900
- SiSoftware Sandra Business 2016.03.22.20
- GPU-Z 1.9.0
- FurMark 1.18.0
در تصویر زیر نیز مشخصات فنی GALAX Geforce GTX 1070 HOF 8GB را از نگاه نرمافزار GPU-Z ملاحظه میکنید:
همچنین ولتاژ هسته GPU نمونه برداری شده توسط ولتمتر دیجیتال در این کارت گرافیک همانند مدل مرجع در وضعیتهای Idle و Load کامل در شرایط مختلف به ترتیب حداقل 0.625V و حداکثر 1.062V ثبت شد.
حداکثر فرکانس هسته GPU نیز در حالت Boost در این مدل 2025MHz ثبت شده است.
متد تستهای کارایی
در این بخش آخرین و معتبرترین نرمافزارهای تست و محک کارت گرافیک به همراه بازیهای رایانهای روز را برای تست کارتهای گرافیک انتخاب کردیم.
تنظیمات گرافیکی در تمامی گیم ها بر روی حداکثر مقدار ممکن تنظیم شده است. البته تنظیمات گرافیکی منحصر به تراشههای گرافیکی Nvidia و یا AMD در تمامی گیم ها غیرفعال شدهاند.
تمامی تستهای Gaming در 4 رزولوشن و تکنیکهای Anti-Aliasing مختلف صورت گرفته است. کانفیگ های نامبرده به شرح زیر میباشند:
- 1600x900 – 0X MSAA
- 1920x1080 – 2X MSAA
- 2560x1440 – 4X MSAA
- 3840x2160 – 8X MSAA
علت اصلی انتخاب کانفیگ های بالا شبیهسازی شرایط برای نمایشگرهای مختلف با سایزهای مختلف بوده است. به این صورت که کانفیگ اول شرایط را برای مانیتورهای کوچکتر از 20 اینچ، کانفیگ دوم برای مانیتورهای 22 تا 25 اینچ، کانفیگ سوم برای مانیتورهای 25 اینچ و بزرگتر و کانفیگ چهارم نیز شرایط را برای نمایشگرهای فوقالعاده باکیفیت و مدرن 4K شبیهسازی میکنند.
البته در برخی گیم ها که فاقد 8X Multisample anti-aliasing بودند یا از تکنیکهای مشابه Anti-Aliasing استفاده میکنند، یا از همان 4X MSAA برای تست رزولوشن 4K استفاده شده و یا از تکنیکهای مشابه ولی با نسبتهای مختلف استفاده شده است. لازم به ذکر است که مقادیر مربوطه در نمودارهای مرتبط درج شده است.
نورپردازی تحت عنوان HOF Lighting
-
نورپردازی تحت عنوان HOF Lighting
همانطور که در بخش معرفی اولیه و نگاه نزدیکتر این بررسی به آن اشاره شد این کارت گرافیک نیز همانند برخی از مدلهای مشابه از کمپانیهای رقیب به سامانه نورپردازی با استفاده از RGB LED مجهز شده است. البته این نورپردازی در حد نور پس زمینه برند تجاری Hall Of Fame در دو بخش مختلف بخش فوقانی این کارت گرافیک محدود شده است.
در نسخه جدید نرم افزار Xtreme Tuner PLUS که جهت کنترل و مدیریت پارامترهای مختلف کارتهای گرافیک کمپانی GALAX طراحی و کد نویسی شده است یک بخش اختصاصی تحت عنوان Lighting برای کنترل رنگ و جلوههای نورپردازی کارتهای گرافیک مجهز به این سامانه در نظر گرفته شده است. در این نرم افزار به غیر از حالت رنگ ثابت که قادر به انتخاب 16.8 میلیون رنگ برای آن خواهید بود 3 جلوه نورپردازی دیگر نیز پیش بینی شده است.
همچنین در حالت روشنایی متغیر نور RGB LED های تعبیه شده در این سامانه، 3 پارامتر مختلف نظیر سرعت چرخش فنها، حرارت و میزان بار بر روی GPU میتوانند عامل تغییر روشنایی باشند.
در تصاویر زیر نیز برخی رنگهای نورپردازی این کارت گرافیک به تصویر کشیده شده است:
تستهای مدیریت مصرف انرژی، حرارتی و نویز صوتی
-
تستهای مدیریت مصرف انرژی، حرارتی و نویز صوتی
در این سه تست توان مصرفی کل سیستم (به وسیله دستگاه Wattmeter)، حداکثر حرارت هسته GPU مانیتور شده توسط نرمافزار GPU-Z و نویز سنجیده شده توسط دستگاه Sound Meter تعبیه شده در فاصله 1 متری سیستم را در دو وضعیت زیر ثبت کردیم:
- پس از 15 دقیقه بیباری کامل سیستم (Idle)
- پس از 15 دقیقه Load کامل کارت گرافیک توسط تست GPU Stress نرمافزار FurMark در رزولوشن Full HD
حقیقتاً کارتهای گرافیک مبتنی بر معماری Nvidia Pascal در حال حاضر بهترین نمونههای موجود در بازار از نظر بازدهی مصرف انرژی هستند. در نمودار بالا به روشنی مشخص است که علیرغم اینکه Geforce GTX 1070 بیش از %40 کارایی بالاتری نسبت به مدل مشابه نسل قبل خود دارد (Geforce GTX 970) اما در عمل بیش از %25 انرژی کمتری مصرف میکند. به بیانی دیگر نسبت کارایی به توان مصرفی در نمونه نسل جدید بیش از 2 برابر بهتر شده است! ما این نتیجه را نوعی جادوگری برداشت میکنیم! شما چطور؟!
طبق محاسبات ما این کارت گرافیک اورکلاک شده نسبت به مدل مرجع که به گفته انویدیا دارای TDP حداکثر 150W است، حدود 80W مصرف بیشتری دارد. در نتیجه اگر قصد تعبیه این مدل در یک سیستم مدرن و رده بالا را دارید پیشنهاد میکنیم حداقل از یک پاور استاندارد با توان واقعی 550W الی 600W استفاده کنید. همچنین در صورتی که از پیکربندیهای دوگانه SLI نیز استفاده میکنید به شما پاوری با توان واقعی حداقل 750W الی 800W توصیه میکنیم.
نکته قابل تأمل دیگر در این تست مصرف انرژی مراتب بیشتر GALAX Geforce GTX 1070 HOF هم در حالت Idle و هم در حالت Load در مقایسه با مدلهای مشابه از کمپانی رقیب است. عاملی که روی هم رفته باعث کاهش بیش از %30 بازدهی مصرف انرژی این مدل در مقایسه با مدل مرجع این کارت گرافیک شده است. در واقع به دلیل محدودیتهای کمتر در نظر گرفته شده برای کارتهای گرافیک مخصوص اورکلاک در بخش مدیریت مصرف انرژی معمولاً شاهد چنین نتایجی از آنها هستیم.
باوجود توان مصرفی نسبتاً بالاتر این مدل نسبت به مدلهای مشابه اما کولر این غول بی شاخ و دم آنقدر قدرتمند هست که هم در تستهای حرارتی و هم از نظر نویز صوتی در زمره بهترینها قرار گیرد. البته فن این مدل بر خلاف رقبای هم ردهاش فاقد وضعیت 0dB است و در حالت Idle کماکان روشن میماند، اما آنقدر بیصداست که مطمئناً سر و صدای سایر فنهای سیستم بر آن قالب میشوند.
تستهای GPGPU با استفاده از نرم افزارهای AIDA64 5.75 و SISoftware Sandra 2016
-
تستهای GPGPU با استفاده از نرم افزارهای AIDA64 5.75 و SISoftware Sandra 2016
علاوه بر کاربردهای Gaming کارتهای گرافیک، برخی نرم افزارهای فنی و مهندسی و البته چند رسانهای نظیر نرم افزارهای CAD و ویرایش صوت و تصویر و ویدئو مانند مجموعههای نرم افزاری کمپانی Adobe با استفاده از برخی API های استاندارد مانند OpenCL و انحصاری مانند Nvidia CUDA فرآیند پردازش اطلاعات را بهطور بسیار محسوس و حتی بر برخی موارد خیره کننده تسریع میبخشند. این نوع نرم افزارها با استفاده از الگوریتمهای بسیار مدرن و هوشمند بار پردازش اطلاعات خود را تا حد ممکن به چند صد رشته مختلف تقسیم میکنند تا صدها Stream Processor و یا CUDA Core تعبیه شده در GPU کارتهای گرافیک با سرعت به مراتب بیشتر از CPU فرآیند پردازش اطلاعات پیچیده و زمان بر آنها را بر عهده بگیرند.
در این تست ابتدا با استفاده از بخش GPGPU Benchmark نرم افزار AIDA64 کارایی خام کارتهای گرافیک را در محاسبات ممیز شناور (Floating-Point) به صورت Single-precision یا 32bits و Double-precision یا 64bits با استفاده از API فراگیر OpenCL میسنجیم. سپس با استفاده از تستهای استاندارد نرم افزار SISoftware Sandra و البته دوباره با کمک رابط برنامه نویسی OpenCL کارایی پردازش همه منظوره (GPGPU) کارتهای گرافیک را در الگوریتمهای شبیه سازی شده پردازش تصاویر و نرم افزارهای فنی مهندسی محک میزنیم.
همانطور که در نتایج تستهای مختلف ملاحظه میکنید علیرغم افزایش حدوداً 2 برابری کارایی Compute یا پردازش همه منظوره در Geforce GTX 1070 نسبت به مدل مشابه نسل قبل (Geforce GTX 970) ولی کماکان عملکرد پایین مخصوصاً در تستهای Double-precision یا 64bits در مقایسه با مدلهای مشابه مبتنی بر تراشههای گرافیکی کمپانی AMD یکی از بزرگترین نقاط ضعف کارتهای گرافیک مبتنی بر معماری Pascal با تراشه GP104 محسوب میشود؛ اما اگر از حیث مقایسه عملکرد این مدل با مدلهای مشابه از کمپانیها رقیب به موضوع نگاه کنیم مدل کمپانی ASUS به دلیل داشتن حداکثر فرکانس Boost بالاتر نسبت به مدل GALAX در اینگونه تستها که مدت زمان اجرای آنها کوتاه است بهصورت نامحسوس عملکرد ضعیفتری خواهد داشت ولی مطمئناً به دلیل تجهیز به کولر قدرتمندتر و محدودیتهای مدیریت مصرف انرژی کمتر در تستهای طولانی مدت که در آنها حرارت و مصرف انرژی GPU به حداکثر مقادیر تعیین شده نزدیک میشود شاهد عملکرد بهتری از GALAX Geforce GTX 1070 HOF خواهیم بود.
تستهای (3DMARK 11/Fire Strike/Time Spy (DirectX 12
-
تستهای (3DMARK 11/Fire Strike/Time Spy (DirectX 12
سری نرمافزارهای 3DMARK کمپانی Futuremark از سال 1999 تاکنون، بدون شک یکی از محبوبترین و معتبرترین نرمافزارهای تست کارایی کارتهای گرافیک بودهاند.
شاید منحصربهفردترین ویژگی نتایج تستهای این دو نرمافزار ایزوله بودن نتایج تستهای GPU و CPU میباشد که نتایج تستهای هر یک از قطعات نامبرده شده را نسبت به دیگری متمایز میکند. این امر کمک میکند تا بر روی پلتفرمهای مختلف نتایجی حدوداً یکسان را برای یک مدل کارت گرافیک داشته باشیم. درنتیجه مقایسه بین مدلهای مختلف کارتهای گرافیک حتی در پلتفرمهای مختلف نیز با سهولت بیشتری انجام میشود.
در جدیدترین نسخه 3DMARK با اضافه شدن تست Time Spy قابلیت سنجش کارایی کارتهای گرافیک در API جدید، بسیار مدرن و البته پربازده DirectX 12 نیز فراهم شده است. همانطور که در جدول زیر مشاهده میکنید به واسطه موتور گرافیکی ناب و بسیار کارآمد این تست، تمامی منابع مرتبط با رئوس، تکنیکهای پیاده سازی Tessellation و فراخوانی Compute Shader ها در سنگینترین و پیچیدهترین حالت ممکن صورت میگیرد تا تمامی تکنولوژیهای جدید پیاده سازی شده در DirectX 12 به بهترین نحو ممکن کفایت و کارایی خود را در عمل ثابت کنند.
به روشنی مشخص است که کارایی Geforce GTX 1070 نسبت به نمونه مشابه نسل قبل خود (Geforce GTX 970) بیش از 50% افزایش داشته است! اما همانطور که در تست قبل به آن اشاره شد GALAX Geforce GTX 1070 HOF به دلیل تجهیز به کولر قدرتمندتر و محدودیتهای مدیریت مصرف انرژی کمتر در تستهای طولانی مدت که در آنها حرارت و مصرف انرژی GPU به حداکثر مقادیر تعیین شده نزدیک میشود عملکرد بهتری از خود ارائه کرده است!
تست گیمینگ - (Ashes of the Singularity (DirectX 12
-
(Ashes of the Singularity (DirectX 12
بازی کامپیوتر Ashes of the Singularity یکی از بازیهای سبک استراتژیک است که توسط Oxide Games طراحی و ساخته شده و بهتازگی توسط کمپانی Stardock برای پلتفرم PC به بازار عرضه شده است. در قرن 21, انسانها توانستهاند به فناوری به نام Hailee دست پیدا کنند که آنها را برای خلق آینده بشریت کمک میکند. با استفاده از این فناوری، بشریت قادر است بهسرعت در سایر فناوریها به پیشرفتهای بزرگی دست پیدا کند و به نقطهای از تاریخ دست یابد که هیچکس حتی تصورش را هم نمیکند. به عنوان فن آوری های پیشرفته، انسانها سعی کردند تا آگاهی خود را فراتر از محدوده مشخص شده گسترش دهند. در ابتدا، انسان بدن طبیعی خود را نگه میداشت در حالی که ذهن خود را به صورت یکپارچه و به عنوان یک منبع محاسباتی واقع در شبکهای گسترده قرار میداد. طولی نکشید که انسانها به سطحی از علم رسیدند که دیگر نیازی به بدن برای تعامل با محیط اطراف نبود. حالا بشریت وارد عصر طلایی جدیدی شده است. گرافیک قابل قبول، مأموریتها مختلف همراه سطوح دشواری متنوع، استفاده از سلاحها و تجهیزات پیشرفته و موسیقی متن گوشنواز تنها بخشی از ویژگیهای منحصر به فرد این بازی است. Ashes of the Singularity موتور گرافیکی Nitrous را با خود به همراه دارد و جزء اولین بازیهای مبتنی بر API جدید DirectX 12 محسوب میشود. بازدهی بالای موتور گرافیکی این بازی در فرآیند پردازش نام همزمان (Async compute) از جمله ویژگیهای منحصر به فرد آن محسوب میشود.
یکی دیگر از نقاط ضعف تراشههای گرافیکی مبتنی بر معماری Pascal همانند Maxwell ضعف آنها در محاسبات بهاصطلاح Async Compute یا ناهمزمان است. محاسباتی که پردازش کارآمد آنها در گیم ها و برنامههای مبتنی بر DirectX 12 نقش مهمی در افزایش بهرهوری کارایی نهایی خواهد داشت. در نمودارهای بالا ملاحظه میکنید که در این گیم به دلیل حجم بالای محاسبات ناهمزمان، Geforce GTX 1070 نتوانسته تمامی تواناییهای خود را ارائه کند و این تراشههای گرافیکی AMD هستند که در اکثر گیم های مبتنی بر DirectX 12 پیروز میدان هستند. در این نمودارها نیز مشاهده میکنید که در رزولوشنهای بالا و سنگینتر شدن تست این GALAX Geforce GTX 1070 HOF است که بهتر از سایر رقبا ظاهر میشود. البته اختلاف میان تمام مدلهای مشابه آنقدر کم است که در عمل میتوان آن را نادیده گرفت.
تست گیمینگ - (Quantum Break (DirectX 12
-
(Quantum Break (DirectX 12
کمپانی پرافتخار Remedy Entertainment در همکاری با Microsoft Corporation اقدام به ساخت عنوانی بزرگ با نام Quantum Break نمودند که در سبک اکشن، ماجراجویی و شوتر سوم شخص با زمینه علمی-تخیلی طراحی شده و توسط Microsoft Studios برای کنسول Xbox One و سیستم عامل Windows منتشر شده است.
Quantum Break یک بازی فوقالعاده جذاب با ایدهای نوین است که در آن، سفرهای زمانی و دستکاری زمان، ویژگی اصلی گیم پلی بازی است. شما در نقش جک (Jack Joyce) ظاهر میشوید که توانایی کنترل زمان را دارد و با کمپانی نابکاری که قصد پایان زمان را دارد، وارد مبارزه میشود. لحظات حماسی ویرانگری در قالب زمان فریز میشوند و صحنههایی بینظیر از مبارزه را خلق میکنند. تصمیمات شما بر بخشهای مختلف بازی اثر میگذارد، ولی به گفته کمپانی Remedy، بازی دارای پایانی منحصربهفرد است.
داستان Quantum Break که در بستر گذر و فریز زمان نوشته شده، با حضور ستارههای فیلمهای X-men؛ Game of Thrones؛ The Wire و ... جذابیت دوچندانی را برای شما به ارمغان میآورد.یکی از مهمترین نقاط قوت این بازی موتور بازی فوقالعاده مدرن Northlight Engine و برنامه نویسی سطح پایین مبتنی بر DirectX 12 است که آن را به یکی از مدرنترین بازیهای ویدئویی حال حاضر مبدل کرده است.
در این بازی مبتنی بر DirectX 12 نیز تقریباً اتفاق مشابه بازی Ashes of the Singularity تکرار شده است. همانطور که در نمودارها ملاحظه میکنید با بالاتر رفتن رزولوشن و پیچیدهتر شدن پردازش اطلاعات در نهایت در رزولوشن WQHD کارت گرافیک Geforce GTX 1070 8GB در رقابت با Radeon R9 FURY X 4GB جا میماند ولی در نهایت در رزولوشن UHD و آن هم به خاطر افزایش افسارگسیخته حجم بافتها این حافظه 8GB مدل Geforce است که موجب پیشی گرفتن مجدد Geforce GTX 1070 میشود.
تست گیمینگ - (GTA V (DirectX 11
-
(GTA V (DirectX 11
کمتر گیمری را میتوان پیدا کرد که تاکنون این بازی عظیم و سراسر هیجان را تا حالا تجربه نکرده باشد. سرانجام حدوداً 1.5 سال پس عرضه GTA V برای کنسولهای XBOX 360 و PlayStation 3 کمپانی Rockstar Games بالاخره این بازی پرطرفدار را برای PC Gamer ها نیز منتشر کرد.
اما GTA V را باید یک تحول دوباره و شاید حتی یک نقطه عطف برای راک استار نامید. عنوانی که در بدو ارائه به بازار توانست بهسرعت رکوردهای مختلفی را جابجا نماید. GTA V در دارای سه شخصیت اصلی میباشد که بازیکن میتواند در طول بازی هر کدام از این شخصیتها را انتخاب نموده، به سلیقه خود شخصی سازی کرده و یا با کسب امتیازاتی تواناییهای آنها را افزایش دهد. راک استار برای هر کدام از این شخصیتها داستانی در نظر گرفته که موجب پیچیدهتر و جذابتر شدن بازی شده است. البته بازی گهگاه از داستان اصلی دور میشود و بهطور کلی میتوان عدم یک داستان مطلوب با پایانی جالب توجه را از نقاط ضعف این بازی دانست. البته فراموش نکنید که داستان پیچیده این بازی که با شخصیت پردازی بینظیری هم همراه شده، برای آنکه بازیکن را بهسادگی به دنبال خود بکشد کاملاً جذابیتهای لازم را دارا میباشد.
در گیم های مبتنی بر DirectX 11 کارایی معماری Pascal بسیار فراتر از حد انتظار است! نکته جالب توجه در این تست عملکرد حیرت انگیز Geforce GTX 1070 8GB در رزولوشن UHD – 8X MSAA است! جایی که عملکرد سامانه فشرده سازی رنگ در Pascal و همین طور 8GB حافظه این کارت گرافیک در عمل خود را نشان دادهاند. این در حالی است که تمامی مدلهای 4GB به دلیل کافی نبودن حافظه Frame Buffer یا با خطای درایور مواجه شدهاند و یا عملکردی کمتر از 5FPS داشتند.
تست گیمینگ - (Assassin's Creed Syndicate (DirectX 11
-
(Assassin's Creed Syndicate (DirectX 11
Assassin's Creed Syndicate یک بازی ویدئویی تاریخی در سبک اکشن ماجرایی و مخفیکاری است که بهوسیله? یوبیسافت توسعه یافته و توسط همان کمپانی نیز عرضه شده است. این بازی در ?? اکتبر ???? برای کنسولهای نسل هشتم، پلیاستیشن ? و ایکس باکس وان و در ?? نوامبر ???? نیز برای مایکروسافت ویندوز عرضه شد. این نهمین قسمت از مجموعه اصلی Assassin's Creed به شمار میرود که داستان آن ?? سال پس از اتفاقات نسخه? Assassin's Creed Unity رخ میدهد. این نسخه نیز همانند دیگر بازیهای مجموعه در سبک اکشن ماجرایی، با دید سوم شخص و به صورت جهان باز میباشد و همچنین امکانات جدیدی شامل سیستم جدید جهانگردی، بهبود عملکرد مبارزات و مخفیکاری و راندن وسا?ل نقل?ه از جمله کالسکه است. س?ح و ابزارها? جد?د? به باز? اضافه شده و همچنین بازیکن به صورت اختیاری قادر خواهد بود تا همانند بازی اتومبیل دزدی بزرگ ? هم در شخصیت جیکوب و هم در شخصیت ایوی بازی کند. به لطف موتور گرافیکی AnvilNext Engine که از نسخههای قبلی به Assassin's Creed Syndicate به ارث رسیده، پشتیبانی از اکثر قابلیتهای DirectX 11 و البته نورپردازی و کیفیت بسیار بالای بافتها در کنار سازگاری و بازدهی به مراتب بیشتر با سخت افزارهای مدرن از جمله ویژگیهای محوری این بازی محسوب میشوند.
تست گیمینگ - (Batman: Arkham Knight (DirectX 11
-
(Batman Arkham Knight (DirectX 11
Batman: Arkham Knight یک بازی ویدیویی در سبک اکشن-ماجراجویی است که توسط Rocksteady Studios و بر اساس داستانهای بتمن، ابرقهرمان کتابهای مصور DC Comics ساخته شده و توسط کمپانی برادران وارنر عرضه شده است. این نسخه چهارمین قسمت اصلی از سری بازیهای Batman: Arkham است و در ? ژوئن ???? برای مایکروسافت ویندوز، ایکس باکس وان و پلیاستیشن ? منتشر شد.
بازی در شهر آرکهام اتفاق میافتد که بهطور آزادانه (دنیای آزاد) قابل جستجو است. هنگام حرکت در مناطق مختلف از شهر نیازی به صبر کردن و لود شدن بازی نیست که با توجه به نقشه بزرگ نکته قابل اشارهای میباشد. بسیاری از گجتهای قبلی بازیهای بتمن همچنان در این نسخه نیز مورد استفاده قرار گرفته است، از این جمله میتوان به Grapnel gun, line launcher, batarangs و سیستم شناسایی و قدرت مقابله بتمن اشاره کرد. اسلحه "disruptor" برای از کار انداختن یا منجمد کردن اسلحه دشمنان و اسلحه "booby-trap" برای وارد کردن شوک به دشمنانی که هنوز مسلح و آماده نشدهاند مورد استفاده قرار میگیرند. بازیکنان با استفاده از شنل بتمن میتوانند در سراسر شهر پرواز کنند و در حالی که پرواز میکنند، از گجتهایی مانند batarangs و line-luncher استفاده کنند. همچنین یک وسیلهی جدید به نام voice synthesizer به گجت های بتمن اضافه شده که بتمن به وسیله آن میتواند صدای دشمنانش را تقلید کند و به افراد آنها دستورهای دروغین بدهد.
تواناییهای مبارزات تک به تک بتمن هم در این بازی گستردش یافته است. برای وارد کردن خسارت بیشتر به حریفان بتمن میتواند آنها را به اطراف پرتاب کند، اما قدرت و پیچیدگی حمله حریفان نیز در این بازی افزایش یافته است. در این نسخه قابلیت جدیدی بنام " fear takedown" معرفی میشود که بتمن (قبل از اینکه توسط حریفان شناسایی شود) میتواند تا حداکثر پنج دشمن را همزمان (زمان در این حرکت آهسته میشود) نابود کند.
موتور بسیار محبوب این بازی یکی از بروزترین نسخههای Unreal Engine است که طیف وسیعی از قابلیتهای متعدد واقعگرایانه DirectX 11 و فناوریهای اختصاصی GAMEWORK کمپانی Nvidia در آن پیاده سازی شده است. البته در این تست به دلیل همسان سازی جزئیات گرافیکی میان کارتهای گرافیک ساخت کمپانیهای AMD و NVIDIA تنظیمات مربوط به NVIDIA GAMEWORK غیر فعال شدهاند.
تست گیمینگ - (Battlefield Hardline (DirectX 11
-
(Battlefield Hardline (DirectX 11
نسخهی جدید بازی با عنوان Hardline به درگیریهای درون شهری میان دو گروه خلافکار و نیروهای ویژهی پلیس میپردازد. بدون شک انتخاب قالب بازی از طرف استودیوی در نظر گرفته شده برای ساخت نسخهی جدید بسیار هوشمندانه و نوآورانه به نظر میرسد. استودیوی کار کشتهی Visceral Games که همگان آن را با عنوان فوقالعاده Dead Space میشناسند این بار بر خلاف همیشه که DICE ساخت بازی را بر عهده داشت، وظیفهی به ارمغان آوردن یک میدان نبرد داغ دیگر را بر دوش میکشد.
در بخش تک نفره شاید یک بخش داستانی هستیم. همه چیز حول محور یک پلیس به اسم Nick Mendoza میچرخد. نیک یک افسر نیرو SWAT میباشد که درگیر مأموریتهای جنایی و تعقیب گریز میباشد که میتواند از راههای مختلف اهداف خود را دنبال کرده که این حالت میتوانید بهصورت مخفی باید یا خشونت کامل! در این قسمت ابزار جدیدی در اختیار بازی باز قرار گرفته که یکی Police Scanner در بازی معرفی شده است. Police Scanner میتواند افراد مظنون را پیدا کند و اشیا و شواهد مهم را علامت گذاری کنید. این اطلاعات بخشی از قسمت تک نفره Hardline هست. ولی همیشه بخش چندنفره Battlefield قسمت مهم این سری را تشکیل میدهد و بخش داستانی زیر سایه چندنفره قرار دارد. باید دید با وجود جزئیات جدید بخش تک نفره تا چه حد میتواند موفق باشد. گیم پلی بازی کمی فرق کرده و حالا نوع جدیدی را به نمایش میگذارد و تمرکز عمده بازی مبارزه پلیس با دزدها یا همان جنایت کارها میباشد. چیزی که در Hardline میبینید جناح پلیس در برابر گروهی از افراد خلاف کار در آمریکا هست. در بازی به کلی آیتم و وسیله دسترسی دارید که میتوانید از آن برای مبارزه استفاده کنید و همینطور از بالای به ساختمان به قسمت دیگر ساختمان با زیپ لاین عبور کنید. تخریب هم در این شماره حضور دارد و میتوانید از آن به نفع خود استفاده کنید و مرکز لس انجلس را با خاک یکسان کنید.
نسخه جدید این بازی با حفظ تمامی ویژگیهای نسخه قبل با استفاده از جدیدترین نسخه موتور گرافیکی Frostbite 3 جدیدترین ویژگیهای واقعگرایانه گرافیکی مبتنی بر DirectX 11 نظیر Tessellation و قدرت تفکیکپذیری بیشتر بافتها را همراه خود دارد.
تست گیمینگ - (Call of Duty Black Ops III (DirectX 11
-
(Call of Duty Black Ops III (DirectX 11
در این شکی نیست که سری بازیهای ندای وظیفه بدون شک یکی از محبوبترین بازیهای حال حاضر ژانر شوتر اولشخص محسوب میشوند. جدیدترین نسخه این بازی یعنی BO3 چهل سال بعد از BO2 اتفاق میافتد و در این بین شما شاهد این هستید که روباتهای کوچکِ نسخهی قبلی، تبدیل به چه هیولاهایی شدهاند! گیمپلی بازی به لطف سیستم پریدنهای AW بیشباهت به عناوین تخیلی همانند Crysis نیست و البته بسیار سریعتر هم شده است. در طول نمایشهای بازی شاهد چیزهایی هستید که در نسخههای قبلی هم بودند اما در اینجا به شکل متفاوتتری گنجانده شدهاند. همانند مبارزه در زیر آب که مشابه آن در CoD: Ghosts هم وجود داشت و در اینجا هم شما باید به دشمنانی که در مسیرتان در آب قرار میگیرند، تیراندازی کنید! همچنین تریارک سعی کرده که گیمپلی بازی دارای تخریب پذیری قابلتوجهی باشد و در تریلرها شاهد ریزش ساختمانها براثر جنگ هستیم. تغییرات عمدهای در سلاحهای بازی حاصل شده و شما حتی میتوانید از دست خود به عنوان یک سلاح گرم استفاده کنید و بهوسیلهی آن دشمنان را آتش بزنید! با این اوصاف میتوان گفت که شرایط گیمپلی بازی دیگر همانند قبل نیست و شما رسماً با یک بازی علمی تخیلی که بسیاری از تکنولوژیهای نظامی آن فعلاً به شکل گسترده کار گرفته نشده، مواجه خواهید شد. موتور گرافیکی این بازی نیز مثل نسخههای قبل همان IW Engine کهن سال است. یکی از نقاط ضعف این موتور حجم بافتهای افسارگسیخته آن است که حتی کارتهای گرافیک با 4GB حافظه اختصاصی را نیز در رزولوشنهای بالا به چالش میکشد!
تست گیمینگ - (The Witcher 3: Wild Hunt (DirectX 11
-
(The Witcher 3 Wild Hunt (DirectX 11
شرکتهای لهستانی امروزه بیش از قبل در صنعت بازی سازی مطرح هستند و شرکت CDPR پرچم دار آنهاست. تنها در طول چند سال باعرضه تعداد محدودی بازی این شرکت توانست در رده بزرگان قرار گیرد و توجه همگان را به خود جلب کرده است.
گیم پلی این نسخه برخلاف نسخههای قبل که برخی با آن مشکل داشتند این بار بدون شک یکی از نقاط قوت اصلی این بازی محسوب میشود و سازندگان بر روی گسترش دنیای بازی تمرکز داشتهاند و به بازیکن امکان انجام فعالیتهای متنوعی نظیر سوارکاری، شنا و قایق رانی داده شده و این بار بازیکنان میتوانند بیش از قبل در نقش یک Witcher به نقش آفرینی بپردازند آن هم با شکار موجودات متنوع در دنیایی وسیع. مکانیکهای نبرد در این سری از بازیها همیشه با انتقادهای مختلفی همراه بوده اما این بار سازندگان تمام تلاش خود را برای روان سازی نبردها کردهاند و جزئیات مختلف این تجربه را شیرین کرده است بهطور مثال Geralt بهطور خودکار سلاح مورد نیاز برای مبارزهاش را انتخاب میکند و شما حتی میتوانید تیرهای دشمنان را با شمشیر خود دفع کنید البته با افزایش قدرت و مهارت که تنها محدود به این کار نیست. همچنین در این نسخه امکان نبرد بر روی اسب نیز مهیا شده است و اسب شما نیز همانند شخصیت اصلی ابزارهای خود را دارد. بهطور مثال شما میتوانید زین بهتری برای اسبتان تهیه کنید تا هنگامی که با سرعت در حال سوارکاری هستید دیرتر خسته شود یا مثلاً با یک چشم بند میتوانید باعث شوید اسبتان دیرتر از صحنههای نبرد به خاطر ترسش بگریزد.
به لطف موتور گرافیکی REDEngine 3 این بازی از تمام قوای پردازندههای چند هستهای استفاده میکند و شما در صورتی که به دنبال نرخ فریم بالا هستید، باید تنها نگران کارت گرافیک خود باشید.
تست گیمینگ - (Sniper Elite III (DirectX 11
-
(Sniper Elite III (DirectX 11
نسخهی سوم این سری سعی دارد از کلیشههای معمول فاصله بگیرد و برای تحقق این نکته سازندگان دست به یک ریسک بزرگ زدهاند و لوکیشن اصلی بازی را از خیابانها و ساختمانهای ویران اروپا به صحرای گرم و سوزان آفریقا تغییر دادهاند. بازی در بازهی زمانی سال ???? تا ???? میلادی جریان دارد، جایی که شعلههای آتش این جنگ ویرانکننده به آفریقا نیز رسیده است و این قاره را نیز در کام آتش خود فرو برده است. گیمر در نقش یک تک تیرانداز قرار میگیرد که عضوی از نیروهای متفقین میباشد. دلیل انتخاب تک تیراندازی از نیروهای متفقین این بوده است که اولاً تک تیراندازها در نیروهای متفقین نقش بسیار مهمی ایفا میکردند و در بسیاری از مأموریتها نقشی کلیدی دارا بودند و از سوی دیگر شمال آفریقا تحت نفوذ نازیها میباشد و سادهترین راه برای ورود به مناطق آنها از طریق استتار و مخفی کاری است که این کار تنها از سوی یک تک تیرانداز قابل انجام میباشد. شخصیت اصلی بازی فردی به نام Karl Fairburne میباشد که از تک تیراندازان زبدهی نیروی OSS به شمار میآید. محیط بازی با توجه به فضای آفریقا طراحی شده است و با توجه به اینکه مناطق شمالی قارهی آفریقا دارای رشتهکوههایی میباشند در بازی نیز شاهد تپهها و کوههای بلندی هستیم که فضای مناسبی برای یک تک تیرانداز است.
این بازی که در ژانر شوتر سوم شخص طبقهبندی میشود همانند نسخه قبل از موتور Asura ساخت کمپانی Rebellion بهره میبرد. این بازی پرطرفدار در 27 جون 2014 برای PC و کنسولهای XBOX و PS4 منتشر شده است.
تست گیمینگ - (Crysis 3 (DirectX 11
-
(Crysis 3 (DirectX 11
سومین نسخه از شاهکار استودیو بازی سازی Crytek بدون شک یکی از واقعگرایانهترین و گرافیکیترین گیم هایی است که تاکنون منتشر شده است. این بازی به لطف موتور گرافیکی Cry Engine 3.0 و پشتیبانی کامل از تمامی ویژگیهای جدید Direct X 11 مانند Tessellation، Real -Time Area Light و کیفیت بسیار بالای بافتها بدون شک هر بینندهای را متحیر میکند. تمامی این ویژگیها باعث شده تا تنها با استفاده از کارتهای گرافیک High-End بتوان اجرای این بازی را در بالاترین جزئیات گرافیکی و قدرت تفکیکپذیری بالا تجربه کرد.
تست گیمینگ - (GRID 2 (DirectX 11
-
(GRID 2 (DirectX 11
این بازی بدون شک یکی از بهترین و موفقترین بازیهای Car Racing منتشر شده توسط کمپانی Codemasters میباشد. این نسخه گرافیکی چشم گیری دارد. بهطوری که نسخه یک خود را با تمام ضعفها پشت سر گذاشته و گرافیک خود را آنقدر زیبا جلوه داده که حتی در مقابل نسخه اول هزاران برابر بهتر است. تمام محیطهای مسابقه از شهرها و جادههای خاکی گرفته تا پیستها از جزئیات خوبی برخوردار هستند. هنگام مسابقه از زمین در جادههای خاکی گرد و خاک بلند میشود. آسمان هم برخلاف نسخه قبل پویا و دینامیک است. این همه زیبایی با موتور اختصاصی Codemasters یعنی Ego و مبتنی بر ویژگیهای جدید گرافیکی DirectX 11 ساخته شده است.
تست گیمینگ - (Dirt Rally (DirectX 11
-
(Dirt Rally (DirectX 11
بازی کامپیوتر DiRT Rally یکی از بازیهای سبک شبیه ساز و ورزشی است که توسط Codemasters Racing Studio طراحی و ساخته شده و توسط کمپانی Codemasters برای پلتفرم PC به بازار عرضه شده است. به جهان DiRT Rally خوش آمدید، دنیایی در بیابانهای سوزان. این نسخه که بهتازگی و زورتر از موعد مقرر در دسترس گیمرها قرار گرفته است، موتورهای جدید، مکانهای جدید، حالتهای جدید بازی و وسایل نقلیه جدید را شامل میشود و طبق گفته سازندگان بازی قرار است بهطور منظم بهروزرسانی شود. در این نسخه تمامی مهارتهای شما در رانندگی به چالش کشیده خواهد شد و مورد آزمون قرار خواهد گرفت. در طول مسیرهای پر پیچ و خم و خطرناک بهشدت مراقب سرعت خود باشید زیرا یک اشتباه ضررهای جبران ناپذیری به بار خواهد آورد. اگر تا پایان مسیر بتوانید بدون برخورد بهجایی به خط پایان برسید، پاداش قابل توجهی دریافت خواهید کرد. در هر مرحله تست جداگانه از شما گرفته خواهد شد، بهطوری که تفاوت سطوح مسابقات را بهخوبی درک کرده و در پایان مراحل به آنچنان مهارتی رسیدهاید که میتوانید در طیف گستردهای از انواع آب و هوا بهراحتی به رانندگی خود ادامه دهید. پس از پایان هر مرحله، وسیله نقلیه شما نیاز به رسیدگی دارد و اگر بهمرور توجهی به آن نشود، آسیب جدی به مکانیک ماشین وارد خواهد شد. گرافیک خیره کننده، تجربه 3 منطقه جدید، 36 مرحله چالش برانگیز، رانندگی در طول روز و در شرایط جوی خشک، ابری، آفتابی، مرطوب، بارانی و برفی و در طول شب، گذشت از شهرهای ولز و مونتکارلو، بیش از 20 مدل مختلف از ماشینهای کلاسیک، تغییر فیزیک رانندگی و بهبود گیم پلی، امکان استخدام چهار مهندس برای کار بر روی وسیله نقلیه و مناظر چشمنواز در کنار موسیقی متن گوشنواز تنها بخشی از ویژگیهای منحصر به فرد این بازی است.
این بازی نیز مثل نسخههای قبلی آن از موتور اختصاصی کمپانی Codemasters یعنی EGO Engine استفاده میکند. بدون شک عملکرد فوقالعاده کارآمد این موتور در عنوانهایی نظیر F1 و DRIT نیز بارها در عمل ثابت شده است.
این بازی از جمله عناوینی است که تکنیکهای فشرده سازی رنگ معماری Pascal بهخصوص در رزولوشن UHD و تکنیک 8X MSAA که افزایش وصف ناپذیر حجم بافتها را به دنبال دارد، به صورتی کاملاً محسوس نقش تعیین کنندهای در افزایش کارایی دارد.
تست گیمینگ - (Unigine Heaven v4.0 (DirectX 11
-
(Unigine Heaven v4.0 (DirectX 11
بنچ مارک Unigine Heaven v4.0 آخرین نسخه از این نرمافزار محسوب میشود که بر پایه موتور UNIGINE Engine یکی از بهترین و معتبرترین تستهای مبتنی بر DirectX 11 محسوب میشود. محیط گرافیکی بنچ مارک دهکدهای جادویی را شبیهسازی میکند که در آن انواع و اقسام بافتها مشاهده میشوند. از جمله ویژگیهای گرافیکی این بنچ مارک میتوان به hardware tessellation،global illumination و screen-space ambient occlusion اشاره کرد.
تست گیمینگ - (Unigine Valley Benchmark 1.0 (DirectX 11
-
(Unigine Valley Benchmark 1.0 (DirectX 11
نسخه Valley که جدیدترین بنچ مارک این کمپانی محسوب میشود در فضایی کاملاً متفاوت نسبت به نسخه قبل دنبال میشود. رندر تصاویر بسیار بدیع و زیبا از طبیعت سبز و کوهستان دست نخورده در کنار تکنولوژیهای واقعگرایانه نظیر dynamic sky، volumetric clouds، sun shafts، Depth Of Field و ambient occlusion در کنار قابلیت dynamic weather این بنچ مارک را به یکی از مدرنترینهای حال حاضر مبدل کرده است.
تست اورکلاکینگ به کمک نرم افزار GALAX Xtreme Tuner Plus
-
تست اورکلاکینگ به کمک نرم افزار GALAX Xtreme Tuner Plus
نوبتی هم باشد نوبت تست هیجان انگیز اورکلاکینگ است. برای این منظور از آخرین نسخه نرم افزار مخصوص اورکلاک کارت گرافیک انحصاری کمپانی GALAX یعنی Xtreme Tuner Plus کمک گرفتیم.
Xtreme Tuner Plus در مقایسه با نرم افزارهای مشابه از کمپانیهای رقیب شاید در ظاهر سادهتر به نظر برسد ولی امکانات کاربردی فراوانی را برای اورکلاکرها فراهم میکند. همانطور که در تصویر بالا ملاحظه میکنید امکانات این نرم افزار بهصورت کلی در 5 تب مجزا گنجانده شده است و البته مهمترین پارامترهای مانیتورینگ کارت گرافیک که شامل فرکانسهای هسته و تراشههای حافظه، سرعت چرخش فن و حرارت هسته GPU میشوند در بخش بالایی این رابط کاربری بهصورت ثابت گنجانده شدهاند. در تب 1CLICK OC همانطور که از اسم آن مشخص است 2 پروفایل از پیش تعیین شده اورکلاک و 1 پروفایل Silent mode برای گیمینگ در سکوت مطلق در نظر گرفته شده است که تنها با کلیک کردن بر روی آنها بلافاصله تنظیمات مورد نظر فراخوانی میشود.
در تب Overclock این قابلیت فراهم شده تا اورکلاکرها به پارامترهای مرتبط با فرکانسهای هسته GPU و تراشههای حافظه، سامانههای محدود کننده توان مصرفی، حرارت و نرخ FPS به همراه سرعت چرخش فن در محدوده بسیار وسیع و البته با دقت بالا دسترسی داشته باشند.
در تب ولتاژ نیز هر 3 پارامتر ولتاژ مهم که در دستیابی اورکلاکرها به فرکانسهای بالاتر مورد نیاز است یعنی ولتاژ هسته GPU، ولتاژ تراشههای حافظه و ولتاژ بخش PLL در دسترس است.
در تصویر بالا نیز بخشی از امکانات مانیتورینگ این نرم افزار را مشاهده میکنید.
اما ما قصد داشتیم تا حداکثر پتانسیل اورکلاکینگ این کارت گرافیک را محک بزنیم. به همین منظور حدوداً 1.5 ساعتی به تست و تغییر پارامترهای مختلف فرکانسی، ولتاژی، سرعت چرخش فن و البته کم کردن تأثیر محدود کننده توان مصرفی پرداختیم.
برای این منظور ابتدا ولتاژ هسته GPU، تراشههای حافظه و PLL را بر روی حداکثر مقدار ممکن تنظیم کردیم. سپس محدود کننده توان را نیز تا حداقل مقدار ممکن (120%) کاهش و محدودیتهای حرارتی را نیز تا 9 درجه سانتیگراد افزایش دادیم. در این وضعیت همانطور که ملاحظه میکنید در فرکانس توربو 1923MHz برای هسته GPU و 8968MHz برای حافظههای GDDR5 به مرز ناپایداری رسیدیم. این یعنی حدود 15% درصد اورکلاک هسته GPU و 12% درصد اورکلاک حافظه نسبت به فرکانس مدل مرجع که نتیجه خوبی محسوب میشود ولی در کل انتظارات ما از این مدل مخصوص اورکلاک به مراتب بیشتر از اینها بود؛ اما لازم میدانم 2 نکته را در مورد اورکلاک این کارت گرافیک بیان کنیم. مورد اول پتانسیل پایینتر تراشههای حافظه MICRON استفاده شده در این مدل نسبت به تراشههای SAMSUNG تعبیه شده در مدل مرجع و اکثر مدلهای مشابه است. مورد دوم نیز که البته کمی بیشتر برای ما عجیب است این موضوع است که این مدل حتی در فرکانسهای هسته GPU به مراتب بالاتر از این نیز کاملاً پایدار به نظر میرسید ولی این خطای مربوط به درایور بود که مانع از کامل شدن تستهای پایداری میشد. این در حالی است که در مدلهای مشابه هیچ گاه با این خطا روبرو نشده بودیم.
البته همانطور که در تصویر بالا ملاحظه میکنید در این وضعیت حداکثر فرکانس Boost از 1949MHz به مرز 2113MHz نیز رسیده است. همچنین در نمودارهای زیر میتوانید دمای GPU، نویز صوتی فن و توان مصرفی کل سیستم را در این وضعیت مشاهده کنید.
کاملاً مشخص است که با افزایش افسارگسیخته مصرف انرژی این کارت گرافیک، حداکثر حرارت GPU نیز بهصورت محسوس افزایش یافته است! اما با این وجود به دلیل کاهش محدودیتهای مربوط به حرارت GPU در تنظیمات اعمال شده در نرم افزار XTP کماکان نویز صوتی این مدل حتی در این وضعیت نیز در محدوده بسیار کم سر و صدا طبقه بندی میشود.
همچنین در تستهای زیر نیز میتوانید کارایی گیمینگ این کارت گرافیک را در چند تست مختلف مشاهده کنید:
جمع بندی، سخن پایانی و امتیاز شهر سخت افزار
-
جمع بندی، سخن پایانی و امتیاز شهر سخت افزار
بدون شک پردازندههای گرافیکی (GPU) مبتنی بر معماری Nvidia Pascal کارآمدترین و در عین حال قدرتمندترین تراشههای گرافیکی حال حاضر میباشند. همانطور که در تستهای حرارتی، توان مصرفی و اغلب تستهای کارایی مشاهده کردید عملکرد بعضاً حیرت انگیز این تراشههای گرافیکی مدرن و پربازده (از حیث کارایی نسبت به مصرف انرژی) جای هیچ بحث و حاشیهای را باقی نمیگذارد. ولی از سوی دیگر بر روی ضعف آنها نیز در گیم های مبتنی بر DirectX 12 و عملکرد ناکارآمد در پردازش دادههای ناهمزمان (Async Compute) نیز نمیتوان سرپوش گذاشت.
البته این در حالی است که در اکثر مواقع این تراشهها آنقدر قدرتمند هستند که حتی با وجود عملکرد ناکارآمد آنها در وضعیتهای نام برده باز هم در اکثر مواقع بهتر از قدرتمندترین تراشههای کمپانی رقیب عمل میکنند. همچنین اگر کاربردهای شما بهگونهای است که محاسبات GPGPU و بهخصوص نوع FP64 یا Double-precision آن نقشی تعیین کنندهای را بازی میکنند اکیداً به شما توصیه میکنیم که به هیچ به سراغ کارتهای گرافیکی مجهز به تراشههای گرافیکی GP104 و ضعیفتر، با معماری Pascal نروید.
اما اگر با دیدی کلی به GALAX Geforce GTX 1070 HOF 8GB بنگریم همانطور که در تمامی تستها ملاحظه کردید با یک کارت گرافیک بینهایت زیبا، فوقالعاده باکیفیت و البته تا حدودی قلدر روبرو هستیم. PCB 12 لایه و طراحی بینظیر آن، قطعات در کلاس صنعتی به کار رفته در مدار رگولاتور ولتاژ، کولر بسیار قدرتمند و فوقالعاده کم صدا به همراه کارایی تحسین برانگیز آن در تستهای کارایی، حرارتی و نویز صوتی در کنار امکانات خاص تعبیه شده در آن جهت Extreme Overclocking از جمله نقاط قوت این غول بی شاخ و دم محسوب میشوند.
اما از سوی دیگر بازدهی پایین مصرف انرژی در این مدل نسبت به مدل مرجع موضوعی است که نمیتوان به راحتی از کنارش گذشت. همچنین در حین اجرای تستها مخصوصاً در رزولوشنهای پایین در برخی اوقات با پدیده Coil Whine یا همان صدای وزوز و سوت کشیدن چوک های این کارت گرافیک رو برو بودیم! پدیدهای که در برخی از کارتهای گرافیک رده بالا و البته پرمصرف کموبیش مشاهده میشود. البته این صدا در رزولوشنهای بالا و سنگینتر شدن تستها تا حد بسیار زیادی کم و شنیدن آن سخت میشد ولی به هر حال یکی از نقاط ضعف این مدل بهحساب میآید.
بهعنوان سخن پایانی در صورتی که اورکلاکر هستید و به دنبال شکستن رکوردها و یا گیمر هستید و به دنبال داشتن بهترینها خرید این کارت گرافیک 2 میلیون تومانی که البته در مقایسه با مدلهای مشابه قیمت بسیار خوبی نیز دارد را همه جور به شما پیشنهاد میکنیم.
نقاط قوت
- طراحی بینظیر و کیفیت ساخت فوقالعاده بالا
- عملکرد و کارایی فوقالعاده در برابر قیمت
- کارکرد خنک و در عین حال کمصدا
- پتانسیل بسیار بالا در Extreme Overclocking
- همراه داشتن 8GB حافظه گرافیکی
- پشتیبانی از خروجی تصویر HDMI 2.0 و DisplayPort 1.4
نقاط ضعف
- خروجی تصویر DVI-D این کارت گرافیک فاقد سیگنال آنالوگ (VGA) است
- عملکرد GPGPU بهخصوص در پردازش اطلاعات بهصورت Double-precision ناامید کننده است
- عملکرد ضعیف در تستهای مدیریت مصرف انرژی
- چوک های مدار رگولاتور ولتاژ در وضعیت Load کمی وزوز میکنند (Coil Whine)
با تمامی این تفاسیر کارت گرافیک "GALAX Geforce GTX 1070 HOF 8GB" موفق به کسب امتیاز ممتاز 9.4، نشان " Editors' Choice" و ریز امتیازات زیر در کلاس محصولات (H (High-End از لابراتوار شهر سختافزار شد.
GALAX Geforce GTX 1070 HOF 8GB
کلاس عرضه : گران قیمت / رده بالا9.5بستهبندی9کارایی10کیفیت ساخت و طراحی9.5اورکلاکینگ9.5امکانات و سازگاری9ارزش خرید9.4امتیاز شهرسختافزارنشان شهرسختافزار9.4نکته مهم: تمامی مراحل نگارش این بررسی اعم از تست ها، عکس ها، ویدئوها، نمودارها و تحلیل ها همگی در لابراتوار تخصصی شهرسخت افزار انجام شده است. این بررسی هیچ منبع داخلی و خارجی ندارد.
در صفحه بعد نیز میتوانید گالری کاملی از تصاویر مربوط به این کارت را مشاهده کنید.
گالری تصاویر
-
گالری تصاویر
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت