اگر خاطرتان باشد چندی پیش با مقاله "معرفی کامل معماری nVIDIA Pascal" تقریباً اکثر ویژگیها و قابلیتهای جدید این معماری بسیار مدرن را تشریح کردیم. حال نوبت آن رسیده که در عمل کارتهای گرافیک مبتنی بر این معماری را به صورت موشکافانه نقد و بررسی کنیم. در این بررسی قصد داریم تا مدل تا خرخره اورکلاک شده سری STRIX ساخت ASUS که با مدل تجاری ROG STRIX-GTX1070-O8G-GAMING به بازار عرضه شده است را از زوایای مختلف بررسی کنیم. با ما همراه باشید...
مقدمه
اگر خاطرتان باشد چندی پیش با مقاله "معرفی کامل معماری nVIDIA Pascal" تقریباً اکثر ویژگیها و قابلیتهای جدید این معماری بسیار مدرن را تشریح کردیم. حال نوبت آن رسیده که در عمل کارتهای گرافیک مبتنی بر این معماری را به صورت موشکافانه نقد و بررسی کنیم. همانطور که اطلاع دارید کارتهای گرافیک مبتنی بر این معماری با مدل تجاری GTX 10xx معرفی شدهاند و تا به امروز و به صورت رسمی مدل Geforce GTX TITAN X Pascal 12GB به عنوان پرچم دار، مدلهای Geforce GTX 1080 8GB و Geforce GTX 1070 8GB به عنوان کارتهای رده بالای گیمینگ این معماری و Geforce GTX 1060 3GB/6GB نیز به عنوان مدل میان رده این خانواده روانه بازار شدهاند.
البته زمزمههایی نیز مربوط به معرفی مدل بسیار قدرتمند Geforce GTX 1080 Ti 12GB که مدل محدود شده Geforce GTX TITAN X Pascal محسوب میشود و کارت گرافیک فوقالعاده خوش قیمت و اقتصادی Geforce GTX 1050 Ti در ماههای پیش رو شنیده میشود. این چند مدل معرفی شده به صورت کلی دارای 3 تراشه گرافیکی (GPU) مختلف هستند. مدلهای پرچم دار به تراشه بسیار قدرتمند GP102 با بیش از 3584 CUDA Core مجهز شدهاند. مدلهای رده بالا تراشه بسیار کارآمد GP104 مجهز به حداکثر 2560 CUDA Core را با خود به همراه دارند و تنها مدل میان رده این معماری نیز با تراشه GP106 و 1280 CUDA Core عرضه شده است.
مدلهای رده بالای مبتنی بر این معماری همانند روال پیشین کمپانی انویدیا شامل یک مدل با امکانات و قابلیتهای کامل ولی با قیمت نسبتاً بالا (Geforce GTX 1080) و یک مدل تا حدودی محدود شده ولی با قیمت بسیار مناسب و وسوسه کننده (Geforce GTX 1070) میشوند.
در واقع Geforce GTX 1070 8GB حدوداً 400 دلاری تنها با 640 CUDA Core کمتر، برخورداری از حافظههای GDDR5 8000MHz به جای حافظههای GDDR5X 10000MHz به کار رفته در Geforce GTX 1080 و حدوداً 100MHz فرکانس پایه کمتر GPU بیش از 37% از Geforce GTX 1080 8GB با قیمت حدودی $640 ارزانتر است. این در حالی است که در تستهای عملی اختلاف کارایی بین این دو مدل به صورت میانگین حداکثر 20% است. این بدین معناست که همواره برای داشتن بهترینها باید هزینه به مراتب بیشتری بپردازید؛ اما در صورتی که همواره به دنبال خرید قطعات مقرون به صرفه و با نسبت کارایی به قیمت بالا هستید Geforce GTX 1070 8GB انتخاب زیرکانهتری محسوب میشود.
ASUS نیز چند سالی میشود که بخش مربوط به طراحی و ساخت کارتهای گرافیک خود را به کلی متحول کرده است، هم اکنون که در حال نگارش این بررسی هستیم 6 مدل مختلف مرجع و اورکلاک شده از مدل Geforce GTX 1070 8GB را در تحت عنوانهای Founders Edition، TURBO و STRIX ساخته و پرداخته و روانه بازار کرده است. در این بین مدلهای سری STRIX به واسطه کولر بسیار قدرتمند و بیصدا، قطعات بسیار باکیفیت و مدرن به کار رفته در این سری، نورپردازی به وسیله RGB LED به همراه اورکلاک کارخانهای قابل توجه، بهترین، خاصترین و البته گران قیمتترین اعضای این مجموعه محسوب میشوند.
در این بررسی قصد داریم تا مدل تا خرخره اورکلاک شده سری STRIX این مدل که با مدل تجاری ROG STRIX-GTX1070-O8G-GAMING به بازار عرضه شده است را از زوایای مختلف بررسی کنیم. باید دید که این کارت گرافیک 450 دلاری چگونه از پس تستهای مختلف لابراتوار شهر سخت افزار بر خواهد آمد!
برای همین منظور برای یادآوری هم که شده ابتدا به معرفی معماری Nvidia Pascal و تشریح مهمترین ویژگیها و قابلیتهای آن میپردازیم، سپس شما را با تراشه گرافیکی (GPU) به کار رفته در این کارت گرافیک (GP104-200) آشنا میکنیم. در ادامه نیز پس از معرفی و بررسی سخت افزاری این کارت گرافیک و تشریح بخشهای مختلف آن با تستهای کارایی گیمینگ و GPGPU، تستهای حرارتی، نویز صوتی و مدیریت مصرف انرژی و در نهایت تستهای اورکلاکینگ عیار کیفیت و کارایی این مدل را از ابعاد مختلف محک میزنیم. با ما همراه باشید.
نکته مهم: تمامی مراحل نگارش این بررسی اعم از تست ها، عکس ها، ویدئوها، نمودارها و تحلیل ها همگی در لابراتوار تخصصی شهرسخت افزار انجام شده است. این بررسی هیچ منبع داخلی و خارجی ندارد.
معرفی معماری nVIDIA Pascal (بخش اول)
مقدمه و تشریح معماری
اگر بخواهیم با یک دید کلی در مورد معماری جدید Pascal انویدیا اظهار نظر کنیم میتوان اینگونه بیان کرد که معماری پاسکال (معماری پیاده سازی شده در تراشه GP104) به نوعی ترکیبی از تکنولوژیهای قبلی و جدید انویدیا محسوب میشود. معماری Maxwell و محصولات مبتنی بر آن بدون شک یکی از موفقترین پروژههای این کمپانی چه در سطح مصرف کنندگان عادی و چه در سطح حرفهای و محصولات Workstation محسوب میشدند و همین امر باعث شده تا انویدیا در محصولات مصرف کنندههای عادی (برای مثال Gamer ها و کاربران عادی) مبتنی بر معماری Pascal را نیز با کمترین تغییرات، نسبت به معماری Maxwell روانه بازار کند. در معماری پاسکال تمامی زیرساختهای پایه نظیر واحدهای محاسبه و منطق (ALUs)، واحدهای ساخت بافتها (Texture units)، واحدهای تصویرسازی (ROPs) و حافظههای Cache همگی تقریباً شبیه همانهایی هستند که قبلاً در GM2xx پیاده سازی شده بودند.
در واقع انویدیا در GPU های سطح به اصطلاح Consumer یا مصرف کنندگان عادی با معماری Pascal سعی کرده تا با افزایش سرعت Clock هسته و تعداد Shader Processor ها قدرت پردازش اطلاعات را در GP104 به مرز 8.9TFLOPs برساند و در نهایت به استفاده از حافظههای پرسرعت و جدید GDDR5X و البته بهروزرسانی رابط حافظه این پردازنده گرافیکی بسیار قدرتمند را بهخوبی تغذیه کند.
(Nvidia GP104 (Pascal Architecture
در تصویر بالا بلاک دیاگرام تراشه گرافیکی (GPU) به کار رفته در کارت گرافیکی GTX 1080 را ملاحظه میکنید. این تراشه (GP104) پس از GP102 (تراشه گرافیکی به کار رفته در NVIDIA Titan X Pascal) قدرتمندترین پردازنده گرافیکی (در سطح مصرف کنندگان عادی) مبتنی بر معماری Pascal محسوب میشود. در این تراشه 2560 CUDA Core در قالب 20 واحد SM در فرکانس بیش از 1733MHz فعالیت میکنند. GP104 به صورت کلی و همانند GM204 (تراشه گرافیکی به کار رفته در GTX 980) از 4 واحد بسیار بزرگ GPC) Graphics Processing Cluster) تشکیل شده که هر یک از این واحدها 5 واحد SM یا همان Streaming Multiprocessors را درون خود جای دادهاند. این در حالی است که هر یک از واحدهای GPC تراشه GM204 دارای 4 واحد SM بودند. در تصویر زیر میتوانید بلاک دیاگرام تراشه GM204 را نیز ملاحظه کنید:
(NVIDIA GM204 (MaxwellArchitecture
در واقع به صورت کلی تفاوت ساختاری میان تراشه گرافیکی GP104 (تراشه به کار رفته در GTX 1080) و GM204 (تراشه به کار رفته در GTX 980) در همین 1 عدد واحد SM بیشتر در GPC ها خلاصه میشود؛ اما اجازه دهید برای یادآوری هم که شده کمی بیشتر وارد جزئیات ساختاری واحدهای GPC و SM شویم.
NVIDIA GP104 - GPC
خب همانطور که اشاره شد هر واحد GPC در معماری پاسکال 5 واحد SM را درون خود جای داده است که هر یک از واحدهای SM دارای 128 عدد CUDA core (واحدهای کوچک مربع شکل سبز رنگ) و 8 عدد Texture Unit (واحدهای مستطیل شکل به رنگ آبی تیره) هستند. حال برای محاسبه CUDA Core های کل این تراشه کافی است 128 را در تعداد SM های هر واحد GPC ا(عدد 5) ضرب کنید و نتیجه به دست آمده را مجدداً در تعداد واحدهای GPC این تراشه (عدد 4) ضرب کنید. نتیجه به دست آمده عدد 2560 عدد CUDA Core خواهد بود. حال اگر همین روال را برای واحدهای Texture Unit نیز تکرار کنید به عدد 160 خواهید رسید. پس 1 واحد SM بیشتر در هر GPC باعث افزایش 512 عددی CUDA core ها و همینطور افزایش 32 عدد واحدهای Texture Unit تراشه GP104 نسبت به GM204 شده است. از سوی دیگر بر خلاف GM204 که دارای 4 کنترلر حافظه 64bits (جمعاً 256bits) و 16 ROP Units به ازای هر کنترلر حافظه (جمعاً 64 عدد) بود، در GP104 هشت کنترلر حافظه 32bits تعبیه شده (جمعاً 256bits) که هر یک از این کنترلرها توسط 8 عدد ROP Units تغذیه میشوند. کاملاً مشخص است که رابط حافظه و تعداد واحدهای ROP تغییر نکرده است ولی انویدیا با در نظر گرفتن حافظههای بسیار پرسرعت GDDR5X با فرکانس مؤثر 10000MHz برای این تراشه قدرتمند، پهنای باند تئوری بیش از 320GB/sec را برای آن فراهم کرده است.
NVIDIA GP104 –SM Unit
در تصویر بالا نیز جزئیات هر واحد SM را ملاحظه میکنید. واحدهای SM معماری پاسکال دقیقاً مشابه معماری مکسول طراحی شدهاند.
اما بهعنوان جمع بندی نهایی همانطور که در جدول بالا ملاحظه میکنید روی هم رفته 4 عدد واحد SM بیشتر و به ازای آن 512 عدد CUDA Core و 32 عدد Texture Unit بیشتر به همراه بیش از 517MHz سرعت کلاک بیشتر GPU و 3000MHz سرعت کلاک بیشتر حافظه که در عمل باعث افزایش 43% پهنای باند حافظه و توان عملیاتی واحدهای ROP میشود، روی کاغذ باعث افزایش 78% کارایی خام GTX 1080 در برابر GTX 980 میشوند. البته این در حالی است که با وجود افزایش 38% تعداد ترانزیستورها و البته به لطف تکنولوژی ساخت TSMC's 16 nm FinFET اندازه Die در تراشه GP104 حدوداً بیش از 21% کوچکتر شده و توان مصرفی این مجموعه نیز تنها 9% افزایش یافت است.
معماری پاسکال: طراحی شده برای سرعت
همانطور که اشاره شد یکی از مهمترین عواملی که باعث افزایش کارایی در معماری پاسکال شده است افزایش بیش از 45% سرعت کلاک GPU نسبت به معماری مکسول است. این میزان افزایش سرعت کلاک در عمل باعث بالا رفتن توان مصرفی تراشه خواهد شد ولی به لطف تکنولوژی 16nm FinFET به کار رفته در ساخت میلیونها ترانزیستور به کار رفته در این تراشه و البته از آن مهمتر بهینه سازیهای فراوان پیاده سازی شده در تایمینگ بخشهای مختلف این تراشه مدرن، تراشههای گرافیکی مبتنی بر معماری Pascal یکی از پربازدهترین GPU های حال حاضر محسوب میشوند.
GPU Boost 3.0
چند سالی میشود که تراشههای گرافیکی ساخت کمپانی انویدیا این قابلیت را دارند که علاوه بر فرکانس پایه هسته GPU، با توجه به دمای هسته و البته میزان Load آن، در فرکانسهای بالاتر از این مقدار نیز فعالیت کنند. در واقع این مکانیسم که تحت عنوان GPU Boost معرفی شده است یک فرآیند خودکار اورکلاک محسوب میشود و تأثیر بسزایی نیز در افزایش کارایی تراشههای گرافیکی دارد. انویدیا در معماری Pascal از نسخه سوم این مکانیسم رونمایی کرده است. در ادامه قابلیتهای جدید این نسخه را بررسی میکنیم.
یکی از اساسیترین تغییرات در GPU Boost 3.0 تحت عنوان per voltage point frequency offsets معرفی شده است. در این تکنیک بر خلاف نسل قبل که با فعال شدن حالت GPU Boost، ولتاژ هسته GPU نیز یک باره و یا حداکثر در چند بازه محدود افزایش مییافت در نسخه جدید برای هر مقدار افزایش فرکانس نسبت به فرکانس پیش فرض، ولتاژ مخصوص تعیین شده است. این امر باعث کاهش تلفات انرژی و کنترل بیش از پیش حرارت متصاعد شده از GPU میشود. در نتیجه این امکان فراهم میشود که فرکانس Boost نسبت به مدلهای مشابه نسل قبل به صورت محسوسی افزایش یابد؛ اما این امر شاید تا حدودی اورکلاک کارتهای گرافیک مبتنی بر این معماری را پیچیدهتر کند. برای مثال در این معماری برای اعمال ولتاژ بیشتر به GPU دیگر گزینهای برای تغییر مقادیر مختلف ولتاژ با واحد ولت مشاهده نمیشود و این امکان فراهم شده است که میزان انحراف ولتاژ از محدوده ولتاژ پیش فرض را تنها با تعیین درصد انحراف تعیین کرد. همچنین در این معماری گزینهای برای غیرفعال کردن محدودیتهای مرتبط با میزان Load بر روی GPU نیز در نظر گرفته شده است. پس در واقع یکی از مهمترین پارامترهایی که در این معماری دست یابی به فرکانسهای بالاتر را تسهیل میکند بدون شک دمای GPU خواهد بود.
GDDR5X Memory
پشتیبانی تراشههای گرافیکی مبتنی بر معماری پاسکال از حافظههای GDDR5X با فرکانس بیش از 10GHz بدین معناست که این تراشهها و کنترلر حافظه تعبیه شده در آنها قابلیت تشخیص بیتهای 0 و 1 را در فاصله زمانی کمتر از 100 picoseconds (ps) را دارا میباشند. این بدان معنا است که برای حفظ پارامترهای Signaling در این فرکانس بسیار بالا، طراحی کنترلر حافظه، مدارهای مرتبط با بخش ورودی و خروجی و از آن مهمتر طراحی PCB برای داشتن ارتباطی پایدار و بدون افت کارایی باید دچار تغییرات فراوانی شده باشند.
در واقع در طراحی کانال ارتباطی میان Die تراشه گرافیکی و چیپ ها حافظه باید به کوچکترین جزئیات نیز توجه شود. در اینگونه ارتباطات، سرعت عملیاتی و واقعی رابط حافظه تنها توسط ضعیفترین سیگنال گذرگاه تعیین میشود. در طراحی جدید هر سیگنال در امتداد مسیر بسته خود از GPU تا چیپ های حافظه به صورت دقیق بررسی و مورد مطالعه قرار گرفته تا هر گونه افت دامنه سیگنال، تداخل و ناپیوستگیهای موجود شناسایی شده و تمهیدات لازم برای به حداقل رساندن آنها به کار گرفته شود.
به گفته انویدیا تمامی تمهیداتی که در کانالهای ارتباطی و مدارهای ورودی و خروجی این معماری اجرا شده تنها برای پایداری ارتباط با فرکانس تا 10GHz عملیاتی نشدهاند. بلکه این طراحی بهگونهای است که حتی محصولات آینده و با پهنای باند بهمراتب بالاتر از این را نیز در بر میگیرد. در واقع همین حالا نیز برخی از تولید کنندگان چیپ های حافظه از برنامه برای تولید حافظههای GDDR5X با سرعت بیش از 16Gbps خبر میدهند. حافظههایی که در مقایسه با پرسرعتترین چیپ های GDDR5 حال حاضر بیش از 2 برابر سریعتر خواهند بود!
در تصویر بالا سیگنال ارتباطی حافظههای GDDR5X را در فرکانس 10GHz و سایر بهینه سازیهای پیاده سازی شده در مدارهای ورودی و خروجی و کانالهای ارتباطی را ملاحظه میکنید.
Enhanced Memory Compression
همانند معماری Maxwell تراشهای جدید مبتنی بر معماری Pascal نیز از تکنیک فشرده سازی بدون افت کیفیت (lossless memory compression) اطلاعات حافظه، جهت کاهش وابستگی به پهنای باند بالای ارتباط، پشتیبانی میکنند. کاهش نیاز به پهنای بالا فراهم شده توسط فشرده سازی اطلاعات حافظه به صورت کلی این مزیتها را در پی دارد:
- کاهش حجم اطلاعات نوشته شده در حافظه
- کاهش حجم اطلاعات منتقل شده از حافظه به L2 Cache
- کاهش حجم اطلاعات رد و بدل شده بین واحدهای مختلف GPU مانند Texture Unit و حافظه frame buffer
Pipeline های فشرده سازی GPU در این معماری از چندین الگوریتم مختلف فشرده سازی پشتیبانی میکنند و البته در شرایط مختلف به صورت هوشمند و در کمترین زمان ممکن بهترین الگوریتم را برای فشرده سازی اطلاعات انتخاب میکنند. یکی از این مهمترین و مدرنترین این تکنیکهای فشرده سازی الگوریتم Delta Color Compression است.
در این الگوریتم GPU تفاوتهای میان پیکسلها را در یک بلوک محاسبه میکند و این بلوک را بهعنوان مجموعهای از پیکسلهای مرجع بهعلاوه ارزش دلتا نسبت به مقدار مرجع ذخیره میکند. اگر دلتاها کوچک باشند پس تعداد بیتهای کمتری به ازای هر پیکسل برای ذخیره شدن در حافظه نیاز خواهد بود. اگر نتیجه (مقدار حافظه اشغال شده) جمع بندی شده دادههای مرجع بهعلاوه ارزش عدد دلتا، نصف حالت فشرده سازی نشده باشد، در این حالت تکنیک فشرده سازی اطلاعات با استفاده از الگوریتم Delta Color Compression موفق بوده است و در نهایت اطلاعات با نصف حجم اصلی خود ذخیره شدهاند (2:1 compression)
در تراشه گرافیکی GP104 قابلیتها و توان عملیاتی الگوریتم فشرده سازی Delta Color Compression به میزان قابل توجهی بهینه سازی شده است:
- بازدهی و توان عملیاتی فشرده سازی حالت 2:1 در مقایسه با نسل قبل به میزان قابل توجهی افزایش داشته است
- اضافه شدن حالت فشرده سازی 4:1 برای پوشش مواردی که به ازای هر پیکسل بهعلاوه دلتا مورد نظر بسیار کوچک هستند و این قابلیت را دارند تا در ¼ فضای حالت فشرده سازی نشده خود ذخیره شوند.
- اضافه شدن حالت فشرده سازی 8:1 که به زبان ساده به نوعی ترکیب حالت 4:1 و 2:1 محسوب میشود
فشرده سازی رنگ در معماری Pascal، فشرده سازی رنگ در معماری Maxwell، تصویر اصلی بدون فشرده سازی
در تصویر بالا صحنهای از بازی معروف Project CARS را ملاحظه میکنید که به روشنی عملکرد تکنیک فشرده سازی رنگ را در معماری Pascal در مقایسه با معماری Maxwell نشان میدهد.
در این تصویر نقاطی که فشرده سازی رنگ در آن با موفقیت عملیاتی شده به رنگ ارغوانی ملاحظه میکنید. کاملاً مشخص است که معماری مکسول تقریباً قسمت اعظمی از رنگهای تصویر را فشرده سازی کرده ولی از پس فشرده سازی پوشش گیاهی و بخشهایی از اتومبیل بر نیامده است؛ اما در معماری پاسکال تنها بخشی از سمت چپ تصویر فشرده سازی نشده است.
روی هم رفته و در تستهای عملی صورت گرفته عملکرد فشرده سازی رنگ در معماری پاسکال باعث افزایش 20 درصدی بازدهی پهنای باند حافظه نسبت به معماری Maxwell میشود. حال اگر این میزان را با افزایش بیش از 40 درصدی پهنای باند حافظه به لطف چیپ های پرسرعت GDDR5X 10GHz جمع کنیم به این نتیجه خواهید رسیم که پهنای باند عملیاتی در معماری Pascal بیش از 1.7 برابر نسبت به معماری Maxwell بیشتر شده است.
محاسبات ناهمزمان (Asynchronous Compute)
بار پردازش بازیهای رایانهای مدرن به صورت فزایندهای در حال پیچیده شدن است. یکی از مهمترین عوامل این امر پردازش چند کار مستقل و البته ناهمزمان است که به صورت تنگاتنگ با یکدیگر تعامل دارند تا در نهایت به کمک هم تصویر نهایی را رندر کنند.
چند مثال درباره بار پردازش غیر همزمان:
- پردازش فیزیک و صدا مبتنی بر GPU
- تصاویر رندر شده همراه با Postprocessing
- پردازش ناهمزمان پیچ و تاب و زمان: نوعی تکنیک استفاده شده در واقعیت مجازی که تصویر نهایی را با توجه به وضعیت سر دقیقاً قبل از نمایش نهایی تصویر بازسازی میکند
این نوع پردازشهای غیر همزمان دو سناریو جدید برای طراحان GPU به وجود میآورد که باید در نظر گرفته شوند.
سناریو اول شامل بار پردازشهایی است که با یکدیگر تداخل دارند. انواع خاصی از بارهای پردازش که به صورت کامل تمام منابع GPU را اشغال نمیکنند. در این مواقع GPU باید به صورت هوشمند منابع خود را بین هر دو بار پردازش به اشتراک بگذارد و این کار بهگونهای مدیریت کند تا بازدهی پردازش اطلاعات نیز قابل قبول باشد. پردازش گرافیکی تصویر در کنار پردازش فیزیک دبه صورت همزمان یک مثال خوب برای این سناریو محسوب میشود.
برای بارهای پردازش که با یکدیگر تداخل دارند معماری پاسکال پشتیبانی از تکنیک dynamic load balancing را در چنته دارد. در تراشههای گرافیکی مبتنی بر معماری Maxwell این نوع از پردازشها توسط پارتیشن بندی استاتیک (static partitioning) زیرمجموعههایی از GPU که پردازش گرافیکی و پردازش همه منظوره را انجام میدهند صورت میگیرند. این تکنیک به شرطی کارآمد است که تعادل کار بین دو بار پردازش، تقریباً منطبق با نسبت پارتیشن بندی مورد نظر باشد. با این حال اگر بار پردازش همه منظوره بیش از پردازش گرافیکی طول بکشد و هر دو برای پایان نهایی این پردازش نیاز به تکمیل شدن بار پردازش خود داشته باشند. بخشی از GPU که برای پردازش گرافیکی پارتیشن بندی شده بود عملاً بلااستفاده میماند.
در تکنولوژی سخت افزاری dynamic load balancing پیاده سازی شده در معماری Pascal این امکان وجود دارد که هر دو بار پردازش نام برده در صورت وجود منابع خالی در GPU به صورت پویا از منابع نام برده برای افزایش کارایی و بازدهی عملیاتی استفاده کنند.
Simultaneous Multi-Projection Engine
موتور پردازش همزمان چند تصویره یا همان Simultaneous Multi-Projection Engine یک واحد سخت افزاری جدید است که در بخش PolyMorph Engine در انتهای geometry pipeline و درست در مقابل واحد تصویرسازی (Raster Unit) قرار دارد. همانطور که از اسم آن پیداست، وظیفه واحد (Simultaneous Multi-Projection (SMP ایجاد بینش های متفاوت از یک جریان شکل هندسی است که همین امر SMP را تبدیل به یکی از مراحل سایه زنی بالادستی کرده است.
این بخش قادر است تا حداکثر 16 طرح و بینش مختلف از پیش تنظیم شده یک شکل هندسی را پردازش کند. در تمام حالات ممکن خلق تصاویر، پردازش اطلاعات توسط شتاب دهندههای سخت افزاری انجام میشود و جریان پردازش اطلاعات هیچ گاه پردازنده گرافیکی را ترک نمیکند. از آنجا که پردازش توسعه چند تصویره پس از واحدهای مربوط به ترسیم هندسی تصویر اتفاق میافتد، برنامههای سازگار با این تکنیک، تمامی عملیاتی که باید در واحدهای سایه زدن بالادستی انجام میشدند را بهمراتب کاهش میدهند. این عملیات حذف شده بهویژه در زمانی که GPU با تکنیکهای تصویرسازی هندسی پیچیده مثل Tessellation روبرو میشود پراهمیت هستند. در برخی موارد خاص، موتور SMP میتواند عملیات مربوط به پردازش هندسی تصاویر را تا حداکثر 32 برابر کاهش دهد.
همانطور که در تصویر بالا ملاحظه میکنید یکی از نمونههای کاربردی SMP اصلاح میدان دید مطلوب در صفحه نمایشهای 3 گانه به صورت فراگیر است.
همچنین همانطور که مطلع هستید به لطف تکنولوژیهای جدید صفحه نمایشهای LED و OLED شاهد عرضه صفحه نمایشهای خمیده (Curved) و عینکهای واقعیت مجازی (VR) مجهز به عدسیها و صفحه نمایشهای مختلف هستیم که هر یکی از این تکنولوژیهای نمایش تصویر نیاز به تصویرسازی مختص به خود هستند. در تصویر زیر انواع مختلف تکنولوژیهای نمایش تصویر موجود در حال حاضر و یا در حال توسعه آینده نزدیک را ملاحظه میکنید.
پردازندههای گرافیکی کنونی از تمامی این صفحه نمایشها پشتیبانی میکنند ولی به صورت کاملاً ناکارآمد و یا با مراحل متعدد پردازش تصویر و پیچ و تاب دادنهای مختلف برای مطابقت با خروجی نهایی مورد نیاز. GPU های با معماری Maxwell دارای برخی قابلیتهای ابتدایی Multi-Resolution بودند که در واقع پیش نمایشی از مدل عملیاتی واحد SMP در معماری Pascal محسوب میشد. پردازندههای گرافیکی مبتنی بر معماری مکسول میتوانستند دقیقاً 90 درجه تصویر را بچرخانند (بهعنوان مثال برای نگاشت مکعب) و یا با گرفتن یک جهت تصویر واحد مقیاس آن را با رزولوشن بخشهای مختلف نمایشگر تطبیق دهند. این تکنیکها علیرغم مثمر ثمر بودن برای برخی کاربردها نظیر VXGI، ولی در بسیاری از حالتهای مختلف نمایشگرهای جدید ناکارآمد هستند و بازدهی کارایی مناسبی ندارند.
به لطف موتور Simultaneous Multi-Projection Engine و قابلیتهای آن در اداره نمایش چندین تصویر با پیچ و تاب و چرخش مختلف در آن واحد، پردازندههای گرافیکی مبتنی بر معماری Pascal این قابلیت را دارند تا به صورت کاملاً کارآمد و با بازدهی کارایی بالا در سریعترین زمان ممکن بهترین خروجی را برای نمایشگرهای نام برده فراهم کنند. این موتور پردازش هندسی مدرن با پشتیانی از تکنیکهایی نظیر Projections in 3D Graphics، Perspective Surround، Single Pass Stereo و Lens Matched Shading قادر است تا در حالتهای مدرن نمایش تصاویر در عینکهای واقعیت مجازی (VR) بهترین کیفیت ممکن در کنار کارایی بسیار بهتر از پردازندههای گرافیکی نسلهای قبل ارائه دهد.
رابط جدید و بهبود یافته SLI
گیمرهای حرفهای برای دستیابی به کارایی فوقالعاده بالا در وضعیتهایی که از چند نمایشگر با رزولوشنهای بالای 4K و 5K استفاده میکنند به پیکربندیهای 2 یا چندگانه Multi GPU تحت عنوان SLI تکیه میکنند. یکی از مهمترین اجزاء در پیکربندی SLI نیز پل SLI یا همان SLI Bridge است که در واقع یک رابط دیجیتال برای جابجایی اطلاعات تصویر بین کارتهای گرافیک Geforce در این سیستم محسوب میشود.
کارتهای گرافیکی رده بالای Nvidia Geforce که از پیکربندیهای 3 و 4 گانه SLI پشتیبانی میکنند دارای 2 عدد از این رابطها بر روی PCB خود هستند. علت وجود رابط دوم در این حالتها ارتباط میان سایر کارتهای گرافیک با کارت گرافیک اصلی (کارت گرافیکی که ورودی یا ورودیهای تصاویر مانیتورها به آن متصل شده است) جهت هماهنگی و ارسال اطلاعات مرتبط با رندر فریمها است و تا قبل از معماری Pascal هر یکی از این رابطها به صورت مستقل عمل میکردند.
اما در معماری Pascal این دو رابط به یکدیگر لینک شدهاند تا پهنای باند ارتباط میان دو کارت گرافیک افزایش یابد. این حالت جدید dual-link SLI این قابلیت را فراهم میکند که هر دو رابط SLI در کنار هم نمایشگرهای با رزولوشنهای بالا و یا پیکربندیهای فراگیر مجهز به 3 نمایشگر را با سرعت بهمراتب بیشتر نسبت به نسلهای قبل تغذیه کنند.
Dual-link SLI تنها توسط پلهای جدید تحت عنوان SLI HB پشتیبانی میشود. این پلهای جدید ارتباط سریع میان دو کارت گرافیک را تسهیل میکنند، هر دو رابط SLI را در این ارتباط شرکت میدهند و موجب فعال شدن وضعیت ارتباط با سرعت کلاک 650MHz میان دو کارت گرافیک GTX 1080 میشود (این نکته را مد نظر داشته باشید که پیکربندی SLI توسط پلهای قدیمی نیز امکان پذیر است ولی در این حالت حداکثر سرعت کلاک ارتباط 400MHz خواهد بود و حداکثر کارایی این پیکربندی آشکار نخواهد شد).
البته لازم به ذکر است پلهای SLI مجهز به LED در پیکربندی دوگانه GTX 1080 از فرکانس 650MHz و پهنای باند بالای این ارتباط پشتیبانی میکنند.
پس مدنظر داشته باشید که برای ارتباط پرسرعت و پشتیبانی از نمایشگرهای 4K و 5K و همینطور ترکیب فراگیر چند نمایشگر به صورت همزمان باید از پلهای جدید مجهز به LED و یا SLI HB در پیکربندیهای دوگانه GTX 1080 استفاده شود. در جدول زیر میتوانید با توجه به نیازهای خود، نوع پل SLI مورد نظر را شناسایی کنید.
با پهنای باند بالای ارائه شده توسط رابط جدید SLI و پلهای جدید SLI HB گیمرها نسبت به نسل قبلی SLI بهمراتب اجرای روانتری را در بازیهای جدید تجربه خواهند کرد. در گراف زیر نمودار FrameTime اجرای بازی Shadow of Mordor را در رزولوشن 11520x2160 مشاهده میکنید.
همانطور که ملاحظه میکنید در حالتی که از پل جدید SLI HB استفاده شده است (گراف آبی رنگ) روی هم رفته FrameTime پایینتر و از آن مهمتر spike ها نیز بهمراتب کمتر هستند. این بدان معناست که Frame Rate بالاتر و پایداری این پارامتر نیز بهمراتب بهتر از قبل شده است.
حالتهای جدید پیکربندی Multi-GPU
در مقایسه با نسخههای قبلی DirectX کمپانی مایکروسافت چند تغییر در DirectX 12 جدید ایجاد کرده که عملکرد پیکربندیهای Multi-GPU را نیز تحت تأثیر قرار میدهند. در بالاترین سطح دو انتخاب اساسی برای توسعه دهندگان جهت استفاده از پیکربندیهای Multi-GPU در سخت افزاریهای انویدیا در DirectX 12 وجود دارد: حالت (Multi Display Adapter (MDA و حالت (Linked Display Adapter (LDA.
برای حالت LDA نیز دو شکل متفاوت تعریف شده است: حالت Implicit LDA که NVIDIA برای SLI از آن استفاده میکند و حالت Explicit LDA که در اصل توسعه دهندگان بسیاری از مسئولیتهای GPU را برای دستیابی به یک پیکربندی موفق و با بازدهی بسیار بالا مدیریت میکنند. در واقع هدف از توسعه حالتهای MDA و LDA Explicit این بوده که توسعه دهندگان بازیهای رایانهای کنترل بیشتری بر روی عملکرد GPU داشته باشند.
در جدول زیر خلاصه قابلیتها و ملزومات این 3 حالت را در پردازندههای گرافیکی Nvidia ملاحظه میکنید:
در حالت LDA تمامی حافظههای Frame Buffer کارتهای گرافیک مستقل شرکت کننده در این پیکربندی با یکدیگر مرتبط خواهند بود تا مجموعهای بسیار بزرگ از حافظه در اختیار توسعه دهنده قرار بگیرد (البته در این ارتباط برخی استثنائات وجود دارد). با این حال در صورتی که اطلاعات مورد نیاز یک GPU در حافظه GPU دیگر ذخیره شده باشد ممکن است نوعی افت کارایی پیش آید. در حالت MDA، حافظه هر GPU به صورت اختصاصی برای همان GPU قابل دسترس است و قابلیت دسترسی مستقیم به حافظه GPU های دیگر را ندارد.
حالت LDA برای وضعیتهایی در نظر گرفته شده است که در آن GPU ها دقیقاً شبیه به یکدیگر هستند در حالی که در حالت MDA محدودیتهای بهمراتب کمتری وجود دارد. برای مثال حتی این امکان وجود دارد که کارتهای گرافیک مجزا با تراشههای گرافیکی مجتمع جفت شوند و یا حتی GPU های با مدلهای مختلف و یا حتی با سازندگان مختلف با یکدیگر جفت شوند. ولی در این حالت توسعه دهنده باید با دقت بیشتری تمامی عملیات و دستورالعملهایی را که برای ارتباط میان GPU ها لازم است را مدیریت کند.
در حالت پیشفرض کارت گرافیک GFEFORCE GTX 1080 تنها از حالت دوگانه (i2-Way) پیکربندی SLI پشتیبانی میکند و حالتهای l3-Way و l4-Way پیکربندی SLI از این پس توسط انویدیا توصیه نمیشود. هم زمان با تکامل هر چه بیشتر بازیها بسیار دشوار خواهد بود تا حالتهای 3 و 4 گانه SLI در حالت عملیاتی افزایش کارایی محسوسی برای کاربران عادی و گیمرها به ارمغان بیاورند. برای مثال در بسیاری از بازیها در پیکربندیهای 3 و 4 گانه این CPU است که گلوگاه کارایی میشود و از طرف دیگر بازیهایی که از تکنولوژیهایی استفاده میکنند که استخراج فریم به فریم و البته متقارن آنها بسیار مشکل است نیز روز بهروز در حال افزایش است. البته مدلهای دیگر برای استفاده از پیکربندیهای l3-Way و l4-Way نیز وجود دارد:
- استفاده از حالتهای MDA و LDA Explicit
- 2Way SLI + dedicated PhysX GPU
معرفی معماری nVIDIA Pascal (بخش دوم)
Fast Sync
Fast Sync نوع با زمان تأخیر بهمراتب کمتر تکنولوژی قدیمی (Vertical Sync (V-SYNC است که مانع از به اصطلاح tearing یا گسستگی تصویر در هنگام بیشتر شدن نرخ FPS از Refresh Rate نمایشگر میشود.
در تصویر زیر یک طرح کلی خام از چگونگی رندر شدن یک فریم در pipeline تراشههای گرافیکی Nvidia را ملاحظه میکنید:
موتور گرافیکی بازی وظیفه تولید فریمها و ارسال آن به DirectX را بر عهده دارند. از دیگر وظایف موتور بازی محاسبه animation time (کد گذاری داخل هر فریم که در نهایت رندر میشود) است. در ادامه سرعت ترسیم و دیگر اطلاعات به درایور و GPU ابلاغ میشوند تا به تصویر رندر شده حقیقی تبدیل شوند. این اطلاعات سپس به حافظه Frame Buffer ارسال شده و در نهایت نیز جهت اسکن به نمایشگر منتقل میشوند.
اما در پردازندههای گرافیکی مبتنی بر معماری Pascal این روال کمی تغییر کرده است.
یک سؤال: در برخی بازیهای کنونی مثل Counter-Strike: Global Offensive که نرخ FPS گاهی اوقات به بیش از صدها فریم در ثانیه میرسد، بهتر است V-SYNC فعال باشد یا غیرفعال؟
در حالتی که V-SYNC روشن است نرخ FPS هیچ گاه از نرخ Refresh Rate نمایشگر تجاوز نمیکند. این امر در عمل باعث جلوگیری از گسستگی تصویر میشود ولی از طرفی باعث افزایش محسوس زمان تأخیر ورودی میشود.
اما در وضعیتی که V-SYNC خاموش است نرخ FPS به صورت افسار گسیخته افزایش مییابد. در این حالت زمان تأخیر ورودی بسیار پایین است ولی در عمل گسستگی (بریدهبریده شدن) در تصویر خروجی مشاهده میشود.
این دو وضعیت یک چالش بسیار سخت برای گیمرهای کنونی محسوب میشود! و البته انتخاب بین این دو وضعیت نیز در شرایط مختلف همانطور که اشاره شد معایب و مزایای خاص خود را به همراه دارد.
انویدیا با بازنگری در نحوه عملکرد این فرآیند قدیمی در قدم اول در مسیر پردازش تصویر، بخشهای مرتبط با رندر فریم و نمایش تصویر را از یکدیگر جدا کرده است. این امر به بخشهای مرتبط با رندر اجازه میدهد تا بهطور مداوم و با حداکثر سرعت به رندر اطلاعات ارسال شده توسط موتور بازی و درایور بپردازند و این فریمها بتوانند موقتاً در حافظه Frame Buffer ذخیره شوند.
Rendered Frames - FAST SYNC
همانطور که اشاره شد انویدیا در مسیر رندر تصاویر، یخش های مرتبط با رندر و بخشهای مربوط به نمایش تصاویر را از یکدیگر جدا کرده است. این امر اجازه میدهد تا تصویر خروجی با استفاده از راهکارهای جدید مختلف مدیریت شود که این امر مزایای فراوانی برای گیمرها در پی خواهد داشت.
FAST SYNC یکی از اولین کاربردهایی است که این رویکرد جدید همراه خواهد داشت.
با FAST SYNC دیگر کنترل و کندسازی جریان پردازش گرافیکی (flow control) وجود نخواهد داشت، عملکرد موتور گرافیکی همانند وضعیتی است که V-SYNC غیرفعال است و همه اینها به این دلیل است که دیگر مسیر پردازش تصویر، پدیده تجمع فریمها در حافظه Frame Buffer وجود ندارد. زمان تأخیر تقریباً همانند زمانی که V-SYNC غیرفعال است پایین است و از همه بهتر تصویر نیز دیگر گسستگی مشاهده نخواهد شد! چون FAST SYNC انتخاب میکند که کدام یکی از فریمهای رندر شده باید توسط نمایشگر اسکن شود. FAST SYNC به مسیر پردازش تصویر این اجازه را میدهد تا با حداکثر سرعت به پردازش تصاویر بپردازد و تعیین میکند تا کدام فریم برای اسکن به نمایشگر ارسال شود، در حالی که بهطور همزمان همه فریمها حفظ میشوند و تصویر نیز بدون گسستگی در نمایشگر اسکن میشود.
تجربهای که FAST SYNC ارائه میدهد بسته به نرخ FPS از نظر کیفیت و وضوح تصویر همانند وضعیتی است که V-SYNC فعال است. همچنین زمان تأخیر ورودی نیز بسیار پایین و مانند وضعیتی است که V-SYNC خاموش است.
Decoupled Buffers
اما شاید برای شما نیز سؤال شده باشد که FAST SYNC چگونه کار میکند؟
تصور کنید 3 ناحیه در حافظه Frame Buffer تعبیه شده است که دارای 3 عملکرد متفاوت میباشند. 2 بخش بافر اول همانند تکنیک double-buffered V-SYNC در GPU های نسل قبل عمل میکنند. باور جلویی (Front Buffer) تصاویری که برای اسکن به نمایشگر فرستاده میشوند را در خود ذخیره میکند. بافر پشتی (Back Buffer) اطلاعاتی را همراه دارد که در حال رندر شدن هستند و تا زمانی که این فرآیند شکل گیری تصاویر به پایان نرسند اجازه اسکن شدن را ندارند. استفاده از V-SYNC مرسوم در گیم های با نرخ FPS بالا اصلاً زمان تأخیر ورودی مناسبی نخواهد داشت چون موتور بازی باید منتظر وقفه ایجاد شده توسط Refresh Rate نمایشگر بماند تا قبل از اینکه فریمهای جدید در Back Buffer بارگذاری شوند، با تلنگر Back Buffer اجازه ارسال اطلاعات به نمایشگر را صادر کند. این روال تمامی مراحل را کند میکند و در عمل Back Buffer را به یک عامل ایجاد زمان تأخیر تبدیل میکند.
FAST SYNC بافر سومی تحت عنوان (Last Rendered Buffer (LRB را همراه خود دارد که وظیفه آن ذخیره تمامی تصاویر رندر شدهای است که در Back Buffer کامل شدهاند. در نتیجه داشتن یک کپی از فریمهایی که اخیراً توسط Back Buffer رندر شده تا زمانی که Front Buffer کار اسکن تصویر را کامل کند در این نقطه Last Rendered Buffer نیز در Front buffer کپی میشود و این روند ادامه مییابد. عملاً و در واقع رونویسی بافر ناکارآمد خواهد بود و در اصل نام این Buffer ها در طی این فرآیند تغییر میکند.
بافری که تصویر را اسکن میکند FB، بافری که به صورت فعال در حین رندر کردن تصاویر است BB و بافری که حاوی تصاویری است که اخیراً رندر شدهاند نیز LRB نامیده میشود. واحد جدید flip logic نیز در معماری Pascal این فرآیند را کنترل و مدیریت میکند. نمونه کاملی از این فرآیند همانند روال زیر خواهد بود:
- Scan from FB
- Render to BB
- When Render completes
- BB becomes LRB
- LRB becomes BB and render continues
- When Render completes
- BB becomes LRB
- LRB becomes BB and render continues
- When Render completes
- BB becomes LRB
- LRB becomes BB and render continues
- When scan completes
- LRB becomes FB
- Start scanning from the new FB
در نمودار بالا تست این قابلیت را در بازی Counter-Strike: Global Offensive ملاحظه میکنید که توسط دوربینهای بسیار پرسرعت تصویربرداری شده است. به روشنی مشخص است که Fast Sync تنها با حدوداً 8ms زمان تأخیر بیشتر نسبت به حالتی که V-SYNC غیرفعال است مانع از گسستگی شدن تصویر شده است! این در حالی است فعال بودن V-SYNC سنتی عملاً بیش از 9 برابر زمان تأخیر ورودی را افزایش داده است.
نکته: Fast Sync بهترین عملکرد را در بازیهای با نرخ FPS بالا مبتنی بر DirectX 9 دارد.
جهت فعال سازی این قابلیت باید در نرم افزار NVIDIA Control Panel و در بخش مربوط به مدیریت تنظیمات سه بعدی (Manage 3D settings) گزینه FAST را برای پارامتر Vertical sync انتخاب کنید. توجه داشته باشید که عملکرد این پارامتر در حال پیش فرض به موتور گرافیکی گیم سپرده شده است.
HDR
نمایشگرهای جدید با محدوده دینامیکی بالا (HDR) یکی از بزرگترین پیشرفتهای 20 سال اخیر در کیفیت پیکسل صفحه نمایش محسوب میشوند. طیف رنگ BT.2020 حداکثر 75% از رنگهای قابل روئیت توسط چشم انسان را پوشش میدهد (33% بیشتر از طیف رنگ sRGB). این یعنی افزایش 2 برابری محدوده رنگها. علاوه بر این نمایشگرهای HDR حداکثر روشنایی بهمراتب بیشتری نسبت به نمایشگرهای نسل قبل دارند (بیش از 1000 nits در نمایشگرهای LCD) و همینطور درخشندگی بهمراتب بیشتر (l>10:000 to 1).
(Standard Dynamic Range Image (SDR
(High Dynamic Range Image (HDR 1000
با محدوده بیشتر روشنایی و اشباع رنگ، محتوای HDR نمایش واقعگرایانهتری از جهان واقعی خواهند داشت: رنگهای مشکی عمیقتر و رنگهای سفید روشنتر از قبل به نظر میرسند. تغییرات ایجاد شده در تولید رنگ باعث ایجاد تصاویر واقعیتر میشود که حقیقتاً حیرت انگیز است. کاربران سرانجام میتوانند طیف رنگهای قرمز و نارنجی را در آتش و یا انفجار مشاهده کنند. همچنین به خاطر درخشندگی (Contrast) بیشتر در نمایشگرهای HDR کاربران میتوانند جزئیات بیشتری را در نقاط کاملاً تاریک و یا با نور بسیار زیاد مشاهده کنند.
کارتهای گرافیکی مبتنی بر معماری Pascal همانند نمونههای مشابه نسل قبل (Maxwell) از تمامی نمایشگرهای HDR پشتیبانی میکنند و به لطف کنترلر نمایشگر تعبیه شده در آنها از قابلیتهای 12b color، طیف رنگ گسترده (BT.2020،(SMPTE 2084 (Perceptual Quantization و HDMI 2.0b 10/12b برای 4K HDR نیز برخوردار هستند؛ اما در معماری Pascal برخی قابلیتهای جدید به این مجموعه اضافه شده است:
- 4K@60 10/12b HEVC Decode (برای ویدئوهای HDR)
- 4K@60 10b HEVC Encode (برای ضبط و یا استریم ویدئوهای HDR)
- DP1.4-Ready HDR Metadata Transport (برای اتصال به نمایشگرهای HDR با رابط Display Port)
تلویزیونهای HDR در حال حاضر موجود هستند و قابلیتهایی که به آن اشاره شد این امکان را فراهم میسازند تا کاربران به واسطه دستگاه HDR Gamestream که در آینده نزدیک به بازار عرضه خواهد شد بدون اتصال مستقیم PC خود به تلویزیون بازیهای HDR را بر روی این نمایشگرها اجرا و از آنها لذت ببرند.
همچنین انویدیا در حال کار با توسعه دهندگان است تا HDR را به بازیهای رایانهای نیز ببرند. انویدیا با فراهم کردن API، درایورهای لازم و همچنین راهنمایی لازم، توسعه دهندگان را پشتیبانی میکند تا بتوانند تصاویر رندر شده HDR سازگار با این نوع نمایشگرها را با بهترین کیفیت و وضوح ممکن ارائه کنند. بازیهای با محتوای HDR مثل Obduction, The Witness, Lawbreakers, Rise of the Tomb Raider, Paragon, The Talos Principle و Shadow Warrior 2 در حال حاضر عرضه شده و یا در آینده نزدیک عرضه خواهند شد.
Video and Display
پردازندههای گرافیکی مبتنی بر معماری Pascal با پشتیبانی از گواهی نامه (PlayReady 3.0 (SL3000 و رمزگشایی HEVC با استفاده از شتاب دهندههای سخت افزاری برای اولین بار قابلیت مشاهده ویدئوهای 4K premium را توسط PC فراهم کردهاند. در ماههای آینده کاربران مجهز به پردازندههای گرافیکی Pascal این امکان را خواهند داشت تا در Netflix و یا دیگر ارائه دهندگان محتوای باکیفیت، با رزولوشن 4K محتواهای مختلف را استریم و مشاهده کنند.
به لطف برخورداری GeForce GTX 1080 از گواهی نامه Display Port 1.2 و به همراه داشتن قابلیتهای DP 1.3/1.4 پشتیبانی از نمایشگرهای با رزولوشنهای 4K در 120Hzا، 5K در 60Hz و 8K در 60Hz (به واسطه دو کابل مجزا) فراهم شده است.
جدول زیر به صورت خلاصه قابلیتها و ویژگیهای خروجی تصویر Geforce GTX 1080 را در مقایسه با Geforce GTX 980 نشان میدهد:
مدل Founders Edition کارت گرافیک Geforce GTX 1080 دارای 3 خروجی تصویر Display Port، یک خروجی تصویر HDMI 2.0b و یک پورت Dual Link DVI است که قادر به ارائه 4 تصویر به صورت همزمان هستند.
در جدول زیر نیز به صورت خلاصه قابلیتهای Geforce GTX 1080 را در رمزگذاری و رمزگشایی Codec های مختلف ویدئویی در مقایسه با Geforce GTX 980 مشاهده میکنید:
VRWorks Graphics
گیمینگ واقعیت مجازی زمان پاسخ دهی بسیار پایین و از آن مهمتر نرخ Frame Rate بالایی را برای داشتن تجربهای دل چسب و همه جانبه توسط کاربران طلب میکند. این در حالی است که کیفیت بازیهای اخیر مبتنی بر VR خوب به نظر میرسد ولی هنوز به مرحلهای نرسیده است که از نظر کیفیت با بازیهای مدرن غیر VR برابری کنند. یکی از مهمترین دلایل این امر الزامات مربوط به نرخ Frame Rate بالا است که هم اکنون پردازندههای گرافیکی با قدرت کم توانایی ارائه آن را باکیفیت بالا و همراه با افکتهای واقعگرایانه ندارند.
بهمنظور همسان سازی کیفیت گرافیکی بازیهای مبتنی بر VR و غیر VR، انویدیا در پردازندههای گرافیکی مبتنی بر معماری Pascal چندین تکنولوژی جدید جهت افزایش کارایی رندر گرافیکی در کاربردهای VR توسعه داده است. این تکنولوژیها در نهایت سبب شدهاند تا Geforce GTX 1080 در کاربردهای VR بیش از دو برابر سریعتر از Geforce TITAN X باشد. با این افزایش کارایی در پردازندههای گرافیکی مبتنی بر معماری Pascal از این پس توسعه دهندگان بازیهای VR میتوانند کیفیت گرافیکی نظیر بازیهای مدرن غیر VR را برای محتوای گرافیکی ساخت خود فراهم کنند.
VRWorks Audio
تکنولوژیهای شنیداری در گیم و واقعیت مجازی مرسوم کنونی، موقعیت دقیقی از منبع صدا را در یک محیط مجازی ارائه میدهند. برای مثال اگر در یک بازی ژانر شوتر، دشمن از سمت راست شما به طرفتان شلیک کند شما نیز در عمل همین حس را خواهد داشت. دلیل این امر پخش شدن بلندتر صدای شلیک از بلندگوی سمت راست اسپیکر شما نسبت به اسپیکر سمت چپ است و البته این صدا کمی زودتر نیز از بلندگوی سمت راست شنیده میشود. این شبیه سازی در تقدم رسیدن و تقدم انرژی اولین موج صدا برای رسیدن به شنونده را اصطلاحاً Direct Sound مینامند. تفاوتها در انرژی و تقدم رسیدن Direct Sound به هر گوش شنونده نیز Binaural Effects نامیده میشود.
اما در جهان واقعی صداها در جهات مختلفی پخش میشوند و ممکن است به صورت مستقیم به گوش شنونده نرسند. بعضی از این صداها ممکن است در اثر انعکاس برخورد موج صدا به سطوح مختلف به گوش شنونده برسند. به این گونه از امواج، صدای غیرمستقیم، صدای منعکس شده و یا طنین صدا اطلاق میشود. نوع صدای غیرمستقیم به اندازه، شکل و خواص متریال محیط اطراف آن بستگی دارد. برای مثال، وقتی که در حمام کوچک با دیوار کاشی شده و کفپوش قدم میزنید، صدای قدم برداشتن شما بلندتر و با پژواک بیشتری به گوش میرسد تا زمانی که در همان محیط ولی با دیوارهای گچی و کف پوشیده شده با فرش قدم میزنید. در واقع متریال مختلف در انعکاس صدا در جهات مختلف نقش بسیار مهمی دارند. بعضی متریال مانند کاشی و کفپوشها باعث انعکاس حجم زیادی از انرژی صوتی میشوند و بعضی از متریال مانند موکت و فرش حجم اعظمی از انرژی صوتی را جذب خود میکنند.
NVIDIA VRWorks Audio از تکنیک Ray tracing که در گرافیک کامپیوتری جهت رندر و ترسیم تصاویر استفاده میشود برای ردیابی مسیر انتشار اصوات در یک صحنه مجازی استفاده میکند. VRWorks Audio انرژی اصوات منتشر شده را از طریق محیط اطراف شبیه سازی میکند. برای این منظور یک موج برای ردیابی مسیرهای مستقیم و یا غیرمستقیم بین منبع اصوات و شنونده ارسال میشود. وقتی این امواج به سطوح مختلف محیط آن صحنه برخورد میکنند ممکن است جذب شده، منعکس شده و یا با توجه به زاویه برخورد خود پراکنده شوند و همانطور که اشاره شد جنس متریال سطوح نیز در این امر دخیل است.
VRWorks Audio در واقع Binaural Effects را در Direct sound ایجاد میکنند که قبلاً نیز گیمرها آن را تجربه کردهاند؛ اما وجه تمایز این تکنولوژی با موارد مشابه پشتیبانی آن از جلوههای صوتی انتشار غیرمستقیم امواج صوتی است که به شنونده اطلاعات مربوط به ابعاد و ساختار فضایی که در آن حضور دارد را نیز میدهد.
تکنولوژی VRWorks Audio از همان موتور NVIDIA OptiX ray tracing engine استفاده میکند که نرم افزارهای مبتنی بر تکنیک Ray tracing برای پردازش اطلاعات بهره میبرند. موتور OptiX در بازیهای رایانهای سازگار با آن میتواند باعث افزایش سرعت بسیاری از عملیات مثل پردازش دقیق Ambient Occlusion و نورپردازی شود. با تکنولوژی VRWorks Audio، گیمرهای واقعیت مجازی صدای 3 بعدی فراگیرتری را تجربه خواهند کرد که در کنار کیفیت بالای گرافیکی ارائه شده توسط پردازندههای گرافیکی مبتنی بر معماری Pascal، آنها را در محیط مجازی گیم ها غرق خواهد کرد!
PhysX for VR Touch & Environmental Simulation
مدل سازی واقعگرایانه تعاملات لمسی و حرکات در محیط پیرامونی برای ارائه تجربه کاملی از واقعیت مجازی دو امر حیاتی محسوب میشوند. امروزه واقعیت مجازی نوعی تعامل قابل لمس از محیط ارائه میکنند که بر اساس ترکیبی از ردیابی موقعیتی، کنترل دست و تکنولوژیهای حسی و لمسی کار میکنند. تکنولوژی NVIDIA’s PhysX Constraint Solver زمانی که کنترلر دست با یک جسم مجازی تعامل پیدا میکند را شناسایی کرده و موتور بازی را قادر میسازد تا در نهایت پاسخ فیزیکی بصری و لمسی دقیقی را در خروجی ارائه دهد.
تکنولوژی PhysX همچنین رفتار فیزیکی دنیای مجازی اطراف شما را طوری مدل سازی میکند که همه فعل و انفعالات مثل انفجار و یا پاشش آب زمانی که یک دست وارد آب میشود دقیق و همانند فعل و انفعالات دنیای واقعی به نظر برسد.
معرفی تراشه گرافیکی nVIDIA GP104-200
معرفی تراشه گرافیکی nVIDIA GP104-200
تراشه گرافیکی (GPU) استفاده شده در کارت گرافیک Geforce GTX 1070 که با اسم رمز GP104-200 شناخته میشود تنها یک تفاوت عمده با نمونه به کار رفته در کارت گرافیک (Geforce GTX 1080 (GP104-400 دارد و آن هم غیرفعال شدن یکی از واحدهای بزرگ GPC یا همان Graphics Processing Cluster است. با غیر فعال شدن یکی از این 4 واحد تعداد CUDA core ها نیز به 1920 عدد و تعداد واحدهای Texture Unit نیز از 160 به 120 واحد تقلیل یافته است. علاوه بر این فرکانس پایه هسته GP104 نیز در Geforce GTX 1070 نسبت به Geforce GTX 1080 حدوداً 100MHz کمتر شده و به 1506MHz رسیده است. این در حالی است که در بخشهای مربوط به رابط حافظه و واحدهای ROP تغییری مشاهده نمیشود.
اما تغییرات به همین جا ختم نمیشوند و انویدیا به جای استفاده از حافظههای با تکنولوژی GDDR5X در این مدل از 8GB حافظه GDDR5 با فرکانس مؤثر 8000MHZ استفاده کرده است. این تغییرات در عمل باعث کاهش پهنای باند حافظه از 320GB/s به 256GB/s در Geforce GTX 1070 شده است.
روی هم رفته نیز تمامی تغییرات نام برده باعث شدهاند تا TDP یا توان مصرفی Geforce GTX 1070 به حداکثر 150W برسد. این در حالی است که این میزان در Geforce GTX 1080 حداکثر 180W اعلام شده است.
حال اگر قیمت $599 مدل Geforce GTX 1080 8GB را با قیمت به مراتب کمتر $379 کارت گرافیک Geforce GTX 1070 مقایسه کنید بدون شک به این موضوع پی خواهید برد که این میزان تغییرات در کارایی، ارزش خلق یک مدل به مراتب ارزانتر و خوش قیمتتر را داشته است!
اما کمپانی ASUS هم حسابی برای این کارت گرافیکی خوش قیمت سنگ تمام گذاشته و در مدل Geforce GTX 1070 STRIX GAMING OC با در نظر گرفتن باکیفیتترین قطعات و البته یک کولر بسیار قدرتمند و کم صدا شرایط را برای یک نمایش فراموش نشدی از این کارت گرافیک خوش قیمت و قدرتمند فراهم کرده است.
از سری STRIX در حال حاضر دو مدل مختلف در وب سایت رسمی کمپانی ASUS مشاهده میشود که در این بین مدل اورکلاک شده ROG STRIX-GTX1070-O8G-GAMING به لابراتوار شهر سخت افزار ارسال شده است. در این مدل فرکانس پایه هسته GPU حدوداً 150MHz نسبت به حالت مرجع اورکلاک شده و به 1657MHz رسیده است. همچنین این میزان افزایش، فرکانس کلاک حالت GPU Boost این کارت گرافیک را نیز از 1683MHz در حالت پیش فرض تا 1860MHz افزایش داده است. البته ASUS چیپ های حافظه این مدل را اورکلاک نکرده و آنها را در همان فرکانس پیش فرض 8000MHz بایاس کرده است.
در جدول زیر مشخصات فنی این کارت گرافیک را در مقایسه با مدل مرجع و سایر مدلهای هم تراز مشاهده میکنید:
بستهبندی و محتویات داخل جعبه
بستهبندی و محتویات داخل جعبه
بر خلاف مدلهای پیشین سری STRIX هیچ اثری از طرح و یا لوگوی جغد STRIX بر روی جعبه این مدل مشاهده نمیشود؛ اما کماکان پیش زمینه کاملاً مشکی و طرحهای سبز رنگ مختص کارتهای گرافیکی مبتنی بر تراشههای گرافیکی Nvidia بر روی این جعبه مشاهده میشود.
تصویر بزرگی از این کارت گرافیک به همراه مدل تجاری آن، عبارت STRIX GAMING، لوگو ROG و لوگوهای مرتبط به پشتیبانی این کارت گرافیک از تکنولوژیها و قابلیتهایی مانند واقعیت مجازی، نورپردازی توسط RGB LED تحت عنوان AURA و برخی دیگر از تکنولوژیهای جدید واقعگرایانه تصویر انحصاری کمپانی انویدیا مانند GAMEWORK, ANSEL و VRWORK از مهمترین مندرجات روی جعبه این کارت گرافیک محسوب میشوند.
این جعبه با ابعاد 400mm x 300mm x 88mm با تمامی محتویات داخلش حدود 1.77Kg وزن دارد.
از فضای پشت جعبه نیز بهترین استفاده ممکن شده است. مشخصات فنی، تصویری از پنل پورتهای خروجی تصویر و تشریح عملکرد هر پورت، اشاره به 6 قابلیت محوری این کارت گرافیک یعنی کولر بسیار قدرتمند و کم صدا DIRECTCU III و تیغه منحصر به فرد فنهای آن، طراحی بینظیر و متریال فوقالعاده باکیفیت به کار رفته در ساخت این کارت گرافیک، نورپردازی خلاقانه با RGB LED تحت عنوان AURA، پشتیبانی کامل و عملکرد پربازده این کارت گرافیکی از عینکهای واقعیت مجازی، قابلیت اتصال دو فن PWM به کانکتورهای 4 پین اختصاص این کارت گرافیک برای تهویه بهتر و پشتیبانی این مدل از جدیدترین نسخه نرم افزار ASUS GPU TWEAK II برای اورکلاک آسان، مانیتورینگ دقیق پارامترهای مختلف و استریم و یا ضبط کردن گیم پلی به همراه لوگو استانداردهای مختلف و مشخصات تماس با کمپانی ASUS مهمترین بخشهای پشت جعبه این کارت گرافیک را تشکیل میدهند.
با باز کردن پوشش مقوایی با این جعبه مشکیرنگ روبرو خواهید شد که این کارت گرافیک را به واسطه یک پوشش ضد UV، در میان یک فوم اسفنجی جای داده است. سایر متعلقات این کارت گرافیک در زیر این فوم تعبیه شدهاند.
در تصویر بالا کارت گرافیک و جعبه مقوایی حاوی سایر محتویات داخل جعبه را مشاهده میکنید.
محتویات داخل جعبه نیز شامل دفترچههای راهنما، DVD راه انداز حاوی درایورها و نرم افزارهای جانبی و 2 جفت بست کابل با لوگو ROG میشوند. همچنین به دلیل کامل بودن تعداد و انواع پورتهای خروجی تصویر و وجود تنها یک کانکتور 8Pin PCI-Express در این کارت گرافیک خبری از مبدلهای تصویر و یا برق در این پکیج نیست.
نمای ظاهری و بررسی اولیه
نمای ظاهری و بررسی اولیه
حقیقتاً این کارت گرافیک جدا از یک قطعه سخت افزاری یک اثر هنری نیز محسوب میشود! طراحی ناموزون کولر، شیارهای ناموزون تعبیه شده در بالا و پایین فنها جهت تعبیه RGB LED ها و رنگ یک دست مشکی به همراه تعبیه لوگو ASUS و ROG بر روی مرکز محور فنها همگی در کنار هم حس بسیار خوب و مثبتی به بیننده منتقل میکنند.
طرحهای هنری و بسیار زیبا اشاره شده حتی بر روی محافظ فلزی مشکی تعبیه شده در پشت PCB نیز مشاهده میشود. از جمله آنها میتوان به خطوط نامتقارن خاکستری رنگ مندرج بر روی این محافظ فلزی و طراحی لوگو بسیار زیبا ROG با نور پس زمینه RGB اشاره کرد.
همانند اکثر کارتهای گرافیک رده بالا کنونی تمامی پورتهای خروجی تصویر و کانکتورهای پل SLI تعبیه شده بر روی بخش فوقانی PCB با درپوش پلاستیکی مخصوص پوشیده شدهاند تا عواملی مانند گرد و خاک، رطوبت و یا هر گونه جسم خارجی باعث خوردگی، آسیب و یا اکسیداسیون آنها نشود.
همانطور که در تصاویر بالا ملاحظه میکنید لوگوهای STRIX و ROG بر روی بخش فوقانی کولر این کارت گرافیک نیز مشاهده میشوند. البته لوگو و عبارت ROG به نور پس زمینه RGB مجهز شدهاند.
این کارت گرافیک به جدیدترین مدل 3 فن کولر بسیار قدرتمند و فوقالعاده کم صدا ASUS DirectCU III مجهز شده است که در ادامه به صورت مفصل به معرفی آن خواهیم پرداخت.
طراحی هوشمندانه کولر این کارت گرافیک توسط کمپانی ASUS باعث شده تا به لطف طول کمتر از 30 سانتیمتری این کارت گرافیک Dual Slot، تعبیه آن در اغلب کیس های با استاندارد Advance Middle Tower نیز امکانپذیر باشد.
بر خلاف مدل مرجع، کمپانی ASUS در پورتهای خروجی تصویر این مدل تجدید نظر کرده و از 2 عدد DisplayPort 1.4، دو پورت HDMI 2.0b و یک پورت Dual Link DVI-D در پنل خروجیهای تصویر استفاده کرده است. یکی از نقاط ضعف پورت DVI-D عدم پشتیبانی از سیگنال خروجی آنالوگ است. پس حتی با مبدلهای مرسوم نیز نمیتوان این کارت گرافیک را به مانیتورهای با ورودی Analog و کانکتور VGA متصل کرد. خروجیهای HDMI این پنل بهگونهای طراحی شدهاند که به صورت هم زمان فعال میباشند تا در وضعیتهایی که عینکهای واقعیت مجازی به یکی از خروجیهای HDMI این کارت متصل میشود، خروجی دوم قابلیت اتصال به نمایشگر ثانویه را داشته باشد. لازم به ذکر است از این 5 خروجی تصویر، 4 خروجی قابلیت ارائه تصویر به صورت هم زمان را دارا میباشند. همچنین به لطف معماری فوقالعاده مدرن پاسکال امکان پشتیبانی از رزولوشن (7680x4320 @60Hz (8K به واسطه اتصال این کارت گرافیک به نمایشگر توسط دو کانکتور DP 1.3 نیز فراهم شده است.
همانند تمامی کارتهای گرافیک مدرن کنونی این مدل نیز از رابط PCI-Express 3.0 x16 پشتیبانی میکند و با سرعت فوقالعاده بالای (126.032Gbit/s (15.754GB/s با دیگر منابع سیستم در ارتباط است.
در تصویر بالا نیز کانکتورهای پل SLI-HB این کارت گرافیک را ملاحظه میکنید. همانطور که در صفحه معرفی معماری پاسکال به آن اشاره شد به دلیل تغییرات صورت گرفته در نسخه جدید DirectX 12 و الگوریتمهای مربوط به پیکربندیهای Multi-GPU معماری پاسکال، کارتهای گرافیک مبتنی بر این معماری طبق توصیه انویدیا تنها از پیکربندی دوگانه (2Way SLI) پشتیبانی میکنند.
همانند مدل مرجع انرژی مورد نیاز این کارت گرافیک 150W از طرق تنها یک کانکتور 8Pin PCI-Express تأمین میشود. روی کاغذ این کانکتور (150W) به همراه مقدار توان جذب شده توسط اسلات (PCI-Express (75W روی هم رفته 225W توان را برای این کارت اورکلاک شده فراهم میکنند که البته در حالت عادی کافی به نظر میرسد؛ اما شاید در شرایط اورکلاک سنگین پیکربندی ایده آلی محسوب نشود. این در حالی است که برخی مدلهای مشابه در برندهای رقیب برای تأمین انرژی خود از منبع تغذیه سیستم از دو کانکتور 6Pin و 8Pin استفاده میکنند.
نگاهی نزدیکتر (کولر ASUS DirectCU III with Triple Wing-Blade 0dB Fan)
نگاهی نزدیکتر (کولر ASUS DirectCU III with Triple Wing-Blade 0dB Fan)
همانطور که اشاره شد یکی از محوریترین ویژگیهای این کارت گرافیک کولر بسیار قدرتمند، کم صدا و از نظر طراحی کم نظیر این کارت گرافیک است؛ اما بگذارید برای بررسی موشکافانه کولر این کارت گرافیک که از بروزترین نسخههای کولرهای انحصاری DirectCU III کمپانی ASUS محسوب میشود، آن را از روی PCB باز کنیم.
کاملاً مشخص است که این کولر بسیار قدرتمند علاوه بر GPU حرارت ماسفت های مدار رگلاتور ولتاژ و حتی تراشههای حافظه را نیز به واسطه پدهای حرارتی و تسمههای آلومینیومی جذب و سپس دفع میکند. این قابلیت یکی از ویژگیهای بسیار ممتاز این کولر محسوب میشود؛ اما اجازه دهید از این هم فراتر برویم.
این کولر به صورت کلی از 5 بخش مجزا تشکیل شده است، توسط 6 پیچ فنر دار بر روی PCB نصب میشود و اجزاء مختلف آن توسط 34 عدد پیچ به یکدیگر متصل شدهاند! این اجزاء به شرح زیر میباشند:
- پنل و قاب پلاستیکی دور فنها به همراه RGB LED های تعبیه شده در آن
- 3 عدد فن 92mm
- هیتسینک آلومینیومی با هسته و هیت پایپ های مسی
- براکت فلزی جذب کننده حرارت تراشههای حافظه
- صفحه فلزی تعبیه شده بر روی پشت PCB و RGB LED های جاسازی شده در پشت لوگو ROG
در تصویر بالا پنل دور فنها به همراه نوارهای لولهای RGB LED تعبیه شده بر روی بخش بالایی و پایینی آن را ملاحظه میکنید.
کنترلر این RGB LED ها بر روی PCB کارت گرافیک تعبیه شده است و ارتباط با دیودهای نورانی تعبیه شده در پشت این پنل به وسیله کانکتور 4 پین که در تصویر بالا مشخص شده است صورت میگیرد.
در تصاویر بالا نیز صفحه محافظ فلزی تعبیه شده در پشت PCB را ملاحظه میکنید. این صفحه که به وسیله 13 عدد پیچ بر روی PCB نصب میشود در عمل هم از قطعات تعبیه شده در پشت PCB محافظت میکند و هم به نوعی به عنوان هیتسینک حرارت منتقل شده توسط قطعات به PCB را جذب میکند تا با سرعت بیشتری دفع شود.
همانطور که اشاره شد یکی از بخشهای نورپردازی این مادربرد لوگو ROG جاسازی شده درون صفحه محافظ پشت PCB این کارت گرافیک است. در تصویر بالا این نوع خاص RGB LED و کانکتور 4 پین آن را بر روی این صفحه مشاهده میکنید.
در تصویر بالا نیز براکت مخصوص آلومینیومی تعبیه شده بر روی تراشههای حافظه را ملاحظه میکنید. پدهای حرارتی به همراه واشرهای پلاستیکی شفاف تعبیه شده بر روی این براکت به ترتیب جهت جذب بهتر حرارت و عایق کاری الکتریکی در نظر گرفته شدهاند.
هیتسینک این کولر نیز متشکل از 4 هیت پایپ مسی آبکاری شده با قطر 10mm و 1 هیت پایت با قطر 6mm است که به صورت مستقیم و البته به واسطه خمیر حرارتی بسیار مرغوب با سطح Die تراشه گرافیکی (GPU) در تماس هستند و حرارت جذب شده را به دو شبکه مجزا با بیش از 70 تیغه آلومینیومی منتقل میکنند تا توسط 3 فن تعبیه شده بر روی آنها در سریعترین زمان ممکن دفع شود.
همچنین همانطور که اشاره شد این کولر علاوه بر جذب حرارت GPU به وسیله پدهای حرارتی مخصوص به دفع سریعتر حرارت ماسفت های مدار رگولاتور ولتاژ GPU نیز کمک میکند.
یکی از مهمترین خصوصیات فنهای این کولر تیغههای منحصر به فرد آن است. این تیغهها با طراحی خاص خود که ASUS آن را Wing-Blade نامیده است در عمل بیش از 105% فشار استاتیکی بیشتری نسبت به فنهای معمولی دارند که در نهایت باعث افزایش جریان هوا و کاهش نویز ایجاد شده توسط فنها میشود.
همچنین یکی دیگر از قابلیتهای بسیار دوست داشتنی این کولر حالت 0dB آن است! در واقع زمانی که کارت گرافیک در حالت بیباری است (مثل اوقاتی که در حال اجرای بازیهای سبک، تماشای یک ویدئو و یا مرور وب هستید) فنهای این کولر خاموش میشوند تا نویز صوتی سیستم شما به حداقل ممکن نزدیک شود. آن طور که ما متوجه شدیم در واقع زمانی که حرارت GPU در طی یک پروسه بیش از 10 ثانیهای از 65 درجه سانتیگراد فراتر میرود فنها شروع به کار میکنند.
هر 3 فن 92mm این کولر ساخت کمپانی Power Logic و دارای یاتاقان از نوع Long Life Bearing میباشند. نکته جالب توجه در مورد این فنهای 12V، جریان مصرفی متفاوت فن وسطی در مقایسه با دو فن کناری است! فنهای کناری از نوع 0.4A و با حداکثر سرعت چرخش 3500RPM هستند و فن وسط از نوع 0.25A و با حداکثر سرعت چرخش 2000RPM؛ اما دلیل این امر چیست؟ تجربه و تستهای جدید اثبات کردهاند که اگر سرعت چرخش هر 3 فن برابر باشد محل تلاقی جریان هوا ایجاد شده توسط دو فن کناری و جریان هوای ایجاد شده فن وسط باعث ایجاد یک فضای کور با حداقل جریان هوا در بخش مرکزی کولر میشود که عملاً دفع حرارت از هیتسینک در آن منطقه با بازدهی بسیار پایینی صورت میگیرد. استفاده از فن با سرعت کمتر در بخش مرکزی هیتسینک این اثر منفی را به حداقل ممکن میرساند و در عمل باعث توزیع یکنواخت جریان هوا در سرتاسر هیتسینک میشود.
به گفته کمپانی ASUS این کولر در مقایسه با کولر مرجع بیش از 30% خنکتر و بیش از 3 برابر کم صداتر است! حال باید دید عملکرد این کولر در عمل چگونه خواهد بود؟
یکی از دیگر قابلیتهای کم نظیر این کارت گرافیک در نظر گرفتن 2 کانکتور 4 پین PWM مجزا برای اتصال فنهای کیس سیستم به آنهاست. در واقع ASUS این قابلیت را فراهم کرده تا سرعت چرخش فنهای کیس با توجه به حرارت کارت گرافیک تعیین شود که در نوع خود اقدامی نو و البته کاربردی محسوب میشود. در سمت راست این کانکتورها، سوکت های مربوط به فن و RGB LED های این کارت گرافیک را ملاحظه میکنید.
کنترل و مانیتورینگ فنهای متصل شده به کانکتورهای فن نام برده نیز توسط دو تراشه مدل 3949S ساخت کمپانی NUVOTON صورت میگیرد.
نگاهی نزدیکتر (مدار رگولاتور ولتاژ و تراشههای حافظه)
نگاهی نزدیکتر (مدار رگولاتور ولتاژ و تراشههای حافظه)
اما نوبتی هم باشد نوبت اصل مطلب است! حتی در نگاه اول نیز میتوان متوجه شد که PCB، نوع قطعات و طراحی برد این مدل از پایه و اساس با مدل مرجع تفاوت دارد. طول و عرض PCB به صورت محسوس افزایش یافته و تا حدودی نیز نحوه چینش کامپوننت های مربوط به مدل رگولاتور ولتاژ تغییر کرده است. کمپانی ASUS بر خلاف مدل مرجع که به مدار رگولاتور ولتاژ از نوع 4l+1Phase مجهز شده است در طراحی جدید خود از مدار 6l+1Phase استفاده کرده است و البته در اکثر بخشها خازنهای جامد ژاپنی را جایگزین خازنهای Tantalum کرده است.
به لطف تکنولوژی انحصاری Auto-Extreme کمپانی ASUS تمامی مراحل ساخت و مونتاژ کارتهای گرافیک این کمپانی توسط رباتهای هوشمند انجام میشود که این امر کاهش خطاهای انسانی و ارتقاء کیفیت ساخت را به دنبال خواهد داشت.
در تصویر بالا از نمایی نزدیک قطعات مدار رگولاتور ولتاژ GPU و تراشههای حافظه این کارت گرافیک را ملاحظه میکنید. همانطور که اشاره شد در این مدار l6+1Phase، شش شریان وظیفه تأمین جریان مور نیاز تراشه گرافیکی (GPU) را بر عهده دارند و 1 شریان نیز جریان تراشههای حافظه را کنترل و مدیریت میکند. ASUS در این کارت گرافیک از قطعات با استاندارد جدید Super Alloy Power II استفاده کرده که در ادامه به معرفی تکتک آنها میپردازیم.
نسل جدید چوک های تحت عنوان Super Alloy Choke با حفظ ویژگیهای نمونههای قبلی خود نظیر عملکرد بسیار خنک و تحمل در برابر جریانهای بالا، این بار تا 2 برابر صدای وزوز (buzzing noise) کمتری نیز دارند.
همچنین همانطور که اشاره شد مدلهای مرجع Geforce GTX 1070 تقریباً در اکثر بخشهای مدار تغذیه از خازنهای Tantalum بهره میبرند؛ اما ASUS تمامی این خازنها را با خازنهای جامد ژاپنی فوقالعاده باکیفیت و با عمر بیش از 90 هزار ساعت تعویض کرده است. در واقع علیرغم عمر بسیار بالا و جریان نشتی بسیار کم، یکی از نقاط ضعف خازنهای Tantalum ظرفیت محدود آنها و تحمل کم در برابر جریانهای بالای شارژ و دشارژ است. به بیانی دیگر در اکثر مواقع نیز مهندسین طراح مدارهای الکترونیکی به دلیل کوچکتر بودن این خازنها تنها در زمانی که با محدودیتهای شدید فضا روبرو هستند و یا جریان نشتی ولو کم باعث ناپایدار شدن مدار میشود از این نوع خازنها استفاده میکنند. کمپانی ASUS با جایگزین کردن خازنهای جامد 820uf به جای خازنهای تانتالیوم 470uf در عمل باعث پایداری بیشتر سطح ولتاژ و افزایش پتانسیل عبور جریان شده است.
البته به دلیل محدودیت فضا در پشت PCB و برای افزایش بیش از پیش پایداری سطح ولتاژ، 2 خازن 560uf تانتالیوم دقیقاً در پشت محل نصب GPU بر روی PCB تعبیه شده است.
ماسفت های به کار رفته در مدار رگولاتور ولتاژ تراشه گرافیکی (GPU) از نوع PowIRstage IR3555 ساخت کمپانی International Rectifier هستند. این چیپ ها هر 4 بخش مهم یک شریان کنترل شونده ولتاژ با تکنیک PWM، یعنی Driver MOSFET، Control MOSFET، Synchronous MOSFET و دیود شاتکی محافظ را بهصورت مجتمع درون خود جای دادهاند. همچنین به گفته کمپانی سازنده هر یک از این چیپ ها قابلیت تحمل 60A جریان DC را نیز دارا میباشند و در بدترین شرایط نیز بازدهی انرژی بسیار بالایی دارند.
علاوه بر این پشتیبانی از پروتکشن های VCC under voltage lockout (UVLO)، Over temperature protection (OTP)، Cycle-by-cycle self-preservation over current protection (OCP)، Preliminary overvoltage protection (Pre-OVP) و برخورداری از سخت افزار محلی لازم برای مانیتورینگ Real Time جریان خروجی و حرارت چیپ به همراه پشتیبانی از فرکانس PWM تا 1.0MHz از ویژگیهای ممتاز این ماسفت ها محسوب میشود.
در تنها شریان تأمین کننده ولتاژ تراشههای حافظه به دلیل جریان به مراتب پایینتر از ترکیب ماسفت های Low RDS-on مدل QM3054M6 ساخت کمپانی UBIQ Semiconductor به عنوان ماسفت های High-Side و از مدل QM3056M6 نیز به عنوان ماسفت های Low-Side استفاده شده است. توانایی تحمل جریان ID حداکثر 103A در دمای Tc=25c از جمله ویژگیهای کم نظیر این ماسفت ها به شمار میرود.
تراشه PWM Controller مدار رگولاتور ولتاژ تراشه گرافیکی مدل Up9511P ساخت کمپانی uPI Semiconductor است. این تراشه که در واقع یک 8Phase Buck Controller است قابلیت بایاس در حالتهای 8/7/6/5/4/3/2/l1-Phase را نیز دار میباشد. از جمله قابلیتهای این تراشه میتوان به قابلیت DCR Current Sensing و پروتکشن های Over/Under Voltage و Over Temperature به همراه قابلیت کنترل نرم افزاری سطح ولتاژ خروجی اشاره کرد.
مدیریت مدار 1Phase تراشههای حافظه نیز بر عهده تراشه 2Phase Buck Controller مدل Up1666q ساخت کمپانی uPI Semiconductor است. از جمله امکانات ویژه این تراشه همراه داشتن MOSFET Driver با قابلیت Shoot-Through Protection و Bootstrap Schottky Diode به صورت مجتمع در پکیج خود است.
مانیتورینگ حرارت، ولتاژ و مدیریت سرعت چرخش فنها نیز توسط تراشه مدل 8915FN-56 ساخت کمپانی iTE صورت میگیرد.
در تصویر بالا نیز قلب این کارت گرافیک یا همان پردازنده گرافیکی (GPU) مدل GP104-200 را ملاحظه میکنید. در این GPU همانطور که اشاره شد 7.2 میلیارد ترانزیستور که بر پایه تکنولوژی 16nm FinFET کمپانی تایوانی TSMC ساخته شدهاند بر روی Die بهاندازه 314mm² مجتمع شدهاند.
همانند مدل مرجع کمپانی ASUS نیز از تراشههای حافظه GDDR5 مدل K4G80325FB-HC25 ساخت کمپانی کرهای SAMSUNG در این کارت گرافیک استفاده کرده است. هر یک از این تراشهها دارای حجم (8Gb (1GB و رابط 32bits هستند که روی هم رفته 8GB حافظه GDDR5 8000MHz با رابط کلی 256bits و پهنای باند معادل 256GB/s برای تراشه گرافیکی قدرتمند این کارت گرافیک فراهم میکنند.
متد و سیستم تست
متد، سیستم تست و پروفایل های ولتاژ و فرکانس
تستهای کارت گرافیک در لابراتوار تخصصی شهر سخت افزار به صورت کلی به چند بخش تقسیم میشوند:
- تستهای حرارتی
- تستهای مدیریت مصرف انرژی (توان مصرفی کل سیستم)
- تستهای کارایی GPGPU (General Purpose Graphics Processing Unit)
- تستهای کارایی گیمینگ
- تست اورکلاکینگ
برای مقایسه نتایج نیز از نتایج موجود در آرشیو لابراتوار استفاده شده است.
در جدول زیر مشخصات فنی سیستم Testbed لابراتوار شهر سختافزار را ملاحظه میکنید:
پارامترهای Bios در حالت پیشفرض تنظیمشدهاند (به استثنای فعال کردن قابلیت XMP)، دمای محیط در حین تست بهصورت ثابت بر روی 25 درجه سانتیگراد (با تلورانس 1 درجه) تثبیت شده و تنظیمات مدیرت مصرف انرژی در سیستمعامل نیز در وضعیت Balanced تنظیمشده است. همچنین تمامی نرم افزارهای امنیتی و قابلیت Windows Defender نیز غیرفعال شدهاند.
لازم به ذکر است تکنولوژی NVIDIA PhysX موجود در کارتهای گرافیک Geforce در تمامی تستهای کارت گرافیک لابراتوار غیرفعال شده است.
همچنین لیست نرمافزارهای Benchmark، Monitoring و Game ها که مبتنی API های مدرن DirectX 11، DirectX 12 و OpenGL میباشند به این شرح است:
- 3DMark Download v2.1.2973 + Time Spy
- 3DMARK 11 v1.0.132
- GTA V
- Crysis 3
- Call of Duty Black Ops III
- Battlefield Hardline
- Batman Arkham Knight
- Quantum Break
- Ashes of the Singularity
- Bioshock Infinite
- GRID 2
- Dirt Rally
- Sniper Elite III
- The Witcher 3 - Wild Hunt
- Unigine Valley 1.0
- Unigine Heaven 4.0
- Assassins Creed Syndicate
- AIDA64 Extreme Edition 5.75.3900
- SiSoftware Sandra Business 2016.03.22.20
- GPU-Z 1.9.0
- FurMark 1.18.0
در تصویر زیر نیز مشخصات فنی ASUS Geforce GTX 1070 STRIX GAMING OC را از نگاه نرمافزار GPU-Z ملاحظه میکنید:
همچنین ولتاژ هسته GPU نمونه برداری شده توسط ولتمتر دیجیتال در این کارت گرافیک همانند مدل مرجع در وضعیتهای Idle و Load کامل در شرایط مختلف به ترتیب حداقل 0.625V و حداکثر 1.062V ثبت شد.
همچنین همانطور که در تصویر بالا ملاحظه میکنید حداکثر فرکانس هسته GPU در حالت Boost در این مدل 2062MHz ثبت شده است. فرکانسی که در مقایسه با مدلهای مشابه از کمپانیهای رقیب بینظیر محسوب میشود.
متد تستهای کارایی
در این بخش آخرین و معتبرترین نرمافزارهای تست و محک کارت گرافیک به همراه بازیهای رایانهای روز را برای تست کارتهای گرافیک انتخاب کردیم.
تنظیمات گرافیکی در تمامی گیم ها بر روی حداکثر مقدار ممکن تنظیم شده است. البته تنظیمات گرافیکی منحصر به تراشههای گرافیکی Nvidia و یا AMD در تمامی گیم ها غیرفعال شدهاند.
تمامی تستهای Gaming در 4 رزولوشن و تکنیکهای Anti-Aliasing مختلف صورت گرفته است. کانفیگ های نامبرده به شرح زیر میباشند:
- 1600x900 – 0X MSAA
- 1920x1080 – 2X MSAA
- 2560x1440 – 4X MSAA
- 3840x2160 – 8X MSAA
علت اصلی انتخاب کانفیگ های بالا شبیهسازی شرایط برای نمایشگرهای مختلف با سایزهای مختلف بوده است. به این صورت که کانفیگ اول شرایط را برای مانیتورهای کوچکتر از 20 اینچ، کانفیگ دوم برای مانیتورهای 22 تا 25 اینچ، کانفیگ سوم برای مانیتورهای 25 اینچ و بزرگتر و کانفیگ چهارم نیز شرایط را برای نمایشگرهای فوقالعاده باکیفیت و مدرن 4K شبیهسازی میکنند.
البته در برخی گیم ها که فاقد 8X Multisample anti-aliasing بودند یا از تکنیکهای مشابه anti-aliasing استفاده میکنند، یا از همان 4X MSAA برای تست رزولوشن 4K استفاده شده و یا از تکنیکهای مشابه ولی با نسبتهای مختلف استفاده شده است. لازم به ذکر است که مقادیر مربوطه در نمودارهای مرتبط درج شده است.
نورپردازی خلاقانه تحت عنوان Aura RGB Lighting
نورپردازی خلاقانه تحت عنوان Aura RGB Lighting
کمپانی ASUS هم سو با مادربردهای جدید گیمینگ و سری ROG ساخت خود کارتهای گرافیک سری STRIX را نیز به نورپردازی به واسطه RGB LED تحت عنوان AURA مجهز کرده است.
در این کارت گرافیک نیز همانطور که اشاره شد نور پس زمینه لوگو ROG جاسازی شده در صفحه فلزی پشت PCB و RGB LED های تعبیه شده در بخش بالایی و پایینی فنهای کولر، نورپردازی این کارت گرافیک را بر عهده دارند.
همچنین در این مدل نرم افزار AURA برای کنترل و مدیریت رنگ و جلوههای نورپردازی در نظر گرفته شده است. همانطور که در تصویر بالا ملاحظه میکنید قابلیت انتخاب 16 میلیون رنگ به همراه 5 جلوه نوری مختلف برای نورپردازی این مدل در نظر گرفته شده است. از جمله جلوههای نوری جالب این مدل به میتوان به نورپردازی متناسب با به سطوح زیر و بم موسیقی در حال پخش و تغییر رنگ RGB LED ها با توجه به حرارت هسته GPU اشاره کرد.
در تصاویر بالا تمامی بخشهایی که در این کارت گرافیک برای نورپردازی به نور پس زمینه RGB LED مجهز شدهاند را مشاهده میکنید.
علاوه بر این در تصاویر بالا نیز برخی رنگهای نورپردازی خلاقانه و بسیار زیبای این کارت گرافیک به تصویر کشیده شده است.
تستهای مدیریت مصرف انرژی، حرارتی و نویز صوتی
تستهای مدیریت مصرف انرژی، حرارتی و نویز صوتی
در این سه تست توان مصرفی کل سیستم (به وسیله دستگاه Wattmeter)، حداکثر حرارت هسته GPU مانیتور شده توسط نرمافزار GPU-Z و نویز سنجیده شده توسط دستگاه Sound Meter تعبیه شده در فاصله 1 متری سیستم را در دو وضعیت زیر ثبت کردیم:
- پس از 15 دقیقه بیباری کامل سیستم (Idle)
- پس از 15 دقیقه Load کامل کارت گرافیک توسط تست GPU Stress نرمافزار FurMark در رزولوشن Full HD
حقیقتاً کارتهای گرافیک مبتنی بر معماری Nvidia Pascal در حال حاضر بهترین نمونههای موجود در بازار از نظر بازدهی مصرف انرژی هستند. در نمودار بالا به روشنی مشخص است که علیرغم اینکه Geforce GTX 1070 بیش از 40% کارایی بالاتری نسبت به مدل مشابه نسل قبل خود دارد (Geforce GTX 970) اما در عمل بیش از 25% انرژی کمتری مصرف میکند. به بیانی دیگر نسبت کارایی به توان مصرفی در نمونه نسل جدید بیش از 2 برابر بهتر شده است! ما این نتیجه را نوعی جادوگری برداشت میکنیم! شما چطور؟!
طبق محاسبات ما این کارت گرافیک اورکلاک شده نسبت به مدل مرجع که به گفته انویدیا دارای TDP حداکثر 150W است، حدود 30W الی 40W مصرف بیشتری دارد. در نتیجه اگر قصد تعبیه این مدل در یک سیستم مدرن و رده بالا را دارید پیشنهاد میکنیم حداقل از یک پاور استاندارد با توان واقعی 500W الی 550W استفاده کنید. همچنین در صورتی که از پیکربندیهای دوگانه SLI نیز استفاده میکنید به شما پاوری با توان واقعی حداقل 700W الی 750W توصیه میکنیم.
بالا بودن دمای حالت Idle این کارت گرافیک به دلیل حالت 0dB و خاموش شدن فنها در حالت بیباری حاصل شده است؛ اما حرارت فوقالعاده پایین آن در حالت Load کامل 2 دلیل عمده دارد. دلیل اول مصرف انرژی بسیار پایین آن و دلیل دوم کولر بسیار قدرتمند آن است. کاملاً مشخص است که در نمودار بالا تنها Radeon R9 FURY X که آن هم به خنک کننده آبی مجهز شده است عملکرد خنکتری نسبت به این کارت گرافیک دارد.
اگر از عملکرد کاملاً بیصدای ROG STRIX-GTX1070-O8G-GAMING در حالت Idle بگذریم. نویز صوتی بسیار پایین آن در حالت Load نیز را میتوان کاملاً نادیده گرفت! نویز صوتی تنها 37dB آن هم برای یک کارت گرافیک رده بالا نتیجه بسیار ممتازی محسوب میشود.
تستهای GPGPU با استفاده از نرم افزارهای AIDA64 5.75 و SISoftware Sandra 2016
تستهای GPGPU با استفاده از نرم افزارهای AIDA64 5.75 و SISoftware Sandra 2016
علاوه بر کاربردهای Gaming کارتهای گرافیک، برخی نرم افزارهای فنی و مهندسی و البته چند رسانهای نظیر نرم افزارهای CAD و ویرایش صوت و تصویر و ویدئو مانند مجموعههای نرم افزاری کمپانی Adobe با استفاده از برخی API های استاندارد مانند OpenCL و انحصاری مانند Nvidia CUDA فرآیند پردازش اطلاعات را بهطور بسیار محسوس و حتی بر برخی موارد خیره کننده تسریع میبخشند. این نوع نرم افزارها با استفاده از الگوریتمهای بسیار مدرن و هوشمند بار پردازش اطلاعات خود را تا حد ممکن به چند صد رشته مختلف تقسیم میکنند تا صدها Stream Processor و یا CUDA Core تعبیه شده در GPU کارتهای گرافیک با سرعت به مراتب بیشتر از CPU فرآیند پردازش اطلاعات پیچیده و زمان بر آنها را بر عهده بگیرند.
در این تست ابتدا با استفاده از بخش GPGPU Benchmark نرم افزار AIDA64 کارایی خام کارتهای گرافیک را در محاسبات ممیز شناور (Floating-Point) به صورت Single-precision یا 32bits و Double-precision یا 64bits با استفاده از API فراگیر OpenCL میسنجیم. سپس با استفاده از تستهای استاندارد نرم افزار SISoftware Sandra و البته دوباره با کمک رابط برنامه نویسی OpenCL کارایی پردازش همه منظوره (GPGPU) کارتهای گرافیک را در الگوریتمهای شبیه سازی شده پردازش تصاویر و نرم افزارهای فنی مهندسی محک میزنیم.
همانطور که در نتایج تستهای مختلف ملاحظه میکنید علیرغم افزایش حدوداً 2 برابری کارایی Compute یا پردازش همه منظوره در Geforce GTX 1070 نسبت به مدل مشابه نسل قبل (Geforce GTX 970) ولی کماکان عملکرد پایین مخصوصاً در تستهای Double-precision یا 64bits در مقایسه با مدلهای مشابه مبتنی بر تراشههای گرافیکی کمپانی AMD یکی از بزرگترین نقاط ضعف کارتهای گرافیک مبتنی بر معماری Pascal با تراشه GP104 محسوب میشود.
تستهای (3DMARK 11/Fire Strike/Time Spy (DirectX 12
تستهای (3DMARK 11/Fire Strike/Time Spy (DirectX 12
سری نرمافزارهای 3DMARK کمپانی Futuremark از سال 1999 تاکنون، بدون شک یکی از محبوبترین و معتبرترین نرمافزارهای تست کارایی کارتهای گرافیک بودهاند.
شاید منحصربهفردترین ویژگی نتایج تستهای این دو نرمافزار ایزوله بودن نتایج تستهای GPU و CPU میباشد که نتایج تستهای هر یک از قطعات نامبرده شده را نسبت به دیگری متمایز میکند. این امر کمک میکند تا بر روی پلتفرمهای مختلف نتایجی حدوداً یکسان را برای یک مدل کارت گرافیک داشته باشیم. درنتیجه مقایسه بین مدلهای مختلف کارتهای گرافیک حتی در پلتفرمهای مختلف نیز با سهولت بیشتری انجام میشود.
در جدیدترین نسخه 3DMARK با اضافه شدن تست Time Spy قابلیت سنجش کارایی کارتهای گرافیک در API جدید، بسیار مدرن و البته پربازده DirectX 12 نیز فراهم شده است. همانطور که در جدول زیر مشاهده میکنید به واسطه موتور گرافیکی ناب و بسیار کارآمد این تست، تمامی منابع مرتبط با رئوس، تکنیکهای پیاده سازی Tessellation و فراخوانی Compute Shader ها در سنگینترین و پیچیدهترین حالت ممکن صورت میگیرد تا تمامی تکنولوژیهای جدید پیاده سازی شده در DirectX 12 به بهترین نحو ممکن کفایت و کارایی خود را در عمل ثابت کنند.
به روشنی مشخص است که کارایی Geforce GTX 1070 نسبت به نمونه مشابه نسل قبل خود (Geforce GTX 970) بیش از 50% افزایش داشته است!
تست گیمینگ - (Ashes of the Singularity (DirectX 12
(Ashes of the Singularity (DirectX 12
بازی کامپیوتر Ashes of the Singularity یکی از بازیهای سبک استراتژیک است که توسط Oxide Games طراحی و ساخته شده و بهتازگی توسط کمپانی Stardock برای پلتفرم PC به بازار عرضه شده است. در قرن 21, انسانها توانستهاند به فناوری به نام Hailee دست پیدا کنند که آنها را برای خلق آینده بشریت کمک میکند. با استفاده از این فناوری، بشریت قادر است بهسرعت در سایر فناوریها به پیشرفتهای بزرگی دست پیدا کند و به نقطهای از تاریخ دست یابد که هیچکس حتی تصورش را هم نمیکند. به عنوان فن آوری های پیشرفته، انسانها سعی کردند تا آگاهی خود را فراتر از محدوده مشخص شده گسترش دهند. در ابتدا، انسان بدن طبیعی خود را نگه میداشت در حالی که ذهن خود را به صورت یکپارچه و به عنوان یک منبع محاسباتی واقع در شبکهای گسترده قرار میداد. طولی نکشید که انسانها به سطحی از علم رسیدند که دیگر نیازی به بدن برای تعامل با محیط اطراف نبود. حالا بشریت وارد عصر طلایی جدیدی شده است. گرافیک قابل قبول، مأموریتها مختلف همراه سطوح دشواری متنوع، استفاده از سلاحها و تجهیزات پیشرفته و موسیقی متن گوشنواز تنها بخشی از ویژگیهای منحصر به فرد این بازی است. Ashes of the Singularity موتور گرافیکی Nitrous را با خود به همراه دارد و جزء اولین بازیهای مبتنی بر API جدید DirectX 12 محسوب میشود. بازدهی بالای موتور گرافیکی این بازی در فرآیند پردازش نام همزمان (Async compute) از جمله ویژگیهای منحصر به فرد آن محسوب میشود.
یکی دیگر از نقاط ضعف تراشههای گرافیکی مبتنی بر معماری Pascal همانند Maxwell ضعف آنها در محاسبات به اصطلاح Async Compute یا ناهمزمان است. محاسباتی که پردازش کارآمد آنها در گیم ها و برنامههای مبتنی بر DirectX 12 نقش مهمی در افزایش بهرهوری کارایی نهایی خواهد داشت. در نمودارهای بالا ملاحظه میکنید که در این گیم به دلیل حجم بالای محاسبات ناهمزمان، Geforce GTX 1070 نتوانسته تمامی تواناییهای خود را ارائه کند و این تراشههای گرافیکی AMD هستند که در اکثر گیم های مبتنی بر DirectX 12 پیروز میدان هستند.
تست گیمینگ - (Quantum Break (DirectX 12
(Quantum Break (DirectX 12
کمپانی پرافتخار Remedy Entertainment در همکاری با Microsoft Corporation اقدام به ساخت عنوانی بزرگ با نام Quantum Break نمودند که در سبک اکشن، ماجراجویی و شوتر سوم شخص با زمینه علمی-تخیلی طراحی شده و توسط Microsoft Studios برای کنسول Xbox One و سیستم عامل Windows منتشر شده است.
Quantum Break یک بازی فوقالعاده جذاب با ایدهای نوین است که در آن، سفرهای زمانی و دستکاری زمان، ویژگی اصلی گیم پلی بازی است. شما در نقش جک (Jack Joyce) ظاهر میشوید که توانایی کنترل زمان را دارد و با کمپانی نابکاری که قصد پایان زمان را دارد، وارد مبارزه میشود. لحظات حماسی ویرانگری در قالب زمان فریز میشوند و صحنههایی بینظیر از مبارزه را خلق میکنند. تصمیمات شما بر بخشهای مختلف بازی اثر میگذارد، ولی به گفته کمپانی Remedy، بازی دارای پایانی منحصربهفرد است.
داستان Quantum Break که در بستر گذر و فریز زمان نوشته شده، با حضور ستارههای فیلمهای X-men؛ Game of Thrones؛ The Wire و ... جذابیت دوچندانی را برای شما به ارمغان میآورد.یکی از مهمترین نقاط قوت این بازی موتور بازی فوقالعاده مدرن Northlight Engine و برنامه نویسی سطح پایین مبتنی بر DirectX 12 است که آن را به یکی از مدرنترین بازیهای ویدئویی حال حاضر مبدل کرده است.
در این بازی مبتنی بر DirectX 12 نیز تقریباً اتفاق مشابه بازی Ashes of the Singularity تکرار شده است. همانطور که در نمودارها ملاحظه میکنید با بالاتر رفتن رزولوشن و پیچیدهتر شدن پردازش اطلاعات در نهایت در رزولوشن WQHD کارت گرافیک Geforce GTX 1070 8GB در رقابت با Radeon R9 FURY X 4GB جا میماند ولی در نهایت در رزولوشن UHD و آن هم به خاطر افزایش افسارگسیخته حجم بافتها این حافظه 8GB مدل Geforce است که موجب پیشی گرفتن مجدد Geforce GTX 1070 میشود.
تست گیمینگ - (GTA V (DirectX 11
(GTA V (DirectX 11
کمتر گیمری را میتوان پیدا کرد که تاکنون این بازی عظیم و سراسر هیجان را تا حالا تجربه نکرده باشد. سرانجام حدوداً 1.5 سال پس عرضه GTA V برای کنسولهای XBOX 360 و PlayStation 3 کمپانی Rockstar Games بالاخره این بازی پرطرفدار را برای PC Gamer ها نیز منتشر کرد.
اما GTA V را باید یک تحول دوباره و شاید حتی یک نقطه عطف برای راک استار نامید. عنوانی که در بدو ارائه به بازار توانست بهسرعت رکوردهای مختلفی را جابجا نماید. GTA V در دارای سه شخصیت اصلی میباشد که بازیکن میتواند در طول بازی هر کدام از این شخصیتها را انتخاب نموده، به سلیقه خود شخصی سازی کرده و یا با کسب امتیازاتی تواناییهای آنها را افزایش دهد. راک استار برای هر کدام از این شخصیتها داستانی در نظر گرفته که موجب پیچیدهتر و جذابتر شدن بازی شده است. البته بازی گهگاه از داستان اصلی دور میشود و بهطور کلی میتوان عدم یک داستان مطلوب با پایانی جالب توجه را از نقاط ضعف این بازی دانست. البته فراموش نکنید که داستان پیچیده این بازی که با شخصیت پردازی بینظیری هم همراه شده، برای آنکه بازیکن را بهسادگی به دنبال خود بکشد کاملاً جذابیتهای لازم را دارا میباشد.
در گیم های مبتنی بر DirectX 11 کارایی معماری Pascal بسیار فراتر از حد انتظار است! نکته جالب توجه در این تست عملکرد حیرت انگیز Geforce GTX 1070 8GB در رزولوشن UHD – 8X MSAA است! جایی که عملکرد سامانه فشرده سازی رنگ در Pascal و همین طور 8GB حافظه این کارت گرافیک در عمل خود را نشان دادهاند. این در حالی است که تمامی مدلهای 4GB به دلیل کافی نبودن حافظه Frame Buffer یا با خطای درایور مواجه شدهاند و یا عملکردی کمتر از 5FPS داشتند.
تست گیمینگ - (Assassin's Creed Syndicate (DirectX 11
(Assassin's Creed Syndicate (DirectX 11
Assassin's Creed Syndicate یک بازی ویدئویی تاریخی در سبک اکشن ماجرایی و مخفیکاری است که بهوسیلهٔ یوبیسافت توسعه یافته و توسط همان کمپانی نیز عرضه شده است. این بازی در ۲۳ اکتبر ۲۰۱۵ برای کنسولهای نسل هشتم، پلیاستیشن ۴ و ایکس باکس وان و در ۱۹ نوامبر ۲۰۱۵ نیز برای مایکروسافت ویندوز عرضه شد. این نهمین قسمت از مجموعه اصلی Assassin's Creed به شمار میرود که داستان آن ۷۵ سال پس از اتفاقات نسخهٔ Assassin's Creed Unity رخ میدهد. این نسخه نیز همانند دیگر بازیهای مجموعه در سبک اکشن ماجرایی، با دید سوم شخص و به صورت جهان باز میباشد و همچنین امکانات جدیدی شامل سیستم جدید جهانگردی، بهبود عملکرد مبارزات و مخفیکاری و ﺭﺍﻧﺪﻥ ﻭﺳﺎﯾﻞ ﻧﻘﻠﯿﻪ از جمله کالسکه است. ﺳﻼح ﻭ ﺍﺑﺰﺍﺭﻫﺎﯼ ﺟﺪﯾﺪﯼ ﺑﻪ ﺑﺎﺯﯼ ﺍﺿﺎﻓﻪ شده و همچنین بازیکن به صورت اختیاری قادر خواهد بود تا همانند بازی اتومبیل دزدی بزرگ ۵ هم در شخصیت جیکوب و هم در شخصیت ایوی بازی کند. به لطف موتور گرافیکی AnvilNext Engine که از نسخههای قبلی به Assassin's Creed Syndicate به ارث رسیده، پشتیبانی از اکثر قابلیتهای DirectX 11 و البته نورپردازی و کیفیت بسیار بالای بافتها در کنار سازگاری و بازدهی به مراتب بیشتر با سخت افزارهای مدرن از جمله ویژگیهای محوری این بازی محسوب میشوند.
تست گیمینگ - (Batman: Arkham Knight (DirectX 11
(Batman Arkham Knight (DirectX 11
Batman: Arkham Knight یک بازی ویدیویی در سبک اکشن-ماجراجویی است که توسط Rocksteady Studios و بر اساس داستانهای بتمن، ابرقهرمان کتابهای مصور DC Comics ساخته شده و توسط کمپانی برادران وارنر عرضه شده است. این نسخه چهارمین قسمت اصلی از سری بازیهای Batman: Arkham است و در ۲ ژوئن ۲۰۱۵ برای مایکروسافت ویندوز، ایکس باکس وان و پلیاستیشن ۴ منتشر شد.
بازی در شهر آرکهام اتفاق میافتد که بهطور آزادانه (دنیای آزاد) قابل جستجو است. هنگام حرکت در مناطق مختلف از شهر نیازی به صبر کردن و لود شدن بازی نیست که با توجه به نقشه بزرگ نکته قابل اشارهای میباشد. بسیاری از گجتهای قبلی بازیهای بتمن همچنان در این نسخه نیز مورد استفاده قرار گرفته است، از این جمله میتوان به Grapnel gun, line launcher, batarangs و سیستم شناسایی و قدرت مقابله بتمن اشاره کرد. اسلحه "disruptor" برای از کار انداختن یا منجمد کردن اسلحه دشمنان و اسلحه "booby-trap" برای وارد کردن شوک به دشمنانی که هنوز مسلح و آماده نشدهاند مورد استفاده قرار میگیرند. بازیکنان با استفاده از شنل بتمن میتوانند در سراسر شهر پرواز کنند و در حالی که پرواز میکنند، از گجتهایی مانند batarangs و line-luncher استفاده کنند. همچنین یک وسیلهی جدید به نام voice synthesizer به گجت های بتمن اضافه شده که بتمن به وسیله آن میتواند صدای دشمنانش را تقلید کند و به افراد آنها دستورهای دروغین بدهد.
تواناییهای مبارزات تک به تک بتمن هم در این بازی گستردش یافته است. برای وارد کردن خسارت بیشتر به حریفان بتمن میتواند آنها را به اطراف پرتاب کند، اما قدرت و پیچیدگی حمله حریفان نیز در این بازی افزایش یافته است. در این نسخه قابلیت جدیدی بنام " fear takedown" معرفی میشود که بتمن (قبل از اینکه توسط حریفان شناسایی شود) میتواند تا حداکثر پنج دشمن را همزمان (زمان در این حرکت آهسته میشود) نابود کند.
موتور بسیار محبوب این بازی یکی از بروزترین نسخههای Unreal Engine است که طیف وسیعی از قابلیتهای متعدد واقعگرایانه DirectX 11 و فناوریهای اختصاصی GAMEWORK کمپانی Nvidia در آن پیاده سازی شده است. البته در این تست به دلیل همسان سازی جزئیات گرافیکی میان کارتهای گرافیک ساخت کمپانیهای AMD و NVIDIA تنظیمات مربوط به NVIDIA GAMEWORK غیر فعال شدهاند.
تست گیمینگ - (Battlefield Hardline (DirectX 11
(Battlefield Hardline (DirectX 11
نسخهی جدید بازی با عنوان Hardline به درگیریهای درون شهری میان دو گروه خلافکار و نیروهای ویژهی پلیس میپردازد. بدون شک انتخاب قالب بازی از طرف استودیوی در نظر گرفته شده برای ساخت نسخهی جدید بسیار هوشمندانه و نوآورانه به نظر میرسد. استودیوی کار کشتهی Visceral Games که همگان آن را با عنوان فوقالعاده Dead Space میشناسند این بار بر خلاف همیشه که DICE ساخت بازی را بر عهده داشت، وظیفهی به ارمغان آوردن یک میدان نبرد داغ دیگر را بر دوش میکشد.
در بخش تک نفره شاید یک بخش داستانی هستیم. همه چیز حول محور یک پلیس به اسم Nick Mendoza میچرخد. نیک یک افسر نیرو SWAT میباشد که درگیر مأموریتهای جنایی و تعقیب گریز میباشد که میتواند از راههای مختلف اهداف خود را دنبال کرده که این حالت میتوانید بهصورت مخفی باید یا خشونت کامل! در این قسمت ابزار جدیدی در اختیار بازی باز قرار گرفته که یکی Police Scanner در بازی معرفی شده است. Police Scanner میتواند افراد مظنون را پیدا کند و اشیا و شواهد مهم را علامت گذاری کنید. این اطلاعات بخشی از قسمت تک نفره Hardline هست. ولی همیشه بخش چندنفره Battlefield قسمت مهم این سری را تشکیل میدهد و بخش داستانی زیر سایه چندنفره قرار دارد. باید دید با وجود جزئیات جدید بخش تک نفره تا چه حد میتواند موفق باشد. گیم پلی بازی کمی فرق کرده و حالا نوع جدیدی را به نمایش میگذارد و تمرکز عمده بازی مبارزه پلیس با دزدها یا همان جنایت کارها میباشد. چیزی که در Hardline میبینید جناح پلیس در برابر گروهی از افراد خلاف کار در آمریکا هست. در بازی به کلی آیتم و وسیله دسترسی دارید که میتوانید از آن برای مبارزه استفاده کنید و همینطور از بالای به ساختمان به قسمت دیگر ساختمان با زیپ لاین عبور کنید. تخریب هم در این شماره حضور دارد و میتوانید از آن به نفع خود استفاده کنید و مرکز لس انجلس را با خاک یکسان کنید.
نسخه جدید این بازی با حفظ تمامی ویژگیهای نسخه قبل با استفاده از جدیدترین نسخه موتور گرافیکی Frostbite 3 جدیدترین ویژگیهای واقعگرایانه گرافیکی مبتنی بر DirectX 11 نظیر Tessellation و قدرت تفکیکپذیری بیشتر بافتها را همراه خود دارد.
تست گیمینگ - (Call of Duty Black Ops III (DirectX 11
(Call of Duty Black Ops III (DirectX 12
در این شکی نیست که سری بازیهای ندای وظیفه بدون شک یکی از محبوبترین بازیهای حال حاضر ژانر شوتر اولشخص محسوب میشوند. جدیدترین نسخه این بازی یعنی BO3 چهل سال بعد از BO2 اتفاق میافتد و در این بین شما شاهد این هستید که روباتهای کوچکِ نسخهی قبلی، تبدیل به چه هیولاهایی شدهاند! گیمپلی بازی به لطف سیستم پریدنهای AW بیشباهت به عناوین تخیلی همانند Crysis نیست و البته بسیار سریعتر هم شده است. در طول نمایشهای بازی شاهد چیزهایی هستید که در نسخههای قبلی هم بودند اما در اینجا به شکل متفاوتتری گنجانده شدهاند. همانند مبارزه در زیر آب که مشابه آن در CoD: Ghosts هم وجود داشت و در اینجا هم شما باید به دشمنانی که در مسیرتان در آب قرار میگیرند، تیراندازی کنید! همچنین تریارک سعی کرده که گیمپلی بازی دارای تخریب پذیری قابلتوجهی باشد و در تریلرها شاهد ریزش ساختمانها براثر جنگ هستیم. تغییرات عمدهای در سلاحهای بازی حاصل شده و شما حتی میتوانید از دست خود به عنوان یک سلاح گرم استفاده کنید و بهوسیلهی آن دشمنان را آتش بزنید! با این اوصاف میتوان گفت که شرایط گیمپلی بازی دیگر همانند قبل نیست و شما رسماً با یک بازیِ علمی تخیلی که بسیاری از تکنولوژیهای نظامیِ آن فعلاً به شکل گسترده کار گرفته نشده، مواجه خواهید شد. موتور گرافیکی این بازی نیز مثل نسخههای قبل همان IW Engine کهن سال است. یکی از نقاط ضعف این موتور حجم بافتهای افسارگسیخته آن است که حتی کارتهای گرافیک با 4GB حافظه اختصاصی را نیز در رزولوشنهای بالا به چالش میکشد!
تست گیمینگ - (The Witcher 3: Wild Hunt (DirectX 11
(The Witcher 3 Wild Hunt (DirectX 11
شرکتهای لهستانی امروزه بیش از قبل در صنعت بازی سازی مطرح هستند و شرکت CDPR پرچم دار آنهاست. تنها در طول چند سال باعرضه تعداد محدودی بازی این شرکت توانست در رده بزرگان قرار گیرد و توجه همگان را به خود جلب کرده است.
گیم پلی این نسخه برخلاف نسخههای قبل که برخی با آن مشکل داشتند این بار بدون شک یکی از نقاط قوت اصلی این بازی محسوب میشود و سازندگان بر روی گسترش دنیای بازی تمرکز داشتهاند و به بازیکن امکان انجام فعالیتهای متنوعی نظیر سوارکاری، شنا و قایق رانی داده شده و این بار بازیکنان میتوانند بیش از قبل در نقش یک Witcher به نقش آفرینی بپردازند آن هم با شکار موجودات متنوع در دنیایی وسیع. مکانیکهای نبرد در این سری از بازیها همیشه با انتقادهای مختلفی همراه بوده اما این بار سازندگان تمام تلاش خود را برای روان سازی نبردها کردهاند و جزئیات مختلف این تجربه را شیرین کرده است بهطور مثال Geralt بهطور خودکار سلاح مورد نیاز برای مبارزهاش را انتخاب میکند و شما حتی میتوانید تیرهای دشمنان را با شمشیر خود دفع کنید البته با افزایش قدرت و مهارت که تنها محدود به این کار نیست. همچنین در این نسخه امکان نبرد بر روی اسب نیز مهیا شده است و اسب شما نیز همانند شخصیت اصلی ابزارهای خود را دارد. بهطور مثال شما میتوانید زین بهتری برای اسبتان تهیه کنید تا هنگامی که با سرعت در حال سوارکاری هستید دیرتر خسته شود یا مثلاً با یک چشم بند میتوانید باعث شوید اسبتان دیرتر از صحنههای نبرد به خاطر ترسش بگریزد.
به لطف موتور گرافیکی REDEngine 3 این بازی از تمام قوای پردازندههای چند هستهای استفاده میکند و شما در صورتی که به دنبال نرخ فریم بالا هستید، باید تنها نگران کارت گرافیک خود باشید.
تست گیمینگ - (Sniper Elite III (DirectX 11
(Sniper Elite III (DirectX 11
نسخهی سوم این سری سعی دارد از کلیشههای معمول فاصله بگیرد و برای تحقق این نکته سازندگان دست به یک ریسک بزرگ زدهاند و لوکیشن اصلی بازی را از خیابانها و ساختمانهای ویران اروپا به صحرای گرم و سوزان آفریقا تغییر دادهاند. بازی در بازهی زمانی سال ۱۹۴۰ تا ۱۹۴۳ میلادی جریان دارد، جایی که شعلههای آتش این جنگ ویرانکننده به آفریقا نیز رسیده است و این قاره را نیز در کام آتش خود فرو برده است. گیمر در نقش یک تک تیرانداز قرار میگیرد که عضوی از نیروهای متفقین میباشد. دلیل انتخاب تک تیراندازی از نیروهای متفقین این بوده است که اولاً تک تیراندازها در نیروهای متفقین نقش بسیار مهمی ایفا میکردند و در بسیاری از مأموریتها نقشی کلیدی دارا بودند و از سوی دیگر شمال آفریقا تحت نفوذ نازیها میباشد و سادهترین راه برای ورود به مناطق آنها از طریق استتار و مخفی کاری است که این کار تنها از سوی یک تک تیرانداز قابل انجام میباشد. شخصیت اصلی بازی فردی به نام Karl Fairburne میباشد که از تک تیراندازان زبدهی نیروی OSS به شمار میآید. محیط بازی با توجه به فضای آفریقا طراحی شده است و با توجه به اینکه مناطق شمالی قارهی آفریقا دارای رشتهکوههایی میباشند در بازی نیز شاهد تپهها و کوههای بلندی هستیم که فضای مناسبی برای یک تک تیرانداز است.
این بازی که در ژانر شوتر سوم شخص طبقهبندی میشود همانند نسخه قبل از موتور Asura ساخت کمپانی Rebellion بهره میبرد. این بازی پرطرفدار در 27 جون 2014 برای PC و کنسولهای XBOX و PS4 منتشر شده است.
تست گیمینگ - (Crysis 3 (DirectX 11
(Crysis 3 (DirectX 11
سومین نسخه از شاهکار استودیو بازی سازی Crytek بدون شک یکی از واقعگرایانهترین و گرافیکیترین گیم هایی است که تاکنون منتشر شده است. این بازی به لطف موتور گرافیکی Cry Engine 3.0 و پشتیبانی کامل از تمامی ویژگیهای جدید Direct X 11 مانند Tessellation، Real -Time Area Light و کیفیت بسیار بالای بافتها بدون شک هر بینندهای را متحیر میکند. تمامی این ویژگیها باعث شده تا تنها با استفاده از کارتهای گرافیک High-End بتوان اجرای این بازی را در بالاترین جزئیات گرافیکی و قدرت تفکیکپذیری بالا تجربه کرد.
تست گیمینگ - (GRID 2 (DirectX 11
(GRID 2 (DirectX 11
این بازی بدون شک یکی از بهترین و موفقترین بازیهای Car Racing منتشر شده توسط کمپانی Codemasters میباشد. این نسخه گرافیکی چشم گیری دارد. بهطوری که نسخه یک خود را با تمام ضعفها پشت سر گذاشته و گرافیک خود را آنقدر زیبا جلوه داده که حتی در مقابل نسخه اول هزاران برابر بهتر است. تمام محیطهای مسابقه از شهرها و جادههای خاکی گرفته تا پیستها از جزئیات خوبی برخوردار هستند. هنگام مسابقه از زمین در جادههای خاکی گرد و خاک بلند میشود. آسمان هم برخلاف نسخه قبل پویا و دینامیک است. این همه زیبایی با موتور اختصاصی Codemasters یعنی Ego و مبتنی بر ویژگیهای جدید گرافیکی DirectX 11 ساخته شده است.
تست گیمینگ - (Dirt Rally (DirectX 11
(Dirt Rally (DirectX 11
بازی کامپیوتر DiRT Rally یکی از بازیهای سبک شبیه ساز و ورزشی است که توسط Codemasters Racing Studio طراحی و ساخته شده و توسط کمپانی Codemasters برای پلتفرم PC به بازار عرضه شده است. به جهان DiRT Rally خوش آمدید، دنیایی در بیابانهای سوزان. این نسخه که بهتازگی و زورتر از موعد مقرر در دسترس گیمرها قرار گرفته است، موتورهای جدید، مکانهای جدید، حالتهای جدید بازی و وسایل نقلیه جدید را شامل میشود و طبق گفته سازندگان بازی قرار است بهطور منظم بهروزرسانی شود. در این نسخه تمامی مهارتهای شما در رانندگی به چالش کشیده خواهد شد و مورد آزمون قرار خواهد گرفت. در طول مسیرهای پر پیچ و خم و خطرناک بهشدت مراقب سرعت خود باشید زیرا یک اشتباه ضررهای جبران ناپذیری به بار خواهد آورد. اگر تا پایان مسیر بتوانید بدون برخورد بهجایی به خط پایان برسید، پاداش قابل توجهی دریافت خواهید کرد. در هر مرحله تست جداگانه از شما گرفته خواهد شد، بهطوری که تفاوت سطوح مسابقات را بهخوبی درک کرده و در پایان مراحل به آنچنان مهارتی رسیدهاید که میتوانید در طیف گستردهای از انواع آب و هوا بهراحتی به رانندگی خود ادامه دهید. پس از پایان هر مرحله، وسیله نقلیه شما نیاز به رسیدگی دارد و اگر بهمرور توجهی به آن نشود، آسیب جدی به مکانیک ماشین وارد خواهد شد. گرافیک خیره کننده، تجربه 3 منطقه جدید، 36 مرحله چالش برانگیز، رانندگی در طول روز و در شرایط جوی خشک، ابری، آفتابی، مرطوب، بارانی و برفی و در طول شب، گذشت از شهرهای ولز و مونتکارلو، بیش از 20 مدل مختلف از ماشینهای کلاسیک، تغییر فیزیک رانندگی و بهبود گیم پلی، امکان استخدام چهار مهندس برای کار بر روی وسیله نقلیه و مناظر چشمنواز در کنار موسیقی متن گوشنواز تنها بخشی از ویژگیهای منحصر به فرد این بازی است.
این بازی نیز مثل نسخههای قبلی آن از موتور اختصاصی کمپانی Codemasters یعنی EGO Engine استفاده میکند. بدون شک عملکرد فوقالعاده کارآمد این موتور در عنوانهایی نظیر F1 و DRIT نیز بارها در عمل ثابت شده است.
این بازی از جمله عناوینی است که تکنیکهای فشرده سازی رنگ معماری Pascal بهخصوص در رزولوشن UHD و تکنیک 8X MSAA که افزایش وصف ناپذیر حجم بافتها را به دنبال دارد، به صورتی کاملاً محسوس نقش تعیین کنندهای در افزایش کارایی دارد.
تست گیمینگ - (Unigine Heaven v4.0 (DirectX 11
(Unigine Heaven v4.0 (DirectX 11
بنچ مارک Unigine Heaven v4.0 آخرین نسخه از این نرمافزار محسوب میشود که بر پایه موتور UNIGINE Engine یکی از بهترین و معتبرترین تستهای مبتنی بر DirectX 11 محسوب میشود. محیط گرافیکی بنچ مارک دهکدهای جادویی را شبیهسازی میکند که در آن انواع و اقسام بافتها مشاهده میشوند. از جمله ویژگیهای گرافیکی این بنچ مارک میتوان به hardware tessellation،global illumination و screen-space ambient occlusion اشاره کرد.
تست گیمینگ - (Unigine Valley Benchmark 1.0 (DirectX 11
(Unigine Valley Benchmark 1.0 (DirectX 12
نسخه Valley که جدیدترین بنچ مارک این کمپانی محسوب میشود در فضایی کاملاً متفاوت نسبت به نسخه قبل دنبال میشود. رندر تصاویر بسیار بدیع و زیبا از طبیعت سبز و کوهستان دست نخورده در کنار تکنولوژیهای واقعگرایانه نظیر dynamic sky، volumetric clouds، sun shafts، Depth Of Field و ambient occlusion در کنار قابلیت dynamic weather این بنچ مارک را به یکی از مدرنترینهای حال حاضر مبدل کرده است.
تست اورکلاکینگ به کمک نرم افزار ASUS GPUTweak II
تست اورکلاکینگ به کمک نرم افزار ASUS GPUTweak II
نوبتی هم باشد نوبت تست هیجان انگیز اورکلاکینگ است. برای این منظور از آخرین نسخه نرم افزار مخصوص اورکلاک کارت گرافیک انحصاری کمپانی ASUS یعنی GPUTweak II کمک گرفتیم.
همانطور که ملاحظه میکنید این نرم افزار دارای دو رابط کاربری Simple Mode و Professional Mode میباشد. در رابط Simple Mode برای این کارت گرافیک 3 پروفایل مختلف OC Mode، Gaming Mode و Silent Mode در نظر گرفته شده است که هر یک دارای تنظیمات خاصی برای پارامترهای فرکانسی و پروفایل سرعت چرخش فن هستند. در این بخش همچنین امکان فعال و غیرفعال سازی حالت 0dB (خاموش شدن فنها در حالت Idle) نیز برای فنها در نظر گرفته شده است. در تصاویر زیر نیز رابط کاربری Professional Mode این نرم افزار را مشاهده میکنید. در این رابط کاربری قابلیت تنظیم فرکانسهای بخشهای مختلف با دقت بالا، امکان افزایش ولتاژ هسته GPU، کنترل سرعت چرخش فن به صورت دستی و سامانه محدود کننده توان مصرفی به صورت درصدی فراهم شده است.
همانطور که ملاحظه میکنید تنظیمات پیش فرض این کارت گرافیک در پروفایل OC گنجانده شده است. در این وضعیت فرکانس Boost هسته GPU و حافظههای GDDR5 به ترتیب 1860MHz و 8008MHz تعیین شده است.
در تصاویر بالا نیز مشخصات فرکانسهای حالتهای Gaming و Silent را مشاهده میکنید. نکته جالب توجه در پروفایل Silent، افزایش پارامتر محدود کننده توان مصرفی به 90% توان نامی است!
در تصویر بالا نیز بخشی از امکانات مانیتورینگ این نرم افزار را مشاهده میکنید.
اما ما قصد داشتیم تا حداکثر پتانسیل اورکلاکینگ این کارت گرافیک را محک بزنیم. به همین منظور حدوداً 1 ساعتی به تست و تغییر پارامترهای مختلف فرکانسی، ولتاژی، سرعت چرخش فن و البته کم کردن تأثیر محدود کننده توان مصرفی پرداختیم.
برای این منظور ابتدا ولتاژ هسته GPU را بر روی حداکثر مقدار ممکن تنظیم کردیم. سپس محدود کننده توان را نیز تا حداقل مقدار ممکن (120%) کاهش دادیم. در این وضعیت همانطور که ملاحظه میکنید در فرکانس توربو 1923MHz برای هسته GPU و 9350MHz برای حافظههای GDDR5 به مرز ناپایداری رسیدیم. این یعنی حدود 15 درصد اورکلاک هسته GPU و 16 درصد اورکلاک حافظه نسبت به فرکانس مدل مرجع که نتیجه بسیار خوبی محسوب میشود.
البته همانطور که در تصویر بالا ملاحظه میکنید در این وضعیت حداکثر فرکانس Boost از 2062MHz به مرز 2164MHz نیز رسیده است. همچنین در نمودارهای زیر میتوانید دمای GPU، نویز صوتی فن و توان مصرفی کل سیستم را در این وضعیت مشاهده کنید.
در این حالت حداکثر سرعت چرخش فنها از 1879RPM به 2068RPM رسیده و این میزان افزایش سرعت چرخش فنها حداکثر 1dB به نویز صوتی آنها افزوده است. البته کم کردن محدودیت توان مصرفی این کارت نیز در عمل محدودیتهای حرارتی پیش فرض تعیین شده را نیز کمتر کرده و حداکثر دمای هسته GPU به 73 درجه سانتیگراد رسیده که البته هنوز هم نتیجهای عالی محسوب میشود. هم چنین در این حالت توان مصرفی کل سیستم نیز تا 305W افزایش یافته است که طبق محاسبات ما توان مصرفی این کارت گرافیک در وضعیت فوق حدود 210 الی 215 است.
همچنین در تستهای زیر نیز میتوانید کارایی گیمینگ این کارت گرافیک را در چند تست مختلف مشاهده کنید:
جمع بندی، سخن پایانی و امتیاز شهر سخت افزار
جمع بندی، سخن پایانی و امتیاز شهر سخت افزار
بگذارید در این بخش همانند روال پیشین بررسی اولین قطعه از یک پلتفرم یا معماری خاص ابتدا عملکرد و کارایی آن معماری و یا پلتفرم را جمع بندی کنیم.
بدون شک پردازندههای گرافیکی (GPU) مبتنی بر معماری Nvidia Pascal کارآمدترین و در عین حال قدرتمندترین تراشههای گرافیکی حال حاضر میباشند. همانطور که در تستهای حرارتی، توان مصرفی و اغلب تستهای کارایی مشاهده کردید عملکرد بعضاً حیرت انگیز این تراشههای گرافیکی مدرن و پربازده (از حیث کارایی نسبت به مصرف انرژی) جای هیچ بحث و حاشیهای را باقی نمیگذارد. ولی از سوی دیگر بر روی ضعف آنها نیز در گیم های مبتنی بر DirectX 12 و عملکرد ناکارآمد در پردازش دادههای ناهمزمان (Async Compute) نیز نمیتوان سرپوش گذاشت. البته این در حالی است که در اکثر مواقع این تراشهها آنقدر قدرتمند هستند که حتی با وجود عملکرد ناکارآمد آنها در وضعیتهای نام برده باز هم در اکثر مواقع بهتر از قدرتمندترین تراشههای کمپانی رقیب عمل میکنند. همچنین اگر کاربردهای شما بهگونهای است که محاسبات GPGPU و بهخصوص نوع FP64 یا Double-precision آن نقشی تعیین کنندهای را بازی میکنند اکیداً به شما توصیه میکنیم که به هیچ عنوان به سراغ کارتهای گرافیکی مجهز به تراشههای گرافیکی GP104 و ضعیفتر، با معماری Pascal نروید.
اما اگر با دیدی کلی به ASUS Geforce GTX 1070 STRIX GAMING OC بنگریم حقیقتاً با یک کارت گرافیک فوقالعاده باکیفیت، بادوام و با طراحی ظاهری بسیار زیبا و البته خلاقانه روبرو هستیم. اورکلاک کارخانهای قابل توجه، عملکرد فوقالعاده خنک و بیصدا آخرین نسخه کولر DirectCU III ، به همراه بازدهی بسیار بالای مصرف انرژی و نورپردازی خلاقانه به واسطه RGB LED از جمله ویژگیهای کم نظیر این کارت گرافیک محسوب میشود.
علاوه بر این تکنولوژی انحصاری Auto Extreme به همراه استفاده از قطعات فوقالعاده باکیفیت و مدرن با استاندارد Alloy Power II نیز خیال شما را از بابت عمر بالا و کارکرد بدون مشکل این کارت گرافیک در فواصل طولانی مدت راحت میکند.
به عنوان سخن پایانی اگر به دنبال خرید یک کارت گرافیک رده بالا و البته خوش قیمت برای لذت بردن از جدیدترین بازیهای روز با رزولوشن WQHD و UHD آن هم با بالاترین کیفیت و جزئیات گرافیکی در سکوت مطلق هستید کارت گرافیک ASUS Geforce GTX 1070 STRIX GAMING OC در کلاس خود یکی از بهترینها محسوب میشود. البته اگر به بازیهای مبتنی بر عینکهای واقعیت مجازی (VR) نیز علاقه دارید با عملکرد فوقالعاده بالا و بسیار کارآمد این کارت گرافیک در این نوع بازیها جای هیچ نگرانی از این بابت هم نخواهد بود. پس در خرید آن حتی لحظهای هم درنگ جایز نیست!
نقاط قوت
- طراحی کم نظیر و کیفیت ساخت فوقالعاده بالا
- عملکرد و کارایی فوقالعاده در برابر قیمت
- نورپردازی خلاقانه و بسیار زیبا AURA
- مصرف انرژی بسیار بهینه
- کارکرد بسیار خنک و در عین حال بیصدا
- همراه داشتن 8GB حافظه گرافیکی
- پشتیبانی از خروجی تصویر HDMI 2.0 و DisplayPort 1.4
نقاط ضعف
- تعبیه یک کانکتور 6Pin PCI-Express دیگر در کنار کانکتور 8Pin در نظر گرفته شده میتوانست باعث افزایش پتانسیل این مدل در Extreme Overclocking شود
- خروجی تصویر DVI-D این کارت گرافیک فاقد سیگنال آنالوگ (VGA) است
- عملکرد GPGPU بهخصوص در پردازش اطلاعات به صورت Double-precision ناامید کننده است
با تمامی این تفاسیر کارت گرافیک "ASUS GTX1070-O8G-GAMING" موفق به کسب امتیاز ممتاز 9.2، نشان "Editor's' Choice" و ریز امتیازات زیر در کلاس محصولات (H (High-End از لابراتوار شهر سختافزار شد.ASUS Geforce GTX 1070 STRIX GAMING OC
کلاس عرضه : گران قیمت / رده بالا9بستهبندی9.5امکانات و سازگاری9اورکلاکینگ9.5کیفیت ساخت و طراحی9کارایی9ارزش خرید9.2امتیاز شهرسختافزارنشان شهرسختافزار9.2نکته مهم: تمامی مراحل نگارش این بررسی اعم از تست ها، عکس ها، ویدئوها، نمودارها و تحلیل ها همگی در لابراتوار تخصصی شهرسخت افزار انجام شده است. این بررسی هیچ منبع داخلی و خارجی ندارد.
در صفحه بعد نیز میتوانید گالری کاملی از عکسهای مربوط به این محصول را مشاهده کنید.
گالری عکس
گالری عکس
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت