بررسی تخصصی کارت گرافیک GIGABYTE GEFORCE GTX 1070 G1 GAMING 8GB: یک عمر بی‌دغدغه بازی کنید!

مفتخریم به فاصله حدوداً دو هفته با بررسی دومین کارت گرافیک از سری Geforce GTX 1070 8GB در خدمت شما عزیزان باشیم. این بار GIGABYTE GEFORCE GTX 1070 G1 GAMING را به این چالش دعوت کرده‌ایم! این مدل در مقایسه با مدل مرجع حدوداً 8% اورکلاک شده، کولر بسیار قدرتمند و کم صدا 3 فن  WINDFORCE 3X را با خود به همراه دارد و در بخش فوقانی PCB نیز به RGB LED مجهز شده است. باید دید در عمل چه عملکردی را از این کارت گرافیک شاهد خواهیم بود...

مقدمه

 

اگر خاطرتان باشد اولین بررسی از کارت‌های گرافیک مبتنی بر معماری پاسکال با رویو کارت گرافیک ASUS Geforce GTX 1070 STRIX GAMING OC شروع شد و کارایی حیرت انگیز و بازدهی مصرف انرژی بسیار بالای معماری پاسکال را در عمل مشاهده کردیم؛ اما امروز شما را به بررسی یک کارت گرافیک مشابه ولی ساخت کمپانی خوش‌نام GIGABYTE دعوت می‌کنیم. ابتدا اجازه دهید برای یادآوری و البته آشنایی کاربران جدید با جو حال حاضر، گذری به تاریخچه عرضه و قیمت گذاری کارت‌های گرافیک جدید مبتنی بر پاسکال بزنیم:

همان‌طور که اطلاع دارید کارت‌های گرافیک مبتنی بر این معماری با مدل تجاری GTX 10xx معرفی شده‌اند و تا به امروز و به‌صورت رسمی مدل Geforce GTX TITAN X Pascal 12GB به‌عنوان پرچم دار، مدل‌های Geforce GTX 1080 8GB و Geforce GTX 1070 8GB به‌عنوان کارت‌های رده بالای گیمینگ این معماری و Geforce GTX 1060 3GB/6GB نیز به‌عنوان مدل میان رده این خانواده روانه بازار شده‌اند. البته زمزمه‌هایی نیز مربوط به معرفی مدل بسیار قدرتمند Geforce GTX 1080 Ti 12GB که مدل محدود شده Geforce GTX TITAN X Pascal محسوب می‌شود و کارت گرافیک فوق‌العاده خوش قیمت و اقتصادی Geforce GTX 1050 Ti در ماه‌های پیش رو شنیده می‌شود. این چند مدل معرفی شده به‌صورت کلی دارای 3 تراشه گرافیکی (GPU) مختلف هستند. مدل‌های پرچم دار به تراشه بسیار قدرتمند GP102 با بیش از 3584 CUDA Core مجهز شده‌اند. مدل‌های رده بالا تراشه بسیار کارآمد GP104 مجهز به حداکثر 2560 CUDA Core را با خود به همراه دارند و تنها مدل میان رده این معماری نیز با تراشه GP106 و 1280 CUDA Core عرضه شده است.

 

مدل‌های رده بالای مبتنی بر این معماری همانند روال پیشین کمپانی انویدیا شامل یک مدل با امکانات و قابلیت‌های کامل ولی باقیمت نسبتاً بالا (Geforce GTX 1080) و یک مدل تا حدودی محدود شده ولی باقیمت بسیار مناسب و وسوسه کننده (Geforce GTX 1070) می‌شوند.

در واقع Geforce GTX 1070 8GB حدوداً $400 دلاری تنها با 640 CUDA Core کمتر، برخورداری از حافظه‌های GDDR5 8000MHz به جای حافظه‌های GDDR5X 10000MHz به کار رفته در Geforce GTX 1080 و حدوداً 100MHz فرکانس پایه کمتر GPU بیش از 37% از Geforce GTX 1080 8GB باقیمت حدودی $640 ارزان‌تر است. این در حالی است که در تست‌های عملی اختلاف کارایی بین این دو مدل به‌صورت میانگین حداکثر 20% است. این بدین معناست که همواره برای داشتن بهترین‌ها باید هزینه به مراتب بیشتری بپردازید؛ اما در صورتی که همواره به دنبال خرید قطعات مقرون به‌صرفه و با نسبت کارایی به قیمت بالا هستید Geforce GTX 1070 8GB انتخاب زیرکانه‌تری محسوب می‌شود.

گیگابایت تا هم اکنون که در حال نگارش این مقاله هستیم به غیر از مدل Founders Edition که با کولر و مشخصات مرجع انویدیا تولید می‌شود، 6 مدل مختلف با مشخصات مرجع و اورکلاک شده از کارت گرافیک Geforce GTX 1070 تحت عنوان‌های Mini ITX، WINDFORCE، G1 Gaming و Xtreme Gaming تولید و روانه بازار کرده است. در این بین مدل Xtreme Gaming کامل‌ترین و گران قیمت‌ترین و مدل Mini ITX ارزان قیمت‌ترین و البته جمع و جورترین عضو این خانواده محسوب می‌شوند.

 

دفتر گیگابایت چندی پیش مدل GEFORCE GTX 1070 G1 GAMING 8GB را برای تست و بررسی به لابراتوار تخصصی شهر سخت افزار ارسال کرد که میان مدل‌های نام برده یکی از بهترین‌ها از نظر کارایی به قیمت محسوب می‌شود.

 

این مدل در مقایسه با مدل مرجع حدوداً 8% اورکلاک شده (کلاک پایه هسته GPU در حالت OC Mode)، کولر بسیار قدرتمند و کم صدا 3 فن  WINDFORCE 3X دارای حالت 0dB را با خود به همراه دارد و در بخش فوقانی PCB نیز به RGB LED مجهز شده است. همچنین از نظر طراحی و قطعات نیز به گونه‌ای مدل تقویت شده برد مرجع محسوب می‌شود و کامپوننت های تحت استاندارد Ultra Durable گیگابایت را با خود به همراه دارد.

برای همین منظور برای یادآوری هم که شده ابتدا به معرفی معماری Nvidia Pascal و تشریح مهم‌ترین ویژگی‌ها و قابلیت‌های آن می‌پردازیم، سپس شما را با تراشه گرافیکی (GPU) به کار رفته در این کارت گرافیک (GP104-200) و مشخصات فنی این محصول آشنا می‌کنیم. در ادامه نیز پس از معرفی و بررسی سخت افزاری این کارت گرافیک و تشریح بخش‌های مختلف آن با تست‌های کارایی گیمینگ و GPGPU، تست‌های حرارتی، نویز صوتی و مدیریت مصرف انرژی و در نهایت تست‌های اورکلاکینگ عیار کیفیت و کارایی این مدل را از ابعاد مختلف محک می‌زنیم. با ما همراه باشید.

نکته مهم: تمامی مراحل نگارش این بررسی اعم از تست ها، عکس ها، ویدئوها، نمودارها و تحلیل ها همگی در لابراتوار تخصصی شهرسخت افزار انجام شده است. این بررسی هیچ منبع داخلی و خارجی ندارد.

مفتخریم به فاصله حدوداً دو هفته با بررسی دومین کارت گرافیک از سری Geforce GTX 1070 8GB در خدمت شما عزیزان باشیم. این بار GIGABYTE GEFORCE GTX 1070 G1 GAMING را به این چالش دعوت کرده‌ایم! این مدل در مقایسه با مدل مرجع حدوداً 8% اورکلاک شده، کولر بسیار قدرتمند و کم صدا 3 فن  WINDFORCE 3X را با خود به همراه دارد و در بخش فوقانی PCB نیز به RGB LED مجهز شده است. باید دید در عمل چه عملکردی را از این کارت گرافیک شاهد خواهیم بود...

مقدمه

 

اگر خاطرتان باشد اولین بررسی از کارت‌های گرافیک مبتنی بر معماری پاسکال با رویو کارت گرافیک ASUS Geforce GTX 1070 STRIX GAMING OC شروع شد و کارایی حیرت انگیز و بازدهی مصرف انرژی بسیار بالای معماری پاسکال را در عمل مشاهده کردیم؛ اما امروز شما را به بررسی یک کارت گرافیک مشابه ولی ساخت کمپانی خوش‌نام GIGABYTE دعوت می‌کنیم. ابتدا اجازه دهید برای یادآوری و البته آشنایی کاربران جدید با جو حال حاضر، گذری به تاریخچه عرضه و قیمت گذاری کارت‌های گرافیک جدید مبتنی بر پاسکال بزنیم:

همان‌طور که اطلاع دارید کارت‌های گرافیک مبتنی بر این معماری با مدل تجاری GTX 10xx معرفی شده‌اند و تا به امروز و به‌صورت رسمی مدل Geforce GTX TITAN X Pascal 12GB به‌عنوان پرچم دار، مدل‌های Geforce GTX 1080 8GB و Geforce GTX 1070 8GB به‌عنوان کارت‌های رده بالای گیمینگ این معماری و Geforce GTX 1060 3GB/6GB نیز به‌عنوان مدل میان رده این خانواده روانه بازار شده‌اند. البته زمزمه‌هایی نیز مربوط به معرفی مدل بسیار قدرتمند Geforce GTX 1080 Ti 12GB که مدل محدود شده Geforce GTX TITAN X Pascal محسوب می‌شود و کارت گرافیک فوق‌العاده خوش قیمت و اقتصادی Geforce GTX 1050 Ti در ماه‌های پیش رو شنیده می‌شود. این چند مدل معرفی شده به‌صورت کلی دارای 3 تراشه گرافیکی (GPU) مختلف هستند. مدل‌های پرچم دار به تراشه بسیار قدرتمند GP102 با بیش از 3584 CUDA Core مجهز شده‌اند. مدل‌های رده بالا تراشه بسیار کارآمد GP104 مجهز به حداکثر 2560 CUDA Core را با خود به همراه دارند و تنها مدل میان رده این معماری نیز با تراشه GP106 و 1280 CUDA Core عرضه شده است.

 

مدل‌های رده بالای مبتنی بر این معماری همانند روال پیشین کمپانی انویدیا شامل یک مدل با امکانات و قابلیت‌های کامل ولی باقیمت نسبتاً بالا (Geforce GTX 1080) و یک مدل تا حدودی محدود شده ولی باقیمت بسیار مناسب و وسوسه کننده (Geforce GTX 1070) می‌شوند.

در واقع Geforce GTX 1070 8GB حدوداً $400 دلاری تنها با 640 CUDA Core کمتر، برخورداری از حافظه‌های GDDR5 8000MHz به جای حافظه‌های GDDR5X 10000MHz به کار رفته در Geforce GTX 1080 و حدوداً 100MHz فرکانس پایه کمتر GPU بیش از 37% از Geforce GTX 1080 8GB باقیمت حدودی $640 ارزان‌تر است. این در حالی است که در تست‌های عملی اختلاف کارایی بین این دو مدل به‌صورت میانگین حداکثر 20% است. این بدین معناست که همواره برای داشتن بهترین‌ها باید هزینه به مراتب بیشتری بپردازید؛ اما در صورتی که همواره به دنبال خرید قطعات مقرون به‌صرفه و با نسبت کارایی به قیمت بالا هستید Geforce GTX 1070 8GB انتخاب زیرکانه‌تری محسوب می‌شود.

گیگابایت تا هم اکنون که در حال نگارش این مقاله هستیم به غیر از مدل Founders Edition که با کولر و مشخصات مرجع انویدیا تولید می‌شود، 6 مدل مختلف با مشخصات مرجع و اورکلاک شده از کارت گرافیک Geforce GTX 1070 تحت عنوان‌های Mini ITX، WINDFORCE، G1 Gaming و Xtreme Gaming تولید و روانه بازار کرده است. در این بین مدل Xtreme Gaming کامل‌ترین و گران قیمت‌ترین و مدل Mini ITX ارزان قیمت‌ترین و البته جمع و جورترین عضو این خانواده محسوب می‌شوند.

 

دفتر گیگابایت چندی پیش مدل GEFORCE GTX 1070 G1 GAMING 8GB را برای تست و بررسی به لابراتوار تخصصی شهر سخت افزار ارسال کرد که میان مدل‌های نام برده یکی از بهترین‌ها از نظر کارایی به قیمت محسوب می‌شود.

 

این مدل در مقایسه با مدل مرجع حدوداً 8% اورکلاک شده (کلاک پایه هسته GPU در حالت OC Mode)، کولر بسیار قدرتمند و کم صدا 3 فن  WINDFORCE 3X دارای حالت 0dB را با خود به همراه دارد و در بخش فوقانی PCB نیز به RGB LED مجهز شده است. همچنین از نظر طراحی و قطعات نیز به گونه‌ای مدل تقویت شده برد مرجع محسوب می‌شود و کامپوننت های تحت استاندارد Ultra Durable گیگابایت را با خود به همراه دارد.

برای همین منظور برای یادآوری هم که شده ابتدا به معرفی معماری Nvidia Pascal و تشریح مهم‌ترین ویژگی‌ها و قابلیت‌های آن می‌پردازیم، سپس شما را با تراشه گرافیکی (GPU) به کار رفته در این کارت گرافیک (GP104-200) و مشخصات فنی این محصول آشنا می‌کنیم. در ادامه نیز پس از معرفی و بررسی سخت افزاری این کارت گرافیک و تشریح بخش‌های مختلف آن با تست‌های کارایی گیمینگ و GPGPU، تست‌های حرارتی، نویز صوتی و مدیریت مصرف انرژی و در نهایت تست‌های اورکلاکینگ عیار کیفیت و کارایی این مدل را از ابعاد مختلف محک می‌زنیم. با ما همراه باشید.

نکته مهم: تمامی مراحل نگارش این بررسی اعم از تست ها، عکس ها، ویدئوها، نمودارها و تحلیل ها همگی در لابراتوار تخصصی شهرسخت افزار انجام شده است. این بررسی هیچ منبع داخلی و خارجی ندارد.

معرفی معماری nVIDIA Pascal (بخش اول)

 مقدمه و تشریح معماری

اگر بخواهیم با یک دید کلی در مورد معماری جدید Pascal انویدیا اظهار نظر کنیم می‌توان این‌گونه بیان کرد که معماری پاسکال (معماری پیاده سازی شده در تراشه GP104) به نوعی ترکیبی از تکنولوژی‌های قبلی و جدید انویدیا محسوب می‌شود. معماری Maxwell و محصولات مبتنی بر آن بدون شک یکی از موفق‌ترین پروژه‌های این کمپانی چه در سطح مصرف کنندگان عادی و چه در سطح حرفه‌ای و محصولات Workstation محسوب می‌شدند و همین امر باعث شده تا انویدیا در محصولات مصرف کننده‌های عادی (برای مثال Gamer ها و کاربران عادی) مبتنی بر معماری Pascal را نیز با کمترین تغییرات، نسبت به معماری Maxwell روانه بازار کند. در معماری پاسکال تمامی زیرساخت‌های پایه نظیر واحدهای محاسبه و منطق (ALUs)، واحدهای ساخت بافت‌ها (Texture units)، واحدهای تصویرسازی (ROPs) و حافظه‌های Cache همگی تقریباً شبیه همان‌هایی هستند که قبلاً در GM2xx پیاده سازی شده بودند.

در واقع انویدیا در GPU های سطح به اصطلاح Consumer یا مصرف کنندگان عادی با معماری Pascal سعی کرده تا با افزایش سرعت Clock هسته و تعداد Shader Processor ها قدرت پردازش اطلاعات را در GP104 به مرز  8.9TFLOPs برساند و در نهایت به استفاده از حافظه‌های پرسرعت و جدید GDDR5X و البته به‌روزرسانی رابط حافظه این پردازنده گرافیکی بسیار قدرتمند را به‌خوبی تغذیه کند.

(Nvidia GP104 (Pascal Architecture

 

در تصویر بالا بلاک دیاگرام تراشه گرافیکی (GPU) به کار رفته در کارت گرافیکی GTX 1080 را ملاحظه می‌کنید. این تراشه (GP104) پس از GP102 (تراشه گرافیکی به کار رفته در NVIDIA Titan X Pascal) قدرتمندترین پردازنده گرافیکی (در سطح مصرف کنندگان عادی) مبتنی بر معماری Pascal محسوب می‌شود. در این تراشه 2560 CUDA Core در قالب 20 واحد SM در فرکانس بیش از 1733MHz فعالیت می‌کنند. GP104 به صورت کلی و همانند GM204 (تراشه گرافیکی به کار رفته در GTX 980) از 4 واحد بسیار بزرگ GPC) Graphics Processing Cluster) تشکیل شده که هر یک از این واحدها 5 واحد SM یا همان Streaming Multiprocessors را درون خود جای داده‌اند. این در حالی است که هر یک از واحدهای GPC تراشه GM204 دارای 4 واحد SM بودند. در تصویر زیر می‌توانید بلاک دیاگرام تراشه GM204 را نیز ملاحظه کنید:

(NVIDIA GM204 (MaxwellArchitecture

 

در واقع به صورت کلی تفاوت ساختاری میان تراشه گرافیکی GP104 (تراشه به کار رفته در GTX 1080) و GM204 (تراشه به کار رفته در GTX 980) در همین 1 عدد واحد SM بیشتر در GPC ها خلاصه می‌شود؛ اما اجازه دهید برای یادآوری هم که شده کمی بیشتر وارد جزئیات ساختاری واحدهای GPC و SM شویم.

NVIDIA GP104 - GPC

 

خب همان‌طور که اشاره شد هر واحد GPC در معماری پاسکال 5 واحد SM را درون خود جای داده است که هر یک از واحدهای SM دارای 128 عدد CUDA core (واحدهای کوچک مربع شکل سبز رنگ) و 8 عدد Texture Unit (واحدهای مستطیل شکل به رنگ آبی تیره) هستند. حال برای محاسبه CUDA Core های کل این تراشه کافی است 128 را در تعداد SM های هر واحد GPC ا(عدد 5) ضرب کنید و نتیجه به دست آمده را مجدداً در تعداد واحدهای GPC این تراشه (عدد 4) ضرب کنید. نتیجه به دست آمده عدد 2560 عدد CUDA Core خواهد بود. حال اگر همین روال را برای واحدهای Texture Unit نیز تکرار کنید به عدد 160 خواهید رسید. پس 1 واحد SM بیشتر در هر GPC باعث افزایش 512 عددی CUDA core ها و همین‌طور افزایش 32 عدد واحدهای Texture Unit تراشه GP104 نسبت به GM204 شده است. از سوی دیگر بر خلاف GM204 که دارای 4 کنترلر حافظه 64bits (جمعاً 256bits) و 16 ROP Units به ازای هر کنترلر حافظه (جمعاً 64 عدد) بود، در GP104 هشت کنترلر حافظه 32bits تعبیه شده (جمعاً 256bits) که هر یک از این کنترلرها توسط 8 عدد ROP Units تغذیه می‌شوند. کاملاً مشخص است که رابط حافظه و تعداد واحدهای ROP تغییر نکرده است ولی انویدیا با در نظر گرفتن حافظه‌های بسیار پرسرعت GDDR5X با فرکانس مؤثر 10000MHz برای این تراشه قدرتمند، پهنای باند تئوری بیش از 320GB/sec را برای آن فراهم کرده است.

NVIDIA GP104 –SM Unit

در تصویر بالا نیز جزئیات هر واحد SM را ملاحظه می‌کنید. واحدهای SM معماری پاسکال دقیقاً مشابه معماری مکسول طراحی شده‌اند.

 

اما به‌عنوان جمع بندی نهایی همان‌طور که در جدول بالا ملاحظه می‌کنید روی هم رفته 4 عدد واحد SM بیشتر و به ازای آن 512 عدد CUDA Core و 32 عدد Texture Unit بیشتر به همراه بیش از 517MHz سرعت کلاک بیشتر GPU و 3000MHz سرعت کلاک بیشتر حافظه که در عمل باعث افزایش 43% پهنای باند حافظه و توان عملیاتی واحدهای ROP می‌شود، روی کاغذ باعث افزایش 78% کارایی خام GTX 1080 در برابر GTX 980 می‌شوند. البته این در حالی است که با وجود افزایش 38% تعداد ترانزیستورها و البته به لطف تکنولوژی ساخت TSMC's 16 nm FinFET اندازه Die در تراشه GP104 حدوداً بیش از 21% کوچک‌تر شده و توان مصرفی این مجموعه نیز تنها 9% افزایش یافت است.

معماری پاسکال: طراحی شده برای سرعت

 

همان‌طور که اشاره شد یکی از مهم‌ترین عواملی که باعث افزایش کارایی در معماری پاسکال شده است افزایش بیش از 45% سرعت کلاک GPU نسبت به معماری مکسول است. این میزان افزایش سرعت کلاک در عمل باعث بالا رفتن توان مصرفی تراشه خواهد شد ولی به لطف تکنولوژی 16nm FinFET به کار رفته در ساخت میلیون‌ها ترانزیستور به کار رفته در این تراشه و البته از آن مهم‌تر بهینه سازی‌های فراوان پیاده سازی شده در تایمینگ بخش‌های مختلف این تراشه مدرن، تراشه‌های گرافیکی مبتنی بر معماری Pascal یکی از پربازده‌ترین GPU های حال حاضر محسوب می‌شوند.

GPU Boost 3.0

چند سالی می‌شود که تراشه‌های گرافیکی ساخت کمپانی انویدیا این قابلیت را دارند که علاوه بر فرکانس پایه هسته GPU، با توجه به دمای هسته و البته میزان Load آن، در فرکانس‌های بالاتر از این مقدار نیز فعالیت کنند. در واقع این مکانیسم که تحت عنوان GPU Boost معرفی شده است یک فرآیند خودکار اورکلاک محسوب می‌شود و تأثیر بسزایی نیز در افزایش کارایی تراشه‌های گرافیکی دارد. انویدیا در معماری Pascal از نسخه سوم این مکانیسم رونمایی کرده است. در ادامه قابلیت‌های جدید این نسخه را بررسی می‌کنیم.

 

یکی از اساسی‌ترین تغییرات در GPU Boost 3.0 تحت عنوان per voltage point frequency offsets معرفی شده است. در این تکنیک بر خلاف نسل قبل که با فعال شدن حالت GPU Boost، ولتاژ هسته GPU نیز یک باره و یا حداکثر در چند بازه محدود افزایش می‌یافت در نسخه جدید برای هر مقدار افزایش فرکانس نسبت به فرکانس پیش فرض، ولتاژ مخصوص تعیین شده است. این امر باعث کاهش تلفات انرژی و کنترل بیش از پیش حرارت متصاعد شده از GPU می‌شود. در نتیجه این امکان فراهم می‌شود که فرکانس Boost نسبت به مدل‌های مشابه نسل قبل به صورت محسوسی افزایش یابد؛ اما این امر شاید تا حدودی اورکلاک کارت‌های گرافیک مبتنی بر این معماری را پیچیده‌تر کند. برای مثال در این معماری برای اعمال ولتاژ بیشتر به GPU دیگر گزینه‌ای برای تغییر مقادیر مختلف ولتاژ با واحد ولت مشاهده نمی‌شود و این امکان فراهم شده است که میزان انحراف ولتاژ از محدوده ولتاژ پیش فرض را تنها با تعیین درصد انحراف تعیین کرد. همچنین در این معماری گزینه‌ای برای غیرفعال کردن محدودیت‌های مرتبط با میزان Load بر روی GPU نیز در نظر گرفته شده است. پس در واقع یکی از مهم‌ترین پارامترهایی که در این معماری دست یابی به فرکانس‌های بالاتر را تسهیل می‌کند بدون شک دمای GPU خواهد بود.

GDDR5X Memory

پشتیبانی تراشه‌های گرافیکی مبتنی بر معماری پاسکال از حافظه‌های GDDR5X با فرکانس بیش از 10GHz بدین معناست که این تراشه‌ها و کنترلر حافظه تعبیه شده در آن‌ها قابلیت تشخیص بیت‌های 0 و 1 را در فاصله زمانی کمتر از 100 picoseconds (ps) را دارا می‌باشند. این بدان معنا است که برای حفظ پارامترهای Signaling در این فرکانس بسیار بالا، طراحی کنترلر حافظه، مدارهای مرتبط با بخش ورودی و خروجی و از آن مهم‌تر طراحی PCB برای داشتن ارتباطی پایدار و بدون افت کارایی باید دچار تغییرات فراوانی شده باشند.

 

در واقع در طراحی کانال ارتباطی میان Die تراشه گرافیکی و چیپ ها حافظه باید به کوچک‌ترین جزئیات نیز توجه شود. در این‌گونه ارتباطات، سرعت عملیاتی و واقعی رابط حافظه تنها توسط ضعیف‌ترین سیگنال گذرگاه تعیین می‌شود. در طراحی جدید هر سیگنال در امتداد مسیر بسته خود از GPU تا چیپ های حافظه به صورت دقیق بررسی و مورد مطالعه قرار گرفته تا هر گونه افت دامنه سیگنال، تداخل و ناپیوستگی‌های موجود شناسایی شده و تمهیدات لازم برای به حداقل رساندن آن‌ها به کار گرفته شود.

به گفته انویدیا تمامی تمهیداتی که در کانال‌های ارتباطی و مدارهای ورودی و خروجی این معماری اجرا شده تنها برای پایداری ارتباط با فرکانس تا 10GHz عملیاتی نشده‌اند. بلکه این طراحی به‌گونه‌ای است که حتی محصولات آینده و با پهنای باند به‌مراتب بالاتر از این را نیز در بر می‌گیرد. در واقع همین حالا نیز برخی از تولید کنندگان چیپ های حافظه از برنامه برای تولید حافظه‌های GDDR5X با سرعت بیش از 16Gbps خبر می‌دهند. حافظه‌هایی که در مقایسه با پرسرعت‌ترین چیپ های GDDR5 حال حاضر بیش از 2 برابر سریع‌تر خواهند بود!

در تصویر بالا سیگنال ارتباطی حافظه‌های GDDR5X را در فرکانس 10GHz و سایر بهینه سازی‌های پیاده سازی شده در مدارهای ورودی و خروجی و کانال‌های ارتباطی را ملاحظه می‌کنید.

Enhanced Memory Compression

همانند معماری Maxwell تراشه‌ای جدید مبتنی بر معماری Pascal نیز از تکنیک فشرده سازی بدون افت کیفیت (lossless memory compression) اطلاعات حافظه، جهت کاهش وابستگی به پهنای باند بالای ارتباط، پشتیبانی می‌کنند. کاهش نیاز به پهنای بالا فراهم شده توسط فشرده سازی اطلاعات حافظه به صورت کلی این مزیت‌ها را در پی دارد:

  • کاهش حجم اطلاعات نوشته شده در حافظه
  • کاهش حجم اطلاعات منتقل شده از حافظه به L2 Cache
  • کاهش حجم اطلاعات رد و بدل شده بین واحدهای مختلف GPU مانند Texture Unit و حافظه frame buffer

Pipeline های فشرده سازی GPU در این معماری از چندین الگوریتم مختلف فشرده سازی پشتیبانی می‌کنند و البته در شرایط مختلف به صورت هوشمند و در کمترین زمان ممکن بهترین الگوریتم را برای فشرده سازی اطلاعات انتخاب می‌کنند. یکی از این مهم‌ترین و مدرن‌ترین این تکنیک‌های فشرده سازی الگوریتم Delta Color Compression است.

 

 در این الگوریتم GPU تفاوت‌های میان پیکسل‌ها را در یک بلوک محاسبه می‌کند و این بلوک را به‌عنوان مجموعه‌ای از پیکسل‌های مرجع به‌علاوه ارزش دلتا نسبت به مقدار مرجع ذخیره می‌کند. اگر دلتاها کوچک باشند پس تعداد بیت‌های کمتری به ازای هر پیکسل برای ذخیره شدن در حافظه نیاز خواهد بود. اگر نتیجه (مقدار حافظه اشغال شده) جمع بندی شده داده‌های مرجع به‌علاوه ارزش عدد دلتا، نصف حالت فشرده سازی نشده باشد، در این حالت تکنیک فشرده سازی اطلاعات با استفاده از الگوریتم Delta Color Compression موفق بوده است و در نهایت اطلاعات با نصف حجم اصلی خود ذخیره شده‌اند (2:1 compression)

در تراشه گرافیکی GP104 قابلیت‌ها و توان عملیاتی الگوریتم فشرده سازی Delta Color Compression به میزان قابل توجهی بهینه سازی شده است:

  • بازدهی و توان عملیاتی فشرده سازی حالت 2:1 در مقایسه با نسل قبل به میزان قابل توجهی افزایش داشته است
  • اضافه شدن حالت فشرده سازی 4:1 برای پوشش مواردی که به ازای هر پیکسل به‌علاوه دلتا مورد نظر بسیار کوچک هستند و این قابلیت را دارند تا در ¼ فضای حالت فشرده سازی نشده خود ذخیره شوند.
  • اضافه شدن حالت فشرده سازی 8:1 که به زبان ساده به نوعی ترکیب حالت 4:1 و 2:1 محسوب می‌شود

 

فشرده سازی رنگ در معماری Pascal، فشرده سازی رنگ در معماری Maxwell، تصویر اصلی بدون فشرده سازی

در تصویر بالا صحنه‌ای از بازی معروف Project CARS را ملاحظه می‌کنید که به روشنی عملکرد تکنیک فشرده سازی رنگ را در معماری Pascal در مقایسه با معماری Maxwell نشان می‌دهد.

در این تصویر نقاطی که فشرده سازی رنگ در آن با موفقیت عملیاتی شده به رنگ ارغوانی ملاحظه می‌کنید. کاملاً مشخص است که معماری مکسول تقریباً قسمت اعظمی از رنگ‌های تصویر را فشرده سازی کرده ولی از پس فشرده سازی پوشش گیاهی و بخش‌هایی از اتومبیل بر نیامده است؛ اما در معماری پاسکال تنها بخشی از سمت چپ تصویر فشرده سازی نشده است.

 

روی هم رفته و در تست‌های عملی صورت گرفته عملکرد فشرده سازی رنگ در معماری پاسکال باعث افزایش 20 درصدی بازدهی پهنای باند حافظه نسبت به معماری Maxwell می‌شود. حال اگر این میزان را با افزایش بیش از 40 درصدی پهنای باند حافظه به لطف چیپ های پرسرعت GDDR5X 10GHz جمع کنیم به این نتیجه خواهید رسیم که پهنای باند عملیاتی در معماری Pascal بیش از 1.7 برابر نسبت به معماری Maxwell بیشتر شده است.

محاسبات ناهم‌زمان (Asynchronous Compute)

 

بار پردازش بازی‌های رایانه‌ای مدرن به صورت فزاینده‌ای در حال پیچیده شدن است. یکی از مهم‌ترین عوامل این امر پردازش چند کار مستقل و البته ناهم‌زمان است که به صورت تنگاتنگ با یکدیگر تعامل دارند تا در نهایت به کمک هم تصویر نهایی را رندر کنند.

چند مثال درباره بار پردازش غیر هم‌زمان:

  • پردازش فیزیک و صدا مبتنی بر GPU
  • تصاویر رندر شده همراه با Postprocessing
  • پردازش ناهم‌زمان پیچ و تاب و زمان: نوعی تکنیک استفاده شده در واقعیت مجازی که تصویر نهایی را با توجه به وضعیت سر دقیقاً قبل از نمایش نهایی تصویر بازسازی می‌کند

این نوع پردازش‌های غیر هم‌زمان دو سناریو جدید برای طراحان GPU به وجود می‌آورد که باید در نظر گرفته شوند.

سناریو اول شامل بار پردازش‌هایی است که با یکدیگر تداخل دارند. انواع خاصی از بارهای پردازش که به صورت کامل تمام منابع GPU را اشغال نمی‌کنند. در این مواقع GPU باید به صورت هوشمند منابع خود را بین هر دو بار پردازش به اشتراک بگذارد و این کار به‌گونه‌ای مدیریت کند تا بازدهی پردازش اطلاعات نیز قابل قبول باشد. پردازش گرافیکی تصویر در کنار پردازش فیزیک دبه صورت هم‌زمان یک مثال خوب برای این سناریو محسوب می‌شود.

برای بارهای پردازش که با یکدیگر تداخل دارند معماری پاسکال پشتیبانی از تکنیک dynamic load balancing را در چنته دارد. در تراشه‌های گرافیکی مبتنی بر معماری Maxwell این نوع از پردازش‌ها توسط پارتیشن بندی استاتیک (static partitioning) زیرمجموعه‌هایی از GPU که پردازش گرافیکی و پردازش همه منظوره را انجام می‌دهند صورت می‌گیرند. این تکنیک به شرطی کارآمد است که تعادل کار بین دو بار پردازش، تقریباً منطبق با نسبت پارتیشن بندی مورد نظر باشد. با این حال اگر بار پردازش همه منظوره بیش از پردازش گرافیکی طول بکشد و هر دو برای پایان نهایی این پردازش نیاز به تکمیل شدن بار پردازش خود داشته باشند. بخشی از GPU که برای پردازش گرافیکی پارتیشن بندی شده بود عملاً بلااستفاده می‌ماند.

در تکنولوژی سخت افزاری dynamic load balancing پیاده سازی شده در معماری Pascal این امکان وجود دارد که هر دو بار پردازش نام برده در صورت وجود منابع خالی در GPU به صورت پویا از منابع نام برده برای افزایش کارایی و بازدهی عملیاتی استفاده کنند.

Simultaneous Multi-Projection Engine

موتور پردازش هم‌زمان چند تصویره یا همان Simultaneous Multi-Projection Engine یک واحد سخت افزاری جدید است که در بخش PolyMorph Engine در انتهای geometry pipeline و درست در مقابل واحد تصویرسازی (Raster Unit) قرار دارد. همان‌طور که از اسم آن پیداست، وظیفه واحد (Simultaneous Multi-Projection (SMP ایجاد بینش های متفاوت از یک جریان شکل هندسی است که همین امر SMP را تبدیل به یکی از مراحل سایه زنی بالادستی کرده است.

 

این بخش قادر است تا حداکثر 16 طرح و بینش مختلف از پیش تنظیم شده یک شکل هندسی را پردازش کند. در تمام حالات ممکن خلق تصاویر، پردازش اطلاعات توسط شتاب دهنده‌های سخت افزاری انجام می‌شود و جریان پردازش اطلاعات هیچ گاه پردازنده گرافیکی را ترک نمی‌کند. از آنجا که پردازش توسعه چند تصویره پس از واحدهای مربوط به ترسیم هندسی تصویر اتفاق می‌افتد، برنامه‌های سازگار با این تکنیک، تمامی عملیاتی که باید در واحدهای سایه زدن بالادستی انجام می‌شدند را به‌مراتب کاهش می‌دهند. این عملیات حذف شده به‌ویژه در زمانی که GPU با تکنیک‌های تصویرسازی هندسی پیچیده مثل Tessellation روبرو می‌شود پراهمیت هستند. در برخی موارد خاص، موتور SMP می‌تواند عملیات مربوط به پردازش هندسی تصاویر را تا حداکثر 32 برابر کاهش دهد.

 

همان‌طور که در تصویر بالا ملاحظه می‌کنید یکی از نمونه‌های کاربردی SMP اصلاح میدان دید مطلوب در صفحه نمایش‌های 3 گانه به صورت فراگیر است.

همچنین همان‌طور که مطلع هستید به لطف تکنولوژی‌های جدید صفحه نمایش‌های LED و OLED شاهد عرضه صفحه نمایش‌های خمیده (Curved) و عینک‌های واقعیت مجازی (VR) مجهز به عدسی‌ها و صفحه نمایش‌های مختلف هستیم که هر یکی از این تکنولوژی‌های نمایش تصویر نیاز به تصویرسازی مختص به خود هستند. در تصویر زیر انواع مختلف تکنولوژی‌های نمایش تصویر موجود در حال حاضر و یا در حال توسعه آینده نزدیک را ملاحظه می‌کنید.

 

پردازنده‌های گرافیکی کنونی از تمامی این صفحه نمایش‌ها پشتیبانی می‌کنند ولی به صورت کاملاً ناکارآمد و یا با مراحل متعدد پردازش تصویر و پیچ و تاب دادن‌های مختلف برای مطابقت با خروجی نهایی مورد نیاز. GPU های با معماری Maxwell دارای برخی قابلیت‌های ابتدایی Multi-Resolution بودند که در واقع پیش نمایشی از مدل عملیاتی واحد SMP در معماری Pascal محسوب می‌شد. پردازنده‌های گرافیکی مبتنی بر معماری مکسول می‌توانستند دقیقاً 90 درجه تصویر را بچرخانند (به‌عنوان مثال برای نگاشت مکعب) و یا با گرفتن یک جهت تصویر واحد مقیاس آن را با رزولوشن بخش‌های مختلف نمایشگر تطبیق دهند. این تکنیک‌ها علیرغم مثمر ثمر بودن برای برخی کاربردها نظیر VXGI، ولی در بسیاری از حالت‌های مختلف نمایشگرهای جدید ناکارآمد هستند و بازدهی کارایی مناسبی ندارند.

 

به لطف موتور Simultaneous Multi-Projection Engine و قابلیت‌های آن در اداره نمایش چندین تصویر با پیچ و تاب و چرخش مختلف در آن واحد، پردازنده‌های گرافیکی مبتنی بر معماری Pascal این قابلیت را دارند تا به صورت کاملاً کارآمد و با بازدهی کارایی بالا در سریع‌ترین زمان ممکن بهترین خروجی را برای نمایشگرهای نام برده فراهم کنند. این موتور پردازش هندسی مدرن با پشتیانی از تکنیک‌هایی نظیر Projections in 3D Graphics، Perspective Surround، Single Pass Stereo و Lens Matched Shading قادر است تا در حالت‌های مدرن نمایش تصاویر در عینک‌های واقعیت مجازی (VR) بهترین کیفیت ممکن در کنار کارایی بسیار بهتر از پردازنده‌های گرافیکی نسل‌های قبل ارائه دهد.

رابط جدید و بهبود یافته SLI

گیمرهای حرفه‌ای برای دستیابی به کارایی فوق‌العاده بالا در وضعیت‌هایی که از چند نمایشگر با رزولوشن‌های بالای 4K و 5K استفاده می‌کنند به پیکربندی‌های 2 یا چندگانه Multi GPU تحت عنوان SLI تکیه می‌کنند. یکی از مهم‌ترین اجزاء در پیکربندی SLI نیز پل SLI یا همان SLI Bridge است که در واقع یک رابط دیجیتال برای جابجایی اطلاعات تصویر بین کارت‌های گرافیک Geforce در این سیستم محسوب می‌شود.

کارت‌های گرافیکی رده بالای Nvidia Geforce که از پیکربندی‌های 3 و 4 گانه SLI پشتیبانی می‌کنند دارای 2 عدد از این رابط‌ها بر روی PCB خود هستند. علت وجود رابط دوم در این حالت‌ها ارتباط میان سایر کارت‌های گرافیک با کارت گرافیک اصلی (کارت گرافیکی که ورودی یا ورودی‌های تصاویر مانیتورها به آن متصل شده است) جهت هماهنگی و ارسال اطلاعات مرتبط با رندر فریم‌ها است و تا قبل از معماری Pascal هر یکی از این رابط‌ها به صورت مستقل عمل می‌کردند.

 

اما در معماری Pascal این دو رابط به یکدیگر لینک شده‌اند تا پهنای باند ارتباط میان دو کارت گرافیک افزایش یابد. این حالت جدید dual-link SLI این قابلیت را فراهم می‌کند که هر دو رابط SLI در کنار هم نمایشگرهای با رزولوشن‌های بالا و یا پیکربندی‌های فراگیر مجهز به 3 نمایشگر را با سرعت به‌مراتب بیشتر نسبت به نسل‌های قبل تغذیه کنند.

 

Dual-link SLI تنها توسط پل‌های جدید تحت عنوان SLI HB پشتیبانی می‌شود. این پل‌های جدید ارتباط سریع میان دو کارت گرافیک را تسهیل می‌کنند، هر دو رابط SLI را در این ارتباط شرکت می‌دهند و موجب فعال شدن وضعیت ارتباط با سرعت کلاک 650MHz میان دو کارت گرافیک GTX 1080 می‌شود (این نکته را مد نظر داشته باشید که پیکربندی SLI توسط پل‌های قدیمی نیز امکان پذیر است ولی در این حالت حداکثر سرعت کلاک ارتباط 400MHz خواهد بود و حداکثر کارایی این پیکربندی آشکار نخواهد شد).

 

البته لازم به ذکر است پل‌های SLI مجهز به LED در پیکربندی دوگانه GTX 1080 از فرکانس 650MHz و پهنای باند بالای این ارتباط پشتیبانی می‌کنند.

پس مدنظر داشته باشید که برای ارتباط پرسرعت و پشتیبانی از نمایشگرهای 4K و 5K و همین‌طور ترکیب فراگیر چند نمایشگر به صورت هم‌زمان باید از پل‌های جدید مجهز به LED و یا SLI HB در پیکربندی‌های دوگانه GTX 1080 استفاده شود. در جدول زیر می‌توانید با توجه به نیازهای خود، نوع پل SLI مورد نظر را شناسایی کنید.

 

با پهنای باند بالای ارائه شده توسط رابط جدید SLI و پل‌های جدید SLI HB گیمرها نسبت به نسل قبلی SLI به‌مراتب اجرای روان‌تری را در بازی‌های جدید تجربه خواهند کرد. در گراف زیر نمودار FrameTime اجرای بازی Shadow of Mordor را در رزولوشن 11520x2160 مشاهده می‌کنید.

 

همان‌طور که ملاحظه می‌کنید در حالتی که از پل جدید SLI HB استفاده شده است (گراف آبی رنگ) روی هم رفته FrameTime پایین‌تر و از آن مهم‌تر spike ها نیز به‌مراتب کمتر هستند. این بدان معناست که Frame Rate بالاتر و پایداری این پارامتر نیز به‌مراتب بهتر از قبل شده است.

حالت‌های جدید پیکربندی Multi-GPU

در مقایسه با نسخه‌های قبلی DirectX کمپانی مایکروسافت چند تغییر در DirectX 12 جدید ایجاد کرده که عملکرد پیکربندی‌های Multi-GPU را نیز تحت تأثیر قرار می‌دهند. در بالاترین سطح دو انتخاب اساسی برای توسعه دهندگان جهت استفاده از پیکربندی‌های Multi-GPU در سخت افزاری‌های انویدیا در DirectX 12 وجود دارد: حالت (Multi Display Adapter (MDA و حالت (Linked Display Adapter (LDA.

برای حالت LDA نیز دو شکل متفاوت تعریف شده است: حالت Implicit LDA که NVIDIA برای SLI از آن استفاده می‌کند و حالت Explicit LDA که در اصل توسعه دهندگان بسیاری از مسئولیت‌های GPU را برای دستیابی به یک پیکربندی موفق و با بازدهی بسیار بالا مدیریت می‌کنند. در واقع هدف از توسعه حالت‌های MDA و LDA Explicit این بوده که توسعه دهندگان بازی‌های رایانه‌ای کنترل بیشتری بر روی عملکرد GPU داشته باشند.

در جدول زیر خلاصه قابلیت‌ها و ملزومات این 3 حالت را در پردازنده‌های گرافیکی Nvidia ملاحظه می‌کنید:

 

در حالت LDA تمامی حافظه‌های Frame Buffer کارت‌های گرافیک مستقل شرکت کننده در این پیکربندی با یکدیگر مرتبط خواهند بود تا مجموعه‌ای بسیار بزرگ از حافظه در اختیار توسعه دهنده قرار بگیرد (البته در این ارتباط برخی استثنائات وجود دارد). با این حال در صورتی که اطلاعات مورد نیاز یک GPU در حافظه GPU دیگر ذخیره شده باشد ممکن است نوعی افت کارایی پیش آید. در حالت MDA، حافظه هر GPU به صورت اختصاصی برای همان GPU قابل دسترس است و قابلیت دسترسی مستقیم به حافظه GPU های دیگر را ندارد.

حالت LDA برای وضعیت‌هایی در نظر گرفته شده است که در آن GPU ها دقیقاً شبیه به یکدیگر هستند در حالی که در حالت MDA محدودیت‌های به‌مراتب کمتری وجود دارد. برای مثال حتی این امکان وجود دارد که کارت‌های گرافیک مجزا با تراشه‌های گرافیکی مجتمع جفت شوند و یا حتی GPU های با مدل‌های مختلف و یا حتی با سازندگان مختلف با یکدیگر جفت شوند. ولی در این حالت توسعه دهنده باید با دقت بیشتری تمامی عملیات و دستورالعمل‌هایی را که برای ارتباط میان GPU ها لازم است را مدیریت کند.

در حالت پیش‌فرض کارت گرافیک GFEFORCE GTX 1080 تنها از حالت دوگانه (i2-Way) پیکربندی SLI پشتیبانی می‌کند و حالت‌های l3-Way و l4-Way پیکربندی SLI از این پس توسط انویدیا توصیه نمی‌شود. هم زمان با تکامل هر چه بیشتر بازی‌ها بسیار دشوار خواهد بود تا حالت‌های 3 و 4 گانه SLI در حالت عملیاتی افزایش کارایی محسوسی برای کاربران عادی و گیمرها به ارمغان بیاورند. برای مثال در بسیاری از بازی‌ها در پیکربندی‌های 3 و 4 گانه این CPU است که گلوگاه کارایی می‌شود و از طرف دیگر بازی‌هایی که از تکنولوژی‌هایی استفاده می‌کنند که استخراج فریم به فریم و البته متقارن آن‌ها بسیار مشکل است نیز روز به‌روز در حال افزایش است. البته مدل‌های دیگر برای استفاده از پیکربندی‌های l3-Way و l4-Way نیز وجود دارد:

  • استفاده از حالت‌های MDA و LDA Explicit
  • 2Way SLI + dedicated PhysX GPU

 

معرفی معماری nVIDIA Pascal (بخش دوم)

Fast Sync

Fast Sync نوع با زمان تأخیر به‌مراتب کمتر تکنولوژی قدیمی (Vertical Sync (V-SYNC است که مانع از به اصطلاح tearing یا گسستگی تصویر در هنگام بیشتر شدن نرخ FPS از Refresh Rate نمایشگر می‌شود.

در تصویر زیر یک طرح کلی خام از چگونگی رندر شدن یک فریم در pipeline تراشه‌های گرافیکی Nvidia را ملاحظه می‌کنید:

 

موتور گرافیکی بازی وظیفه تولید فریم‌ها و ارسال آن به DirectX را بر عهده دارند. از دیگر وظایف موتور بازی محاسبه animation time (کد گذاری داخل هر فریم که در نهایت رندر می‌شود) است. در ادامه سرعت ترسیم و دیگر اطلاعات به درایور و GPU ابلاغ می‌شوند تا به تصویر رندر شده حقیقی تبدیل شوند. این اطلاعات سپس به حافظه Frame Buffer ارسال شده و در نهایت نیز جهت اسکن به نمایشگر منتقل می‌شوند.

اما در پردازنده‌های گرافیکی مبتنی بر معماری Pascal این روال کمی تغییر کرده است.

یک سؤال: در برخی بازی‌های کنونی مثل Counter-Strike: Global Offensive که نرخ FPS گاهی اوقات به بیش از صدها فریم در ثانیه می‌رسد، بهتر است V-SYNC فعال باشد یا غیرفعال؟

 

در حالتی که V-SYNC روشن است نرخ FPS هیچ گاه از نرخ Refresh Rate نمایشگر تجاوز نمی‌کند. این امر در عمل باعث جلوگیری از گسستگی تصویر می‌شود ولی از طرفی باعث افزایش محسوس زمان تأخیر ورودی می‌شود.

اما در وضعیتی که V-SYNC خاموش است نرخ FPS به صورت افسار گسیخته افزایش می‌یابد. در این حالت زمان تأخیر ورودی بسیار پایین است ولی در عمل گسستگی (بریده‌بریده شدن) در تصویر خروجی مشاهده می‌شود.

این دو وضعیت یک چالش بسیار سخت برای گیمرهای کنونی محسوب می‌شود! و البته انتخاب بین این دو وضعیت نیز در شرایط مختلف همان‌طور که اشاره شد معایب و مزایای خاص خود را به همراه دارد.

 

انویدیا با بازنگری در نحوه عملکرد این فرآیند قدیمی در قدم اول در مسیر پردازش تصویر، بخش‌های مرتبط با رندر فریم و نمایش تصویر را از یکدیگر جدا کرده است. این امر به بخش‌های مرتبط با رندر اجازه می‌دهد تا به‌طور مداوم و با حداکثر سرعت به رندر اطلاعات ارسال شده توسط موتور بازی و درایور بپردازند و این فریم‌ها بتوانند موقتاً در حافظه Frame Buffer ذخیره شوند.

Rendered Frames - FAST SYNC

همان‌طور که اشاره شد انویدیا در مسیر رندر تصاویر، یخش های مرتبط با رندر و بخش‌های مربوط به نمایش تصاویر را از یکدیگر جدا کرده است. این امر اجازه می‌دهد تا تصویر خروجی با استفاده از راهکارهای جدید مختلف مدیریت شود که این امر مزایای فراوانی برای گیمرها در پی خواهد داشت.

FAST SYNC یکی از اولین کاربردهایی است که این رویکرد جدید همراه خواهد داشت.

با FAST SYNC دیگر کنترل و کندسازی جریان پردازش گرافیکی (flow control) وجود نخواهد داشت، عملکرد موتور گرافیکی همانند وضعیتی است که V-SYNC غیرفعال است و همه این‌ها به این دلیل است که دیگر مسیر پردازش تصویر، پدیده تجمع فریم‌ها در حافظه Frame Buffer وجود ندارد. زمان تأخیر تقریباً همانند زمانی که V-SYNC غیرفعال است پایین است و از همه بهتر تصویر نیز دیگر گسستگی مشاهده نخواهد شد! چون FAST SYNC انتخاب می‌کند که کدام یکی از فریم‌های رندر شده باید توسط نمایشگر اسکن شود. FAST SYNC به مسیر پردازش تصویر این اجازه را می‌دهد تا با حداکثر سرعت به پردازش تصاویر بپردازد و تعیین می‌کند تا کدام فریم برای اسکن به نمایشگر ارسال شود، در حالی که به‌طور هم‌زمان همه فریم‌ها حفظ می‌شوند و تصویر نیز بدون گسستگی در نمایشگر اسکن می‌شود.

 

تجربه‌ای که FAST SYNC ارائه می‌دهد بسته به نرخ FPS از نظر کیفیت و وضوح تصویر همانند وضعیتی است که V-SYNC فعال است. همچنین زمان تأخیر ورودی نیز بسیار پایین و مانند وضعیتی است که V-SYNC خاموش است.

Decoupled Buffers

 

اما شاید برای شما نیز سؤال شده باشد که FAST SYNC چگونه کار می‌کند؟

تصور کنید 3 ناحیه در حافظه Frame Buffer تعبیه شده است که دارای 3 عملکرد متفاوت می‌باشند. 2 بخش بافر اول همانند تکنیک double-buffered V-SYNC در GPU های نسل قبل عمل می‌کنند. باور جلویی (Front Buffer) تصاویری که برای اسکن به نمایشگر فرستاده می‌شوند را در خود ذخیره می‌کند. بافر پشتی (Back Buffer) اطلاعاتی را همراه دارد که در حال رندر شدن هستند و تا زمانی که این فرآیند شکل گیری تصاویر به پایان نرسند اجازه اسکن شدن را ندارند. استفاده از V-SYNC مرسوم در گیم های با نرخ FPS بالا اصلاً زمان تأخیر ورودی مناسبی نخواهد داشت چون موتور بازی باید منتظر وقفه ایجاد شده توسط Refresh Rate نمایشگر بماند تا قبل از اینکه فریم‌های جدید در Back Buffer بارگذاری شوند، با تلنگر Back Buffer اجازه ارسال اطلاعات به نمایشگر را صادر کند. این روال تمامی مراحل را کند می‌کند و در عمل Back Buffer را به یک عامل ایجاد زمان تأخیر تبدیل می‌کند.

FAST SYNC بافر سومی تحت عنوان (Last Rendered Buffer (LRB را همراه خود دارد که وظیفه آن ذخیره تمامی تصاویر رندر شده‌ای است که در Back Buffer کامل شده‌اند. در نتیجه داشتن یک کپی از فریم‌هایی که اخیراً توسط Back Buffer رندر شده تا زمانی که Front Buffer کار اسکن تصویر را کامل کند در این نقطه Last Rendered Buffer نیز در Front buffer کپی می‌شود و این روند ادامه می‌یابد. عملاً و در واقع رونویسی بافر ناکارآمد خواهد بود و در اصل نام این Buffer ها در طی این فرآیند تغییر می‌کند.

بافری که تصویر را اسکن می‌کند FB، بافری که به صورت فعال در حین رندر کردن تصاویر است BB و بافری که حاوی تصاویری است که اخیراً رندر شده‌اند نیز LRB نامیده می‌شود. واحد جدید flip logic نیز در معماری Pascal این فرآیند را کنترل و مدیریت می‌کند. نمونه کاملی از این فرآیند همانند روال زیر خواهد بود:

  • Scan from FB
  • Render to BB
  • When Render completes
    • BB becomes LRB
    • LRB becomes BB and render continues
  • When Render completes
    • BB becomes LRB
    • LRB becomes BB and render continues
  • When Render completes
    • BB becomes LRB
    • LRB becomes BB and render continues
  • When scan completes
    • LRB becomes FB
  • Start scanning from the new FB

  

در نمودار بالا تست این قابلیت را در بازی Counter-Strike: Global Offensive ملاحظه می‌کنید که توسط دوربین‌های بسیار پرسرعت تصویربرداری شده است. به روشنی مشخص است که Fast Sync تنها با حدوداً 8ms زمان تأخیر بیشتر نسبت به حالتی که V-SYNC غیرفعال است مانع از گسستگی شدن تصویر شده است! این در حالی است فعال بودن V-SYNC سنتی عملاً بیش از 9 برابر زمان تأخیر ورودی را افزایش داده است.

نکته: Fast Sync بهترین عملکرد را در بازی‌های با نرخ FPS بالا مبتنی بر DirectX 9 دارد.

 

جهت فعال سازی این قابلیت باید در نرم افزار NVIDIA Control Panel و در بخش مربوط به مدیریت تنظیمات سه بعدی (Manage 3D settings) گزینه FAST را برای پارامتر Vertical sync انتخاب کنید. توجه داشته باشید که عملکرد این پارامتر در حال پیش فرض به موتور گرافیکی گیم سپرده شده است.

HDR

نمایشگرهای جدید با محدوده دینامیکی بالا (HDR) یکی از بزرگ‌ترین پیشرفت‌های 20 سال اخیر در کیفیت پیکسل صفحه نمایش محسوب می‌شوند. طیف رنگ BT.2020 حداکثر 75% از رنگ‌های قابل روئیت توسط چشم انسان را پوشش می‌دهد (33% بیشتر از طیف رنگ sRGB). این یعنی افزایش 2 برابری محدوده رنگ‌ها. علاوه بر این نمایشگرهای HDR حداکثر روشنایی به‌مراتب بیشتری نسبت به نمایشگرهای نسل قبل دارند (بیش از 1000 nits در نمایشگرهای LCD) و همین‌طور درخشندگی به‌مراتب بیشتر (l>10:000 to 1).

(Standard Dynamic Range Image (SDR

 


 

(High Dynamic Range Image (HDR 1000

 

با محدوده بیشتر روشنایی و اشباع رنگ، محتوای HDR نمایش واقع‌گرایانه‌تری از جهان واقعی خواهند داشت: رنگ‌های مشکی عمیق‌تر و رنگ‌های سفید روشن‌تر از قبل به نظر می‌رسند. تغییرات ایجاد شده در تولید رنگ باعث ایجاد تصاویر واقعی‌تر می‌شود که حقیقتاً حیرت انگیز است. کاربران سرانجام می‌توانند طیف رنگ‌های قرمز و نارنجی را در آتش و یا انفجار مشاهده کنند. همچنین به خاطر درخشندگی (Contrast) بیشتر در نمایشگرهای HDR کاربران می‌توانند جزئیات بیشتری را در نقاط کاملاً تاریک و یا با نور بسیار زیاد مشاهده کنند.

 

کارت‌های گرافیکی مبتنی بر معماری Pascal همانند نمونه‌های مشابه نسل قبل (Maxwell) از تمامی نمایشگرهای HDR پشتیبانی می‌کنند و به لطف کنترلر نمایشگر تعبیه شده در آن‌ها از قابلیت‌های 12b color، طیف رنگ گسترده (BT.2020،(SMPTE 2084 (Perceptual Quantization و HDMI 2.0b 10/12b برای 4K HDR نیز برخوردار هستند؛ اما در معماری Pascal برخی قابلیت‌های جدید به این مجموعه اضافه شده است:

  • 4K@60 10/12b HEVC Decode (برای ویدئوهای HDR)
  • 4K@60 10b HEVC Encode (برای ضبط و یا استریم ویدئوهای HDR)
  • DP1.4-Ready HDR Metadata Transport (برای اتصال به نمایشگرهای HDR با رابط Display Port)

 

تلویزیون‌های HDR در حال حاضر موجود هستند و قابلیت‌هایی که به آن اشاره شد این امکان را فراهم می‌سازند تا کاربران به واسطه دستگاه HDR Gamestream که در آینده نزدیک به بازار عرضه خواهد شد بدون اتصال مستقیم PC خود به تلویزیون بازی‌های HDR را بر روی این نمایشگرها اجرا و از آن‌ها لذت ببرند.

 

همچنین انویدیا در حال کار با توسعه دهندگان است تا HDR را به بازی‌های رایانه‌ای نیز ببرند. انویدیا با فراهم کردن API، درایورهای لازم و همچنین راهنمایی لازم، توسعه دهندگان را پشتیبانی می‌کند تا بتوانند تصاویر رندر شده HDR سازگار با این نوع نمایشگرها را با بهترین کیفیت و وضوح ممکن ارائه کنند. بازی‌های با محتوای HDR مثل Obduction, The Witness, Lawbreakers, Rise of the Tomb Raider, Paragon, The Talos Principle و Shadow Warrior 2 در حال حاضر عرضه شده و یا در آینده نزدیک عرضه خواهند شد.

 

Video and Display

پردازنده‌های گرافیکی مبتنی بر معماری Pascal با پشتیبانی از گواهی نامه (PlayReady 3.0 (SL3000 و رمزگشایی HEVC با استفاده از شتاب دهنده‌های سخت افزاری برای اولین بار قابلیت مشاهده ویدئوهای 4K premium را توسط PC فراهم کرده‌اند. در ماه‌های آینده کاربران مجهز به پردازنده‌های گرافیکی Pascal این امکان را خواهند داشت تا در Netflix و یا دیگر ارائه دهندگان محتوای باکیفیت، با رزولوشن 4K محتواهای مختلف را استریم و مشاهده کنند.

 

به لطف برخورداری GeForce GTX 1080 از گواهی نامه Display Port 1.2 و به همراه داشتن قابلیت‌های DP 1.3/1.4 پشتیبانی از نمایشگرهای با رزولوشن‌های 4K در 120Hzا، 5K در 60Hz و 8K در 60Hz (به واسطه دو کابل مجزا) فراهم شده است.

جدول زیر به صورت خلاصه قابلیت‌ها و ویژگی‌های خروجی تصویر Geforce GTX 1080 را در مقایسه با Geforce GTX 980 نشان می‌دهد:

 

 مدل Founders Edition کارت گرافیک Geforce GTX 1080 دارای 3 خروجی تصویر Display Port، یک خروجی تصویر HDMI 2.0b و یک پورت Dual Link DVI است که قادر به ارائه 4 تصویر به صورت هم‌زمان هستند.

در جدول زیر نیز به صورت خلاصه قابلیت‌های Geforce GTX 1080 را در رمزگذاری و رمزگشایی Codec های مختلف ویدئویی در مقایسه با Geforce GTX 980 مشاهده می‌کنید:

 

VRWorks Graphics

گیمینگ واقعیت مجازی زمان پاسخ دهی بسیار پایین و از آن مهم‌تر نرخ Frame Rate بالایی را برای داشتن تجربه‌ای دل چسب و همه جانبه توسط کاربران طلب می‌کند. این در حالی است که کیفیت بازی‌های اخیر مبتنی بر VR خوب به نظر می‌رسد ولی هنوز به مرحله‌ای نرسیده است که از نظر کیفیت با بازی‌های مدرن غیر VR برابری کنند. یکی از مهم‌ترین دلایل این امر الزامات مربوط به نرخ Frame Rate بالا است که هم اکنون پردازنده‌های گرافیکی با قدرت کم توانایی ارائه آن را باکیفیت بالا و همراه با افکت‌های واقع‌گرایانه ندارند.

 

به‌منظور همسان سازی کیفیت گرافیکی بازی‌های مبتنی بر VR و غیر VR، انویدیا در پردازنده‌های گرافیکی مبتنی بر معماری Pascal چندین تکنولوژی جدید جهت افزایش کارایی رندر گرافیکی در کاربردهای VR توسعه داده است. این تکنولوژی‌ها در نهایت سبب شده‌اند تا Geforce GTX 1080 در کاربردهای VR بیش از دو برابر سریع‌تر از Geforce TITAN X باشد. با این افزایش کارایی در پردازنده‌های گرافیکی مبتنی بر معماری Pascal از این پس توسعه دهندگان بازی‌های VR می‌توانند کیفیت گرافیکی نظیر بازی‌های مدرن غیر VR را برای محتوای گرافیکی ساخت خود فراهم کنند.

VRWorks Audio

تکنولوژی‌های شنیداری در گیم و واقعیت مجازی مرسوم کنونی، موقعیت دقیقی از منبع صدا را در یک محیط مجازی ارائه می‌دهند. برای مثال اگر در یک بازی ژانر شوتر، دشمن از سمت راست شما به طرفتان شلیک کند شما نیز در عمل همین حس را خواهد داشت. دلیل این امر پخش شدن بلندتر صدای شلیک از بلندگوی سمت راست اسپیکر شما نسبت به اسپیکر سمت چپ است و البته این صدا کمی زودتر نیز از بلندگوی سمت راست شنیده می‌شود. این شبیه سازی در تقدم رسیدن و تقدم انرژی اولین موج صدا برای رسیدن به شنونده را اصطلاحاً Direct Sound می‌نامند. تفاوت‌ها در انرژی و تقدم رسیدن Direct Sound به هر گوش شنونده نیز Binaural Effects نامیده می‌شود.

 

اما در جهان واقعی صداها در جهات مختلفی پخش می‌شوند و ممکن است به صورت مستقیم به گوش شنونده نرسند. بعضی از این صداها ممکن است در اثر انعکاس برخورد موج صدا به سطوح مختلف به گوش شنونده برسند. به این گونه از امواج، صدای غیرمستقیم، صدای منعکس شده و یا طنین صدا اطلاق می‌شود. نوع صدای غیرمستقیم به اندازه، شکل و خواص متریال محیط اطراف آن بستگی دارد. برای مثال، وقتی که در حمام کوچک با دیوار کاشی شده و کف‌پوش قدم می‌زنید، صدای قدم برداشتن شما بلندتر و با پژواک بیشتری به گوش می‌رسد تا زمانی که در همان محیط ولی با دیوارهای گچی و کف پوشیده شده با فرش قدم می‌زنید. در واقع متریال مختلف در انعکاس صدا در جهات مختلف نقش بسیار مهمی دارند. بعضی متریال مانند کاشی و کف‌پوش‌ها باعث انعکاس حجم زیادی از انرژی صوتی می‌شوند و بعضی از متریال مانند موکت و فرش حجم اعظمی از انرژی صوتی را جذب خود می‌کنند.

NVIDIA VRWorks Audio از تکنیک Ray tracing که در گرافیک کامپیوتری جهت رندر و ترسیم تصاویر استفاده می‌شود برای ردیابی مسیر انتشار اصوات در یک صحنه مجازی استفاده می‌کند. VRWorks Audio انرژی اصوات منتشر شده را از طریق محیط اطراف شبیه سازی می‌کند. برای این منظور یک موج برای ردیابی مسیرهای مستقیم و یا غیرمستقیم بین منبع اصوات و شنونده ارسال می‌شود. وقتی این امواج به سطوح مختلف محیط آن صحنه برخورد می‌کنند ممکن است جذب شده، منعکس شده و یا با توجه به زاویه برخورد خود پراکنده شوند و همان‌طور که اشاره شد جنس متریال سطوح نیز در این امر دخیل است.

 

VRWorks Audio در واقع Binaural Effects را در Direct sound ایجاد می‌کنند که قبلاً نیز گیمرها آن را تجربه کرده‌اند؛ اما وجه تمایز این تکنولوژی با موارد مشابه پشتیبانی آن از جلوه‌های صوتی انتشار غیرمستقیم امواج صوتی است که به شنونده اطلاعات مربوط به ابعاد و ساختار فضایی که در آن حضور دارد را نیز می‌دهد.

 

تکنولوژی VRWorks Audio از همان موتور NVIDIA OptiX ray tracing engine استفاده می‌کند که نرم افزارهای مبتنی بر تکنیک Ray tracing برای پردازش اطلاعات بهره می‌برند. موتور OptiX در بازی‌های رایانه‌ای سازگار با آن می‌تواند باعث افزایش سرعت بسیاری از عملیات‌ مثل پردازش دقیق Ambient Occlusion و نورپردازی شود. با تکنولوژی VRWorks Audio، گیمرهای واقعیت مجازی صدای 3 بعدی فراگیرتری را تجربه خواهند کرد که در کنار کیفیت بالای گرافیکی ارائه شده توسط پردازنده‌های گرافیکی مبتنی بر معماری Pascal، آن‌ها را در محیط مجازی گیم ها غرق خواهد کرد!

PhysX for VR Touch & Environmental Simulation

مدل سازی واقع‌گرایانه تعاملات لمسی و حرکات در محیط پیرامونی برای ارائه تجربه کاملی از واقعیت مجازی دو امر حیاتی محسوب می‌شوند. امروزه واقعیت مجازی نوعی تعامل قابل لمس از محیط ارائه می‌کنند که بر اساس ترکیبی از ردیابی موقعیتی، کنترل دست و تکنولوژی‌های حسی و لمسی کار می‌کنند. تکنولوژی NVIDIA’s PhysX Constraint Solver زمانی که کنترلر دست با یک جسم مجازی تعامل پیدا می‌کند را شناسایی کرده و موتور بازی را قادر می‌سازد تا در نهایت پاسخ فیزیکی بصری و لمسی دقیقی را در خروجی ارائه دهد.

 

تکنولوژی PhysX همچنین رفتار فیزیکی دنیای مجازی اطراف شما را طوری مدل سازی می‌کند که همه فعل و انفعالات مثل انفجار و یا پاشش آب زمانی که یک دست وارد آب می‌شود دقیق و همانند فعل و انفعالات دنیای واقعی به نظر برسد.

 

معرفی تراشه گرافیکی nVIDIA GP104-200 و مشخصات کارت گرافیک

معرفی تراشه گرافیکی nVIDIA GP104-200 و مشخصات فنی کارت گرافیک

تراشه گرافیکی (GPU) استفاده شده در کارت گرافیک Geforce GTX 1070 که با اسم رمز GP104-200 شناخته می‌شود تنها یک تفاوت عمده با نمونه به کار رفته در کارت گرافیک (Geforce GTX 1080 (GP104-400 دارد و آن هم غیرفعال شدن یکی از واحدهای بزرگ GPC یا همان Graphics Processing Cluster است. با غیرفعال شدن یکی از این 4 واحد تعداد CUDA core ها نیز به 1920 عدد و تعداد واحدهای Texture Unit نیز از 160 به 120 واحد تقلیل یافته است. علاوه بر این فرکانس پایه هسته GP104 نیز در Geforce GTX 1070 نسبت به Geforce GTX 1080 حدوداً 100MHz کمتر شده و به 1506MHz رسیده است. این در حالی است که در بخش‌های مربوط به رابط حافظه و واحدهای ROP تغییری مشاهده نمی‌شود.

اما تغییرات به همین جا ختم نمی‌شوند و انویدیا به جای استفاده از حافظه‌های با تکنولوژی GDDR5X در این مدل از 8GB حافظه GDDR5 با فرکانس مؤثر 8000MHZ استفاده کرده است. این تغییرات در عمل باعث کاهش پهنای باند حافظه از 320GB/s به 256GB/s در Geforce GTX 1070 شده است.

روی هم رفته نیز تمامی تغییرات نام برده باعث شده‌اند تا TDP یا توان مصرفی Geforce GTX 1070 به حداکثر 150W برسد. این در حالی است که این میزان در Geforce GTX 1080 حداکثر 180W اعلام شده است.

حال اگر قیمت $599 مدل Geforce GTX 1080 8GB را باقیمت به مراتب کمتر $379 کارت گرافیک Geforce GTX 1070 مقایسه کنید بدون شک به این موضوع پی خواهید برد که این میزان تغییرات در کارایی، ارزش خلق یک مدل به مراتب ارزان‌تر و خوش قیمت‌تر را داشته است!

گیگابایت برای مدل Geforce GTX 1070 G1 GAMING دو پروفایل اورکلاک مختلف تحت عنوان‌های OC Mode و Gaming Mode در نظر گرفته است که البته پروفایل Gaming Mode به‌عنوان پروفایل پیش فرض این کارت گرافیک تعیین شده است. در هر دو پروفایل فرکانس چیپ های حافظه GDDR5 همانند مدل مرجع 8000MHz است و تفاوت این دو پروفایل تنها در 26MHz فرکانس پایه هسته GPU خلاصه می‌شود:

  • Gaming Mode) Boost: 1784MHz/ Base: 1594MHz)
  • OC Mode) Boost: 1822MHz/ Base: 1620MHz)

در جدول زیر مشخصات فنی این کارت گرافیک را در مقایسه با مدل مرجع و سایر مدل‌های هم تراز مشاهده می‌کنید:

 

بسته بندی و محتویات داخل جعبه

بسته بندی و محتویات داخل جعبه

 

طراحی استادانه لوگو G1 GAMING و رنگ و لعاب خاص جعبه این کارت گرافیک بسیار چشم نواز و موجب جلب توجه اغلب بینندگان آن می‌شود. همانند مدل‌های مشابه نسل قبلی جعبه با زمینه مشکی براق و وجود رنگ سبز مخصوص کمپانی انویدیا از ویژگی‌های تکراری این جعبه محسوب می‌شود.

 

مهم‌ترین مندرجات موجود بر روی جعبه نیز شامل مدل محصول، نشان تجاری کمپانی گیگابایت و لوگوهای مربوط به کولر Windforce، نورپردازی RGB LED و اورکلاک کارخانه‌ای این کارت گرافیک می‌شوند.

 

این جعبه با ابعاد 405mmx235mmx90mm با تمامی محتویات داخلش حدود 1.48Kg وزن دارد.

 

پشت جعبه آن چنان شلوغ نیست. در این بخش به‌صورت کلی و خلاصه در مورد کولر WINDFORCE 3X، دست چین بودن GPU های این سری جهت افزایش پتانسیل اورکلاک و نورپردازی RGB LED به‌صورت مصور توضیحاتی ارائه شده است. همچنین تصویری از پورت‌های خروجی تصویر پنل پشتی به همراه اطلاعات مربوط به حداقل مشخصات فنی منبع تغذیه و سیستم به همراه راه‌های ارتباطی با کمپانی سایر مندرجات این بخش را تشکیل می‌دهند.

 

 

با باز کردن پوشش مقوایی با این جعبه مشکی ‌رنگ روبرو خواهید شد که این کارت گرافیک را به واسطه یک پوشش ضد UV، در میان یک فوم اسفنجی جای داده است. سایر متعلقات این کارت گرافیک در زیر این فوم تعبیه شده‌اند.

 

همان‌طور که در تصویر بالا ملاحظه می‌کنید به غیر از کارت گرافیک، دفترچه راهنمای نصب و DVD حاوی درایورها و نرم افزارهای جانبی چیز دیگری در جعبه این مدل وجود ندارد!

نمای ظاهری و بررسی اولیه

نمای ظاهری و بررسی اولیه

 

در نگاه اول و در مقایسه با مدل مشابه نسل قبل این کارت گرافیک (Geforce GTX 970 G1 GAMING) تغییرات زیادی مشاهده نمی‌شود. نوع فن‌ها تغییری نکرده ولی فریم دور آن‌ها کمی بسته‌تر شده و البته بر خلاف نسل قبل که رنگ و لعابی یکدست مشکی داشت در نسل جدید طرح‌های مورب نارنجی رنگ چهره خاص‌تری به آن بخشیده است.

 

همانند اکثر کارت‌های گرافیک رده بالای کنونی برای بخش پشت PCB این مدل نیز یک صفحه فلزی مخصوص در نظر گرفته شده است. این صفحه فلزی برای محافظت از قطعات و اتصالات این بخش و کمک به دفع سریع‌تر حرارت PCB در نظر گرفت شده است. بر خلاف نسل قبل این صفحه طراحی کاملاً ساده دارد و خبری هم از لوگوی G1 GAMING بر روی آن نیست.

 

بر روی بخش فوقانی نیز نشان تجاری کمپانی گیگابایت و عبارت FAN STOP نقش بسته است که البته هر دو به نور پس زمینه RGB LED مجهز شده‌اند. لارم به ذکر است عبارت FAN STOP تنها در وضعیتی روشن می‌شوند که کارت گرافیک در وضعیت بی‌باری باشد و با فعال شدن حالت 0dB فن‌های دستگاه خاموش شده باشند.

 

در این مدل نیز تمامی پورت‌های خروجی تصویر، اسلات PCI-Express و کانکتورهای پل SLI تعبیه شده بر روی بخش فوقانی PCB با درپوش پلاستیکی مخصوص پوشیده شده‌اند تا عواملی مانند گرد و خاک، رطوبت و یا هر گونه جسم خارجی باعث خوردگی، آسیب و یا اکسیداسیون آن‌ها نشود.

 

این کارت گرافیک به جدیدترین نسخه 3 فن کولر بسیار قدرتمند و کم صدا WINDFORCE 3X مجهز شده است که در ادامه به‌صورت مفصل به معرفی آن خواهیم پرداخت.

 

یکی از نقاط قوت این مدل طول 280mm آن است که در مقایسه با مدل‌های مشابه از برندهای رقیب یکی از نقاط قوت آن محسوب می‌شود و تعبیه آن را در اکثر کیس های ارزان قیمت و رده متوسط نیز ممکن کرده است.

 

دقیقاً همانند مدل مرجع، Geforce GTX 1070 G1 GAMING نیز به یک پورت Dual Link DVI-D، یک پورت HDMI 2.0 و 3 پورت DisplayPort 1.4 مجهز شده است. لازم به ذکر است از این 5 خروجی تصویر، 4 خروجی قابلیت ارائه تصویر به‌صورت هم زمان را دارا می‌باشند. همچنین به لطف معماری فوق‌العاده مدرن پاسکال، امکان پشتیبانی از رزولوشن 7680x4320 @60Hzا(8K) نیز به واسطه اتصال این کارت گرافیک به نمایشگر توسط دو کانکتور DP 1.3 فراهم شده است.

 

همانند تمامی کارت‌های گرافیک مدرن کنونی این مدل نیز از رابط PCI-Express 3.0 x16 پشتیبانی می‌کند و با سرعت فوق‌العاده بالای (126.032Gbit/s (15.754GB/s با دیگر منابع سیستم در ارتباط است.

 

در تصویر بالا کانکتورهای پل SLI-HB این کارت گرافیک را ملاحظه می‌کنید. همان‌طور که در صفحه معرفی معماری پاسکال به آن اشاره شد به دلیل تغییرات صورت گرفته در نسخه جدید DirectX 12 و الگوریتم‌های مربوط به پیکربندی‌های Multi-GPU معماری پاسکال، کارت‌های گرافیک مبتنی بر این معماری طبق توصیه انویدیا تنها از پیکربندی دوگانه (2Way SLI) پشتیبانی می‌کنند.

 

همانند مدل مرجع انرژی مورد نیاز این کارت گرافیک 150W از طرق تنها یک کانکتور 8Pin PCI-Express تأمین می‌شود. روی کاغذ این کانکتور (150W) به همراه مقدار توان جذب شده توسط اسلات (PCI-Express (75W روی هم رفته 225W توان را برای این مدل اورکلاک شده فراهم می‌کنند که البته در حالت عادی کافی به نظر می‌رسد؛ اما شاید در شرایط اورکلاک سنگین پیکربندی ایده آلی محسوب نشود. این در حالی است که برخی مدل‌های مشابه در برندهای رقیب برای تأمین انرژی خود از دو کانکتور 6Pin و 8Pin استفاده می‌کنند.

نگاهی نزدیک‌تر (کولر GIGABYTE WINDFORCE 3X)

نگاهی نزدیک‌تر (کولر GIGABYTE WINDFORCE 3X)

 

کولر WINDFORCE 3X چند سالی می‌شود که نسخه‌های مختلف آن میهمان کارت‌های گرافیک سری G1 و Xtreme کمپانی گیگابایت است. طراحی خاص و زیبا، نویز صوتی فوق‌العاده پایین و قدرت کولینگ به مراتب بهتر از کولرهای مرجع از مهم‌ترین قابلت های این خنک کننده محسوب می‌شود؛ اما اجازه دهید برای بررسی دقیق‌تر کولر و متعلقات آن را از روی PCB باز کنیم.

 

همان‌طور که ملاحظه می‌کنید این کولر به واسطه 4 پیچ فنر دار و 3 پیچ معمولی به PCB متصل می‌شود.

 

دفع حرارت از روی هیتسینک ها به‌وسیله 3 فن 80mm مجهز به تیغه‌های با طراحی خاص انجام می‌شود؛ اما این کولر به خودی خود از چه اجزائی تشکیل شده است؟

 

به‌طور کلی این کولر از 3 بخش فن‌ها و فریم نگه دارنده آن‌ها، هیتسینک آلومینیومی مجهز به دو عدد هیت پایپ مسی و صفحه فلزی محافظه پشت PCB تشکیل شده است.

 

 

هیتسینک این مجموعه شامل دو Heat-Pipe مسی با قطر 8mm است که حرارت را به‌صورت مستقیم از سطح Die پردازنده گرافیکی (GPU) به دو مجموعه پره‌های آلومینیومی مجهز به بیش از 50 تیغه منتقل می‌کنند. همچنین این کولر همان‌طور که در تصویر بالا ملاحظه می‌کنید به واسطه پدهای مخصوص حرارتی، به دفع سریع‌تر حرارت تراشه‌های حافظه و ماسفت های مدار رگولاتور ولتاژ GPU نیز کمک می‌کند.

 

در تصویر بالا این شبکه‌های آلومینیومی را از نمای نزدیک مشاهده می‌کنید. همچنین همان‌طور که ملاحظه می‌کنید جهت استقرار مطمئن این هیتسینک بر روی PCB از پدهای اسفنجی مشکی رنگ بر روی این شبکه استفاده شده است.

 

در این کولر تنها از دو Heat-Pipe با قطر 8mm برای جذب حرارت به‌صورت مستقیم (Direct Touch) از سطح GPU استفاده می‌کند. همان‌طور که در تصویر بالا ملاحظه می‌کنید این سطح با عرض 16mm تمامی سطح Die پردازنده گرافیکی را پوشش نمی‌دهد و استفاده از 3 عدد Heat-Pipe از این نوع یا تعبیه Heat-Pipe های با قطر 10mm می‌توانست باعث افزایش کارایی این کولر شود.

 

 

به گفته گیگابایت Heat-Pipe های مرکب به کار رفته در این کولر به واسطه طراحی خاص و هدایت حرارتی بسیار بالایی که نسبت به Heat-Pipe نسل قبل دارند به‌صورت میانگین بیش از 29% از نمونه‌های مشابه عملکرد بهتری دارند.

 

 

فن‌های 80mm خنک کننده این مجموعه به تیغه‌های با طراحی خاص مجهز شده‌اند که ساختار منحنی تعبیه شده بر روی آن‌ها باعث افزایش 23% جریان هوا در مقایسه با فن‌های مشابه می‌شود.

 

این فن‌ها مدل PLD08010S12HH ساخت کمپانی Power Logic هستند. طبق مشخصات فنی ارائه شده توسط کمپانی سازنده این مدل از نوع Hydro-Dynamic با ولتاژ کاری 12V DC و حداکثر جریان مصرفی 0.35A است. همچنین حداکثر سرعت چرخش این فن‌های PWM نیز در تست‌های ما حدود 4200RPM ثبت شده است.

 

در تصاویر بالا نیز صفحه محافظ فلزی تعبیه شده در پشت PCB را ملاحظه می‌کنید. این صفحه که به‌وسیله 4 عدد پیچ بر روی PCB نصب می‌شود در عمل هم از قطعات تعبیه شده در پشت PCB محافظت می‌کند و هم به نوعی به‌عنوان هیتسینک حرارت منتقل شده توسط قطعات به PCB را جذب می‌کند تا با سرعت بیشتری دفع شود. همان‌طور که ملاحظه می‌کنید سطح پشتی این صفحه با عایق الکتریکی پوشیده شده است.

نگاهی نزدیک‌تر (مدار رگولاتور ولتاژ و تراشه‌های حافظه)

نگاهی نزدیک‌تر (مدار رگولاتور ولتاژ و تراشه‌های حافظه)

 

اگر با دید کلی نوع طراحی و کامپوننت های به کار رفته در مدار رگولاتور ولتاژ این مدل را با مدل مرجع مقایسه کنیم می‌توان گفت تفاوت‌ها به مراتب بیشتر از شباهت‌ها است. گیگابایت از یک مدار 6i+2Phase با ترکیبی از ماسفت های (Low RDS(on، چوک های سری SRPG ساخت کمپانی Magic Technology و خازن‌های فیلتر تانتالیوم در این مدل استفاده کرده است. این در حالی است که مدار مدل مرجع از نوع i4+1Phase و مجهز به ماسفت های مجتمع از نوع DrMOS است.

 

پشت PCB نیز به مراتب شلوغ‌تر از برد مدل مرجع است و Control Mosfet ها و برخی خازن‌های تانتالیوم به همراه PWM Controller مدار رگولاتور ولتاژ GPU در این بخش تعبیه شده‌اند.

 

در تصویر بالا در نمایی بسته 6 شریان تأمین کننده جریان مورد نیاز تراشه گرافیکی (GPU) این کارت گرافیک را در بخش جلو و 2 شریان تغذیه کننده انرژی مورد نیاز تراشه‌های حافظه را نیز در پشت آن‌ها ملاحظه می‌کنید.

 

در تصویر بالا در نمایی نزدیک‌تر به ترتیب از پایین به بالا خازن‌های تانتالیوم فیلتر مدار رگولاتور ولتاژ GPU، چوک های این مدار، ماسفت های High/Low Side، تراشه‌هایMOSFET Gate Driver ، خازن‌های تانتالیوم فیلتر مدار رگولاتور ولتاژ تراشه‌های حافظه، چوک های این مدار و در نهایت ماسفت های High/Low Side این بخش را ملاحظه می‌کنید؛ اما یکی از مواردی که در این مدار مشاهده می‌شود اصرار گیگابایت در استفاده از خازن‌های تانتالیوم در بخش فیلتر نهایی همانند مدل مرجع است. این در حالی است که اکثر مدل‌های مشابه در این بخش از خازن‌های جامد ژاپنی و با ظرفیت‌های به مراتب بالاتر استفاده کرده‌اند. در واقع علیرغم عمر بسیار بالا و جریان نشتی بسیار کم، یکی از نقاط ضعف خازن‌های Tantalum ظرفیت محدود آن‌ها و تحمل کم در برابر جریان‌های بالای شارژ و دشارژ است. به بیانی دیگر در اکثر مواقع نیز مهندسین طراح مدارهای الکترونیکی به دلیل کوچک‌تر بودن این خازن‌ها تنها در زمانی که با محدودیت‌های شدید فضا روبرو هستند و یا جریان نشتی ولو کم باعث ناپایدار شدن مدار می‌شود از این نوع خازن‌ها استفاده می‌کنند.

 

همچنین به دلیل محدودیت فضا در پشت PCB و برای افزایش بیش از پیش پایداری سطح ولتاژ، 2 خازن 470uf تانتالیوم دقیقاً در پشت محل نصب GPU بر روی PCB تعبیه شده است.

 

در تصویر بالا ماسفت های مدل AON3414A به‌عنوان سوئیچ High-Side و مدل AON6508 ساخت کمپانی نه چندان نام آشنای ALPHA & OMEGA Semiconductor را به‌عنوان سوئیچ Low-Side این مدار ملاحظه می‌کنید. از جمله قابلیت‌های این ماسفت ها می‌توان به تلفات بسیار پایین کانال درین به سورس، تحمل حداکثر جریان مستقیم 32A و ولتاژ تحریک گیت بسیار پایین اشاره کرد.

 

همچنین گیگابایت از تراشه‌های مدل 53603A  ساخت کمپانی آمریکایی Texas Instruments به‌عنوان Gate Driver  ماسفت های نام برده استفاده کرده است.

 

تراشه PWM Controller مدار رگولاتور ولتاژ تراشه گرافیکی مدل Up9511P ساخت کمپانی uPI Semiconductor است. این تراشه که در واقع یک 8Phase Buck Controller است قابلیت بایاس در حالت‌های 2/3/4/5/6/7/8/i1-Phase را نیز دار می‌باشد. از جمله قابلیت‌های این تراشه می‌توان به قابلیت DCR Current Sensing و پروتکشن های Over/Under Voltage و Over Temperature به همراه قابلیت کنترل نرم افزاری سطح ولتاژ خروجی اشاره کرد.

 

در تصویر بالا نیز قطعات مدار 2Phase رگولاتور ولتاژ تراشه‌های حافظه را مشاهده می‌کنید. به روشنی مشخص است که از همان قطعات مشابه با مدار رگولاتور ولتاژ GPU در این بخش نیز استفاده شده است.

 

در تصویر بالا نیز قطعات مدار رگولاتور ولتاژ بخش PLL این کارت گرافیک را ملاحظه می‌کنید. تراشه up1728 ساخت کمپانی uPI Semiconductor که در واقع یک Synchronous-Rectified Buck Converter مدرن محسوب می‌شود به تنهایی به غیر قطعات مربوط فیلتر خروجی تمامی بخش‌های یک مدار رگولاتور ولتاژ 1Phase را اعم از ماسفت های Low/High Side، تراشه PWM Controller و Mosfet Driver و سایر مدار محافظ را درون پکیج بسیار کوچک خود گنجانده است. از جمله ویژگی‌های این تراشه منحصر به فرد می‌توان به حداکثر جریان خروجی مستقیم 3A، حداکثر فرکانس سوئیچینگ 1.2MHz و بازدهی مصرف انرژی بیش از 95% اشاره کرد. در تصویر زیر می‌توانید بلاک دیاگرام این تراشه همه کاره را ملاحظه می‌کنید:

 

 

در تصویر بالا نیز قلب این کارت گرافیک یا همان پردازنده گرافیکی (GPU) مدل GP104-200 را ملاحظه می‌کنید. در این GPU همان‌طور که اشاره شد 7.2 میلیارد ترانزیستور که بر پایه تکنولوژی 16nm FinFET کمپانی تایوانی TSMC ساخته شده‌اند بر روی Die به‌اندازه 314mm² مجتمع شده‌اند.

 

 

همانند مدل مرجع کمپانی GIGABYTE نیز از تراشه‌های حافظه GDDR5 مدل K4G80325FB-HC25 ساخت کمپانی کره‌ای SAMSUNG در این کارت گرافیک استفاده کرده است. هر یک از این تراشه‌ها دارای حجم (8Gb (1GB و رابط 32bits هستند که روی هم رفته 8GB حافظه GDDR5 8000MHz با رابط کلی 256bits و پهنای باند معادل 256GB/s برای تراشه گرافیکی قدرتمند این کارت گرافیک فراهم می‌کنند.

متد و سیستم تست

متد و سیستم تست

تست‌های کارت گرافیک در لابراتوار تخصصی شهر سخت افزار به‌صورت کلی به چند بخش تقسیم می‌شوند:

  • تست‌های حرارتی
  • تست‌های مدیریت مصرف انرژی (توان مصرفی کل سیستم)
  • تست‌های کارایی GPGPU (General Purpose Graphics Processing Unit)
  • تست‌های کارایی گیمینگ
  • تست اورکلاکینگ

برای مقایسه نتایج نیز از نتایج موجود در آرشیو لابراتوار استفاده شده است.

 

در جدول زیر مشخصات فنی سیستم Testbed لابراتوار شهر سخت‌افزار را ملاحظه می‌کنید:

 

پارامترهای Bios در حالت پیش‌فرض تنظیم‌شده‌اند (به‌استثنای فعال کردن قابلیت XMP)، دمای محیط در حین تست به‌صورت ثابت بر روی 25 درجه سانتی‌گراد (با تلورانس 1 درجه) تثبیت شده و تنظیمات مدیرت مصرف انرژی در سیستم‌عامل نیز در وضعیت Balanced تنظیم‌شده است. همچنین تمامی نرم افزارهای امنیتی و قابلیت Windows Defender نیز غیرفعال شده‌اند.

لازم به ذکر است تکنولوژی NVIDIA PhysX موجود در کارت‌های گرافیک Geforce در تمامی تست‌های کارت گرافیک لابراتوار غیرفعال شده است.

همچنین لیست نرم‌افزارهای Benchmark، Monitoring و Game ها که مبتنی API های مدرن DirectX 11، DirectX 12 و OpenGL می‌باشند به این شرح است:

  • 3DMark Download v2.1.2973 + Time Spy
  •  3DMARK 11 v1.0.132
  • GTA V
  • Crysis 3
  • Call of Duty Black Ops III
  • Battlefield Hardline
  • Batman Arkham Knight
  • Quantum Break
  • Ashes of the Singularity
  • Bioshock Infinite
  • GRID 2
  • Dirt Rally
  • Sniper Elite III
  • The Witcher 3 - Wild Hunt
  • Unigine Valley 1.0
  • Unigine Heaven 4.0
  • Assassins Creed Syndicate
  • AIDA64 Extreme Edition 5.75.3900
  • SiSoftware Sandra Business 2016.03.22.20
  • GPU-Z 1.9.0
  • FurMark 1.18.0

در تصویر زیر نیز مشخصات فنی GIGABYTE GeForce GTX 1070 G1 Gaming را از نگاه نرم‌افزار GPU-Z ملاحظه می‌کنید:

 

همچنین ولتاژ هسته GPU نمونه برداری شده توسط ولت‌متر دیجیتال در این کارت گرافیک همانند مدل مرجع در وضعیت‌های Idle و Load کامل در شرایط مختلف به ترتیب حداقل 0.625V و حداکثر 1.062V ثبت شد.

 

حداکثر فرکانس هسته GPU نیز در حالت Boost در این مدل 1949MHz ثبت شده است.

متد تست‌های کارایی

 در این بخش آخرین و معتبرترین نرم‌افزارهای تست و محک کارت گرافیک به همراه بازی‌های رایانه‌ای روز را برای تست کارت‌های گرافیک انتخاب کردیم.

تنظیمات گرافیکی در تمامی گیم ها بر روی حداکثر مقدار ممکن تنظیم شده است. البته تنظیمات گرافیکی منحصر به تراشه‌های گرافیکی Nvidia و یا AMD در تمامی گیم ها غیرفعال شده‌اند.

تمامی تست‌های Gaming در 4 رزولوشن و تکنیک‌های Anti-Aliasing مختلف صورت گرفته است. کانفیگ های نام‌برده به شرح زیر می‌باشند:

  • 1600x900 – 0X MSAA
  • 1920x1080 – 2X MSAA
  • 2560x1440 – 4X MSAA
  • 3840x2160 – 8X MSAA

علت اصلی انتخاب کانفیگ های بالا شبیه‌سازی شرایط برای نمایشگرهای مختلف با سایزهای مختلف بوده است. به این صورت که کانفیگ اول شرایط را برای مانیتورهای کوچک‌تر از 20 اینچ، کانفیگ دوم برای مانیتورهای 22 تا 25 اینچ، کانفیگ سوم برای مانیتورهای 25 اینچ و بزرگ‌تر و کانفیگ چهارم نیز شرایط را برای نمایشگرهای فوق‌العاده باکیفیت و مدرن 4K شبیه‌سازی می‌کنند.

البته در برخی گیم ها که فاقد 8X Multisample anti-aliasing بودند یا از تکنیک‌های مشابه anti-aliasing استفاده می‌کنند، یا از همان 4X MSAA برای تست رزولوشن 4K استفاده شده و یا از تکنیک‌های مشابه ولی با نسبت‌های مختلف استفاده شده است. لازم به ذکر است که مقادیر مربوطه در نمودارهای مرتبط درج شده است.

نورپردازی خلاقانه تحت عنوان G1 Outlook

نورپردازی خلاقانه تحت عنوان G1 Outlook

همان‌طور که در بخش معرفی اولیه و نگاه نزدیک‌تر این بررسی به آن اشاره شد این کارت گرافیک نیز همانند برخی از مدل‌های مشابه از کمپانی‌های رقیب به سامانه نورپردازی با استفاده از RGB LED مجهز شده است. البته این نورپردازی در حد نور پس زمینه برند تجاری کمپانی GIGABYTE در بخش فوقانی این کارت گرافیک محدود شده است.

 

در نسخه جدید نرم افزار Xtreme Engine که جهت کنترل و مدیریت پارامترهای مختلف کارت‌های گرافیک کمپانی گیگابایت طراحی و کد نویسی شده است یک بخش اختصاصی برای کنترل رنگ و جلوه‌های نورپردازی کارت‌های گرافیک مجهز به این سامانه در نظر گرفته شده است.

 

در این نرم افزار به غیر از حالت رنگ ثابت که قادر به انتخاب 16.8 میلیون رنگ برای آن خواهید بود 5 جلوه نورپردازی دیگر نیز پیش بینی شده است.

 

همچنین در حالت روشنایی متغیر نور RGB LED های تعبیه شده در این سامانه، 5 پارامتر مختلف نظیر فرکانس کلاک GPU، ولتاژ هسته GPU، سرعت چرخش فن‌ها و حرارت و میزان بار بر روی GPU می‌توانند عامل تغییر روشنایی باشند.

در تصاویر زیر نیز برخی رنگ‌های نورپردازی این کارت گرافیک به تصویر کشیده شده‌ است:

 

 

 

 

 

تست‌های مدیریت مصرف انرژی، حرارتی و نویز صوتی

تست‌های مدیریت مصرف انرژی، حرارتی و نویز صوتی

در این سه تست توان مصرفی کل سیستم (به وسیله دستگاه Wattmeter)، حداکثر حرارت هسته GPU مانیتور شده توسط نرم‌افزار GPU-Z و نویز سنجیده شده توسط دستگاه Sound Meter تعبیه شده در فاصله 1 متری سیستم را در دو وضعیت زیر ثبت کردیم:

  • پس از 15 دقیقه بی‌باری کامل سیستم (Idle)
  • پس از 15 دقیقه Load کامل کارت گرافیک توسط تست GPU Stress نرم‌افزار FurMark در رزولوشن Full HD

 

حقیقتاً کارت‌های گرافیک مبتنی بر معماری Nvidia Pascal در حال حاضر بهترین نمونه‌های موجود در بازار از نظر بازدهی مصرف انرژی هستند. در نمودار بالا به روشنی مشخص است که علیرغم اینکه Geforce GTX 1070 بیش از 40% کارایی بالاتری نسبت به مدل مشابه نسل قبل خود دارد (Geforce GTX 970) اما در عمل بیش از 25% انرژی کمتری مصرف می‌کند. به بیانی دیگر نسبت کارایی به توان مصرفی در نمونه نسل جدید بیش از 2 برابر بهتر شده است! ما این نتیجه را نوعی جادوگری برداشت می‌کنیم! شما چطور؟!

 طبق محاسبات ما این کارت گرافیک اورکلاک شده نسبت به مدل مرجع که به گفته انویدیا دارای TDP حداکثر 150W است، حدود 50W مصرف بیشتری دارد. در نتیجه اگر قصد تعبیه این مدل در یک سیستم مدرن و رده بالا را دارید پیشنهاد می‌کنیم حداقل از یک پاور استاندارد با توان واقعی 500W الی 550W استفاده کنید. همچنین در صورتی که از پیکربندی‌های دوگانه SLI نیز استفاده می‌کنید به شما پاوری با توان واقعی حداقل 700W الی 750W توصیه می‌کنیم.

نکته قابل تأمل دیگر در این تست مصرف انرژی بیشتر GIGABYTE GTX 1070 G1 GAMING هم در حالت Idle و هم در حالت Load در مقایسه با مدل مشابه از کمپانی ASUS است. در واقع مدل گیگابایت علیرغم داشتن کلاک هسته GPU کمتر نسبت به مدل ASUS در حالت Load بیش از 7% توان مصرفی بیشتری دارد. شاید یکی از دلایل ثبت چنین نتیجه‌ای بازدهی پایین‌تر مدار رگولاتور ولتاژ و مدیریت میزان این پارامتر در وضعیت‌های مختلف بار بر روی GPU باشد. 

بالا بودن دمای حالت Idle این کارت گرافیک به دلیل حالت 0dB و خاموش شدن فن‌ها در حالت بی‌باری حاصل شده است؛ اما نتیجه کسب شده در حالت Load چه در بخش دما و چه در بخش نویز صوتی بهترین نیست ولی جزو بهترین‌ها محسوب می‌شود.

تست‌های GPGPU با استفاده از نرم افزارهای AIDA64 5.75 و SISoftware Sandra 2016

تست‌های GPGPU با استفاده از نرم افزارهای AIDA64 5.75 و SISoftware Sandra 2016

 

علاوه بر کاربردهای Gaming کارت‌های گرافیک، برخی نرم افزارهای فنی و مهندسی و البته چند رسانه‌ای نظیر نرم افزارهای CAD و ویرایش صوت و تصویر و ویدئو مانند مجموعه‌های نرم افزاری کمپانی Adobe با استفاده از برخی API های استاندارد مانند OpenCL و انحصاری مانند Nvidia CUDA فرآیند پردازش اطلاعات را به‌طور بسیار محسوس و حتی بر برخی موارد خیره کننده تسریع می‌بخشند. این نوع نرم افزارها با استفاده از الگوریتم‌های بسیار مدرن و هوشمند بار پردازش اطلاعات خود را تا حد ممکن به چند صد رشته مختلف تقسیم می‌کنند تا صدها Stream Processor و یا CUDA Core تعبیه شده در GPU کارت‌های گرافیک با سرعت به مراتب بیشتر از CPU فرآیند پردازش اطلاعات پیچیده و زمان بر آن‌ها را بر عهده بگیرند.

 

در این تست ابتدا با استفاده از بخش GPGPU Benchmark نرم افزار AIDA64 کارایی خام کارت‌های گرافیک را در محاسبات ممیز شناور (Floating-Point) به صورت Single-precision یا 32bits و Double-precision یا 64bits با استفاده از API فراگیر OpenCL می‌سنجیم. سپس با استفاده از تست‌های استاندارد نرم افزار SISoftware Sandra و البته دوباره با کمک رابط برنامه نویسی OpenCL کارایی پردازش همه منظوره (GPGPU) کارت‌های گرافیک را در الگوریتم‌های شبیه سازی شده پردازش تصاویر و نرم افزارهای فنی مهندسی محک می‌زنیم.

 

 

 

 

همان‌طور که در نتایج تست‌های مختلف ملاحظه می‌کنید علیرغم افزایش حدوداً 2 برابری کارایی Compute یا پردازش همه منظوره در Geforce GTX 1070 نسبت به مدل مشابه نسل قبل (Geforce GTX 970) ولی کماکان عملکرد پایین مخصوصاً در تست‌های Double-precision یا 64bits در مقایسه با مدل‌های مشابه مبتنی بر تراشه‌های گرافیکی کمپانی AMD یکی از بزرگ‌ترین نقاط ضعف کارت‌های گرافیک مبتنی بر معماری Pascal با تراشه GP104 محسوب می‌شود.

تست‌های (3DMARK 11/Fire Strike/Time Spy (DirectX 12

تست‌های (3DMARK 11/Fire Strike/Time Spy (DirectX 12

سری نرم‌افزارهای 3DMARK کمپانی Futuremark از سال 1999 تاکنون، بدون شک یکی از محبوب‌ترین و معتبرترین نرم‌افزارهای تست کارایی کارت‌های گرافیک بوده‌اند.

شاید منحصربه‌فردترین ویژگی نتایج تست‌های این دو نرم‌افزار ایزوله بودن نتایج تست‌های GPU و CPU می‌باشد که نتایج تست‌های هر یک از قطعات نام‌برده شده را نسبت به دیگری متمایز می‌کند. این امر کمک می‌کند تا بر روی پلتفرم‌های مختلف نتایجی حدوداً یکسان را برای یک مدل کارت گرافیک داشته باشیم. درنتیجه مقایسه بین مدل‌های مختلف کارت‌های گرافیک حتی در پلتفرم‌های مختلف نیز با سهولت بیشتری انجام می‌شود.

در جدیدترین نسخه 3DMARK با اضافه شدن تست Time Spy قابلیت سنجش کارایی کارت‌های گرافیک در API جدید، بسیار مدرن و البته پربازده DirectX 12 نیز فراهم شده است. همان‌طور که در جدول زیر مشاهده می‌کنید به واسطه موتور گرافیکی ناب و بسیار کارآمد این تست، تمامی منابع مرتبط با رئوس، تکنیک‌های پیاده سازی Tessellation و فراخوانی Compute Shader ها در سنگین‌ترین و پیچیده‌ترین حالت ممکن صورت می‌گیرد تا تمامی تکنولوژی‌های جدید پیاده سازی شده در DirectX 12 به بهترین نحو ممکن کفایت و کارایی خود را در عمل ثابت کنند.

 

 

به روشنی مشخص است که کارایی Geforce GTX 1070 نسبت به نمونه مشابه نسل قبل خود (Geforce GTX 970) بیش از 50% افزایش داشته است! همچنین دلیل اختلاف کارایی اندک GIGABYTE Geforce GTX 1070 G1 GAMING در مقایسه با ASUS Geforce GTX 1070 STRIX OC به دلیل فرکانس بیشتر کلاک هسته GPU مدل ASUS است. در واقع مدل‌های سری STRIX کمپانی ASUS از نظر قیمت و قابلیت‌ها یک رده از سری G1 GAMING کمپانی گیگابایت بالاتر هستند و باید با مدل‌های سری Xtreme Gaming این کمپانی مقایسه شوند.

تست گیمینگ - (Ashes of the Singularity (DirectX 12

(Ashes of the Singularity (DirectX 12

بازی کامپیوتر Ashes of the Singularity یکی از بازی‌های سبک استراتژیک است که توسط Oxide Games طراحی و ساخته شده و به‌تازگی توسط کمپانی Stardock برای پلتفرم PC به بازار عرضه شده است. در قرن 21, انسان‌ها توانسته‌اند به فناوری به نام Hailee دست پیدا کنند که آن‌ها را برای خلق آینده بشریت کمک می‌کند. با استفاده از این فناوری، بشریت قادر است به‌سرعت در سایر فناوری‌ها به پیشرفت‌های بزرگی دست پیدا کند و به نقطه‌ای از تاریخ دست یابد که هیچ‌کس حتی تصورش را هم نمی‌کند. به عنوان فن آوری های پیشرفته، انسان‌ها سعی کردند تا آگاهی خود را فراتر از محدوده مشخص شده گسترش دهند. در ابتدا، انسان بدن طبیعی خود را نگه می‌داشت در حالی که ذهن خود را به صورت یکپارچه و به عنوان یک منبع محاسباتی واقع در شبکه‌ای گسترده قرار می‌داد. طولی نکشید که انسان‌ها به سطحی از علم رسیدند که دیگر نیازی به بدن برای تعامل با محیط اطراف نبود. حالا بشریت وارد عصر طلایی جدیدی شده است. گرافیک قابل قبول، مأموریت‌ها مختلف همراه سطوح دشواری متنوع، استفاده از سلاح‌ها و تجهیزات پیشرفته و موسیقی متن گوش‌نواز تنها بخشی از ویژگی‌های منحصر به فرد این بازی است. Ashes of the Singularity موتور گرافیکی Nitrous را با خود به همراه دارد و جزء اولین بازی‌های مبتنی بر API جدید DirectX 12 محسوب می‌شود. بازدهی بالای موتور گرافیکی این بازی در فرآیند پردازش نام هم‌زمان (Async compute) از جمله ویژگی‌های منحصر به فرد آن محسوب می‌شود.

 

 

 

 

یکی دیگر از نقاط ضعف تراشه‌های گرافیکی مبتنی بر معماری Pascal همانند Maxwell ضعف آن‌ها در محاسبات به اصطلاح Async Compute یا ناهم‌زمان است. محاسباتی که پردازش کارآمد آن‌ها در گیم ها و برنامه‌های مبتنی بر DirectX 12 نقش مهمی در افزایش بهره‌وری کارایی نهایی خواهد داشت. در نمودارهای بالا ملاحظه می‌کنید که در این گیم به دلیل حجم بالای محاسبات ناهم‌زمان، Geforce GTX 1070 نتوانسته تمامی توانایی‌های خود را ارائه کند و این تراشه‌های گرافیکی AMD هستند که در اکثر گیم های مبتنی بر DirectX 12 پیروز میدان هستند.

تست گیمینگ - (Quantum Break (DirectX 12

(Quantum Break (DirectX 12

کمپانی پرافتخار Remedy Entertainment در همکاری با Microsoft Corporation اقدام به ساخت عنوانی بزرگ با نام Quantum Break نمودند که در سبک اکشن، ماجراجویی و شوتر سوم شخص با زمینه علمی-تخیلی طراحی شده و توسط Microsoft Studios برای کنسول Xbox One و سیستم عامل Windows منتشر شده است.
 Quantum Break یک بازی فوق‌العاده جذاب با ایده‌ای نوین است که در آن، سفرهای زمانی و دست‌کاری زمان، ویژگی اصلی گیم پلی بازی است. شما در نقش جک (Jack Joyce) ظاهر می‌شوید که توانایی کنترل زمان را دارد و با کمپانی نابکاری که قصد پایان زمان را دارد، وارد مبارزه می‌شود. لحظات حماسی ویرانگری در قالب زمان فریز می‌شوند و صحنه‌هایی بی‌نظیر از مبارزه را خلق می‌کنند. تصمیمات شما بر بخش‌های مختلف بازی اثر می‌گذارد، ولی به گفته کمپانی Remedy، بازی دارای پایانی منحصربه‌فرد است.
داستان Quantum Break که در بستر گذر و فریز زمان نوشته شده، با حضور ستاره‌های فیلم‌های X-men؛ Game of Thrones؛ The Wire و ... جذابیت دوچندانی را برای شما به ارمغان می‌آورد.

یکی از مهم‌ترین نقاط قوت این بازی موتور بازی فوق‌العاده مدرن Northlight Engine و برنامه نویسی سطح پایین مبتنی بر DirectX 12 است که آن را به یکی از مدرن‌ترین بازی‌های ویدئویی حال حاضر مبدل کرده است.

 

 

 

 

در این بازی مبتنی بر DirectX 12 نیز تقریباً اتفاق مشابه بازی Ashes of the Singularity تکرار شده است. همان‌طور که در نمودارها ملاحظه می‌کنید با بالاتر رفتن رزولوشن و پیچیده‌تر شدن پردازش اطلاعات در نهایت در رزولوشن WQHD کارت گرافیک Geforce GTX 1070 8GB در رقابت با Radeon R9 FURY X 4GB جا می‌ماند ولی در نهایت در رزولوشن UHD و آن هم به خاطر افزایش افسارگسیخته حجم بافت‌ها این حافظه 8GB مدل Geforce است که موجب پیشی گرفتن مجدد Geforce GTX 1070 می‌شود.

تست گیمینگ - (GTA V (DirectX 11

(GTA V (DirectX 11

کمتر گیمری را می‌توان پیدا کرد که تاکنون این بازی عظیم و سراسر هیجان را تا حالا تجربه نکرده باشد. سرانجام حدوداً 1.5 سال پس عرضه GTA V برای کنسول‌های XBOX 360 و PlayStation 3 کمپانی Rockstar Games بالاخره این بازی پرطرفدار را برای PC Gamer ها نیز منتشر کرد.

اما GTA V را باید یک تحول دوباره و شاید حتی یک نقطه عطف برای راک استار نامید. عنوانی که در بدو ارائه به بازار توانست به‌سرعت رکوردهای مختلفی را جابجا نماید. GTA V در دارای سه شخصیت اصلی می‌باشد که بازیکن می‌تواند در طول بازی هر کدام از این شخصیت‌ها را انتخاب نموده، به سلیقه خود شخصی سازی کرده و یا با کسب امتیازاتی توانایی‌های آن‌ها را افزایش دهد. راک استار برای هر کدام از این شخصیت‌ها داستانی در نظر گرفته که موجب پیچیده‌تر و جذاب‌تر شدن بازی شده است. البته بازی گهگاه از داستان اصلی دور می‌شود و به‌طور کلی می‌توان عدم یک داستان مطلوب با پایانی جالب توجه را از نقاط ضعف این بازی دانست. البته فراموش نکنید که داستان پیچیده این بازی که با شخصیت پردازی بی‌نظیری هم همراه شده، برای آنکه بازیکن را به‌سادگی به دنبال خود بکشد کاملاً جذابیت‌های لازم را دارا می‌باشد.

 

 

 

 

در گیم های مبتنی بر DirectX 11 کارایی معماری Pascal بسیار فراتر از حد انتظار است! نکته جالب توجه در این تست عملکرد حیرت انگیز Geforce GTX 1070 8GB در رزولوشن UHD – 8X MSAA است! جایی که عملکرد سامانه فشرده سازی رنگ در Pascal و همین طور 8GB حافظه این کارت گرافیک در عمل خود را نشان داده‌اند. این در حالی است که تمامی مدل‌های 4GB به دلیل کافی نبودن حافظه Frame Buffer یا با خطای درایور مواجه شده‌اند و یا عملکردی کمتر از 5FPS داشتند.

تست گیمینگ - (Assassin's Creed Syndicate (DirectX 11

(Assassin's Creed Syndicate (DirectX 11

Assassin's Creed Syndicate یک بازی ویدئویی تاریخی در سبک اکشن ماجرایی و مخفی‌کاری است که به‌وسیلهٔ یوبی‌سافت توسعه یافته و توسط همان کمپانی نیز عرضه شده است. این بازی در ۲۳ اکتبر ۲۰۱۵ برای کنسول‌های نسل هشتم، پلی‌استیشن ۴ و ایکس باکس وان و در ۱۹ نوامبر ۲۰۱۵ نیز برای مایکروسافت ویندوز عرضه شد. این نهمین قسمت از مجموعه اصلی Assassin's Creed به شمار می‌رود که داستان آن ۷۵ سال پس از اتفاقات نسخهٔ Assassin's Creed Unity رخ می‌دهد. این نسخه نیز همانند دیگر بازی‌های مجموعه در سبک اکشن ماجرایی، با دید سوم شخص و به صورت جهان باز می‌باشد و همچنین امکانات جدیدی شامل سیستم جدید جهانگردی، بهبود عملکرد مبارزات و مخفی‌کاری و ﺭﺍﻧﺪﻥ ﻭﺳﺎﯾﻞ ﻧﻘﻠﯿﻪ از جمله کالسکه است. ﺳﻼح ﻭ ﺍﺑﺰﺍﺭﻫﺎﯼ ﺟﺪﯾﺪﯼ ﺑﻪ ﺑﺎﺯﯼ ﺍﺿﺎﻓﻪ شده و همچنین بازیکن به صورت اختیاری قادر خواهد بود تا همانند بازی اتومبیل دزدی بزرگ ۵ هم در شخصیت جیکوب و هم در شخصیت ایوی بازی کند. به لطف موتور گرافیکی AnvilNext Engine که از نسخه‌های قبلی به Assassin's Creed Syndicate به ارث رسیده، پشتیبانی از اکثر قابلیت‌های DirectX 11 و البته نورپردازی و کیفیت بسیار بالای بافت‌ها در کنار سازگاری و بازدهی به مراتب بیشتر با سخت افزارهای مدرن از جمله ویژگی‌های محوری این بازی محسوب می‌شوند.

 

تست گیمینگ - (Batman: Arkham Knight (DirectX 11

(Batman Arkham Knight (DirectX 11

Batman: Arkham Knight یک بازی ویدیویی در سبک اکشن-ماجراجویی است که توسط Rocksteady Studios و بر اساس داستان‌های بتمن، ابرقهرمان کتاب‌های مصور DC Comics ساخته شده و توسط کمپانی برادران وارنر عرضه شده است. این نسخه چهارمین قسمت اصلی از سری بازی‌های Batman: Arkham است و در ۲ ژوئن ۲۰۱۵ برای مایکروسافت ویندوز، ایکس باکس وان و پلی‌استیشن ۴ منتشر شد.

بازی در شهر آرکهام اتفاق می‌افتد که به‌طور آزادانه (دنیای آزاد) قابل جستجو است. هنگام حرکت در مناطق مختلف از شهر نیازی به صبر کردن و لود شدن بازی نیست که با توجه به نقشه بزرگ نکته قابل اشاره‌ای می‌باشد. بسیاری از گجت‌های قبلی بازی‌های بتمن همچنان در این نسخه نیز مورد استفاده قرار گرفته است، از این جمله می‌توان به Grapnel gun, line launcher, batarangs و سیستم شناسایی و قدرت مقابله بتمن اشاره کرد. اسلحه "disruptor" برای از کار انداختن یا منجمد کردن اسلحه دشمنان و اسلحه "booby-trap" برای وارد کردن شوک به دشمنانی که هنوز مسلح و آماده نشده‌اند مورد استفاده قرار می‌گیرند. بازیکنان با استفاده از شنل بتمن می‌توانند در سراسر شهر پرواز کنند و در حالی که پرواز می‌کنند، از گجت‌هایی مانند batarangs و line-luncher استفاده کنند. همچنین یک وسیله‌ی جدید به نام voice synthesizer به گجت های بتمن اضافه شده که بتمن به وسیله آن می‌تواند صدای دشمنانش را تقلید کند و به افراد آن‌ها دستورهای دروغین بدهد.

توانایی‌های مبارزات تک به تک بتمن هم در این بازی گستردش یافته است. برای وارد کردن خسارت بیشتر به حریفان بتمن می‌تواند آن‌ها را به اطراف پرتاب کند، اما قدرت و پیچیدگی حمله حریفان نیز در این بازی افزایش یافته است. در این نسخه قابلیت جدیدی بنام " fear takedown" معرفی می‌شود که بتمن (قبل از اینکه توسط حریفان شناسایی شود) می‌تواند تا حداکثر پنج دشمن را هم‌زمان (زمان در این حرکت آهسته می‌شود) نابود کند.

موتور بسیار محبوب این بازی یکی از بروزترین نسخه‌های Unreal Engine است که طیف وسیعی از قابلیت‌های متعدد واقع‌گرایانه DirectX 11 و فناوری‌های اختصاصی GAMEWORK کمپانی Nvidia در آن پیاده سازی شده است. البته در این تست به دلیل همسان سازی جزئیات گرافیکی میان کارت‌های گرافیک ساخت کمپانی‌های AMD و NVIDIA تنظیمات مربوط به NVIDIA GAMEWORK غیر فعال شده‌اند.

تست گیمینگ - (Battlefield Hardline (DirectX 11

(Battlefield Hardline (DirectX 11

نسخه‌ی جدید بازی با عنوان Hardline به درگیری‌های درون شهری میان دو گروه خلاف‌کار و نیروهای ویژه‌ی پلیس می‌پردازد. بدون شک انتخاب قالب بازی از طرف استودیوی در نظر گرفته شده برای ساخت نسخه‌ی جدید بسیار هوشمندانه و نوآورانه به نظر می‌رسد. استودیوی کار کشته‌ی Visceral Games که همگان آن را با عنوان فوق‌العاده Dead Space می‌شناسند این بار بر خلاف همیشه که DICE ساخت بازی را بر عهده داشت، وظیفه‌ی به ارمغان آوردن یک میدان نبرد داغ دیگر را بر دوش می‌کشد.

در بخش تک نفره شاید یک بخش داستانی هستیم. همه چیز حول محور یک پلیس به اسم Nick Mendoza می‌چرخد. نیک یک افسر نیرو SWAT می‌باشد که درگیر مأموریت‌های جنایی و تعقیب گریز می‌باشد که می‌تواند از راه‌های مختلف اهداف خود را دنبال کرده که این حالت می‌توانید به‌صورت مخفی باید یا خشونت کامل! در این قسمت ابزار جدیدی در اختیار بازی باز قرار گرفته که یکی Police Scanner در بازی معرفی شده است. Police Scanner می‌تواند افراد مظنون را پیدا کند و اشیا و شواهد مهم را علامت گذاری کنید. این اطلاعات بخشی از قسمت تک نفره Hardline هست. ولی همیشه بخش چندنفره Battlefield قسمت مهم این سری را تشکیل می‌دهد و بخش داستانی زیر سایه چندنفره قرار دارد. باید دید با وجود جزئیات جدید بخش تک نفره تا چه حد می‌تواند موفق باشد. گیم پلی بازی کمی فرق کرده و حالا نوع جدیدی را به نمایش می‌گذارد و تمرکز عمده بازی مبارزه پلیس با دزدها یا همان جنایت کارها می‌باشد. چیزی که در Hardline می‌بینید جناح پلیس در برابر گروهی از افراد خلاف کار در آمریکا هست. در بازی به کلی آیتم و وسیله دسترسی دارید که می‌توانید از آن برای مبارزه استفاده کنید و همین‌طور از بالای به ساختمان به قسمت دیگر ساختمان با زیپ لاین عبور کنید. تخریب هم در این شماره حضور دارد و می‌توانید از آن به نفع خود استفاده کنید و مرکز لس انجلس را با خاک یکسان کنید.

نسخه جدید این بازی با حفظ تمامی ویژگی‌های نسخه قبل با استفاده از جدیدترین نسخه موتور گرافیکی Frostbite 3 جدیدترین ویژگی‌های واقع‌گرایانه گرافیکی مبتنی بر DirectX 11 نظیر Tessellation و قدرت تفکیک‌پذیری بیشتر بافت‌ها را همراه خود دارد.

تست گیمینگ - (Call of Duty Black Ops III (DirectX 11

(Call of Duty Black Ops III (DirectX 11

در این شکی نیست که سری بازی‌های ندای وظیفه بدون شک یکی از محبوب‌ترین بازی‌های حال حاضر ژانر شوتر اول‌شخص محسوب می‌شوند. جدیدترین نسخه این بازی یعنی BO3 چهل سال بعد از BO2 اتفاق می‌افتد و در این بین شما شاهد این هستید که روبات‌های کوچکِ نسخه‌ی قبلی، تبدیل به چه هیولاهایی شده‌اند! گیم‌پلی بازی به لطف سیستم پریدن‌های AW بی‌شباهت به عناوین تخیلی همانند Crysis نیست و البته بسیار سریع‌تر هم شده است. در طول نمایش‌های بازی شاهد چیزهایی هستید که در نسخه‌های قبلی هم بودند اما در اینجا به شکل متفاوت‌تری گنجانده شده‌اند. همانند مبارزه در زیر آب که مشابه آن در CoD: Ghosts هم وجود داشت و در اینجا هم شما باید به دشمنانی که در مسیرتان در آب قرار می‌گیرند، تیراندازی کنید! همچنین تریارک سعی کرده که گیم‌پلی بازی دارای تخریب پذیری قابل‌توجهی باشد و در تریلرها شاهد ریزش ساختمان‌ها براثر جنگ هستیم. تغییرات عمده‌ای در سلاح‌های بازی حاصل شده و شما حتی می‌توانید از دست خود به عنوان یک سلاح گرم استفاده کنید و به‌وسیله‌ی آن دشمنان را آتش بزنید! با این اوصاف می‌توان گفت که شرایط گیم‌پلی بازی دیگر همانند قبل نیست و شما رسماً با یک بازیِ علمی تخیلی که بسیاری از تکنولوژی‌های نظامیِ آن فعلاً به شکل گسترده کار گرفته نشده، مواجه خواهید شد. موتور گرافیکی این بازی نیز مثل نسخه‌های قبل همان IW Engine کهن سال است. یکی از نقاط ضعف این موتور حجم بافت‌های افسارگسیخته آن است که حتی کارت‌های گرافیک با 4GB حافظه اختصاصی را نیز در رزولوشن‌های بالا به چالش می‌کشد!

 

تست گیمینگ - (The Witcher 3: Wild Hunt (DirectX 11

(The Witcher 3 Wild Hunt (DirectX 11

شرکت‌های لهستانی امروزه بیش از قبل در صنعت بازی سازی مطرح هستند و شرکت CDPR پرچم دار آن‌هاست. تنها در طول چند سال باعرضه تعداد محدودی بازی این شرکت توانست در رده بزرگان قرار گیرد و توجه همگان را به خود جلب کرده است.

گیم پلی این نسخه برخلاف نسخه‌های قبل که برخی با آن مشکل داشتند این بار بدون شک یکی از نقاط قوت اصلی این بازی محسوب می‌شود و سازندگان بر روی گسترش دنیای بازی تمرکز داشته‌اند و به بازیکن امکان انجام فعالیت‌های متنوعی نظیر سوارکاری، شنا و قایق رانی داده شده و این بار بازیکنان می‌توانند بیش از قبل در نقش یک Witcher به نقش آفرینی بپردازند آن هم با شکار موجودات متنوع در دنیایی وسیع. مکانیک‌های نبرد در این سری از بازی‌ها همیشه با انتقادهای مختلفی همراه بوده اما این بار سازندگان تمام تلاش خود را برای روان سازی نبردها کرده‌اند و جزئیات مختلف این تجربه را شیرین کرده است به‌طور مثال Geralt به‌طور خودکار سلاح مورد نیاز برای مبارزه‌اش را انتخاب می‌کند و شما حتی می‌توانید تیرهای دشمنان را با شمشیر خود دفع کنید البته با افزایش قدرت و مهارت که تنها محدود به این کار نیست. همچنین در این نسخه امکان نبرد بر روی اسب نیز مهیا شده است و اسب شما نیز همانند شخصیت اصلی ابزارهای خود را دارد. به‌طور مثال شما می‌توانید زین بهتری برای اسبتان تهیه کنید تا هنگامی که با سرعت در حال سوارکاری هستید دیرتر خسته شود یا مثلاً با یک چشم بند می‌توانید باعث شوید اسبتان دیرتر از صحنه‌های نبرد به خاطر ترسش بگریزد.

به لطف موتور گرافیکی REDEngine 3 این بازی از تمام قوای پردازنده‌های چند هسته‌ای استفاده می‌کند و شما در صورتی که به دنبال نرخ فریم بالا هستید، باید تنها نگران کارت گرافیک خود باشید.

 

 

 

 

 

تست گیمینگ - (Sniper Elite III (DirectX 11

 (Sniper Elite III (DirectX 11

نسخه‌ی سوم این سری سعی دارد از کلیشه‌های معمول فاصله بگیرد و برای تحقق این نکته سازندگان دست به یک ریسک بزرگ زده‌اند و لوکیشن اصلی بازی را از خیابان‌ها و ساختمان‌های ویران اروپا به صحرای گرم و سوزان آفریقا تغییر داده‌اند. بازی در بازه‌ی زمانی سال ۱۹۴۰ تا ۱۹۴۳ میلادی جریان دارد، جایی که شعله‌های آتش این جنگ ویران‌کننده به آفریقا نیز رسیده است و این قاره را نیز در کام آتش خود فرو برده است. گیمر در نقش یک تک تیرانداز قرار می‌گیرد که عضوی از نیروهای متفقین می‌باشد. دلیل انتخاب تک تیراندازی از نیروهای متفقین این بوده است که اولاً تک تیراندازها در نیروهای متفقین نقش بسیار مهمی ایفا می‌کردند و در بسیاری از  مأموریت‌ها نقشی کلیدی دارا بودند و از سوی دیگر شمال آفریقا تحت نفوذ نازی‌ها می‌باشد و ساده‌ترین راه برای ورود به مناطق آن‌ها از طریق  استتار و مخفی کاری است که این کار تنها از سوی یک تک تیرانداز قابل انجام می‌باشد. شخصیت اصلی بازی فردی به نام Karl Fairburne می‌باشد که از تک تیراندازان زبده‌ی نیروی OSS به شمار می‌آید. محیط بازی با توجه به فضای آفریقا طراحی شده است و با توجه به اینکه مناطق شمالی قاره‌ی آفریقا دارای رشته‌کوه‌هایی می‌باشند در بازی نیز شاهد تپه‌ها و کوه‌های بلندی هستیم که فضای مناسبی برای یک تک تیرانداز است.

این بازی که در ژانر شوتر سوم شخص طبقه‌بندی می‌شود همانند نسخه قبل از موتور Asura ساخت کمپانی Rebellion بهره می‌برد. این بازی پرطرفدار در 27 جون 2014 برای PC و کنسول‌های XBOX و PS4 منتشر شده است.

 

 

تست گیمینگ - (Crysis 3 (DirectX 11

(Crysis 3 (DirectX 11

سومین نسخه از شاهکار استودیو بازی سازی Crytek بدون شک یکی از واقع‌گرایانه‌ترین و گرافیکی‌ترین گیم هایی است که تاکنون منتشر شده است. این بازی به لطف موتور گرافیکی Cry Engine 3.0 و پشتیبانی کامل از تمامی ویژگی‌های جدید Direct X 11 مانند Tessellation، Real -Time Area Light و کیفیت بسیار بالای بافت‌ها بدون شک هر بیننده‌ای را متحیر می‌کند. تمامی این ویژگی‌ها باعث شده تا تنها با استفاده از کارت‌های گرافیک High-End بتوان اجرای این بازی را در بالاترین جزئیات گرافیکی و قدرت تفکیک‌پذیری بالا تجربه کرد.

 

 

 

 

تست گیمینگ - (GRID 2 (DirectX 11

(GRID 2 (DirectX 11

این بازی بدون شک یکی از بهترین و موفق‌ترین بازی‌های Car Racing منتشر شده توسط کمپانی Codemasters  می‌باشد. این نسخه گرافیکی چشم گیری دارد. به‌طوری که نسخه یک خود را با تمام ضعف‌ها پشت سر گذاشته و گرافیک خود را آن‌قدر زیبا جلوه داده که حتی در مقابل نسخه اول هزاران برابر بهتر است. تمام محیط‌های مسابقه از شهرها و جاده‌های خاکی گرفته تا پیست‌ها از جزئیات خوبی برخوردار هستند. هنگام مسابقه از زمین در جاده‌های خاکی گرد و خاک بلند می‌شود. آسمان هم برخلاف نسخه قبل پویا و دینامیک است. این همه زیبایی با موتور اختصاصی Codemasters یعنی  Ego و مبتنی بر ویژگی‌های جدید گرافیکی DirectX 11 ساخته شده است.

 

 

 

 

تست گیمینگ - (Dirt Rally (DirectX 11

(Dirt Rally (DirectX 11

بازی کامپیوتر DiRT Rally یکی از بازی‌های سبک شبیه ساز و ورزشی است که توسط Codemasters Racing Studio طراحی و ساخته شده و توسط کمپانی Codemasters برای پلتفرم PC به بازار عرضه شده است. به جهان DiRT Rally خوش آمدید، دنیایی در بیابان‌های سوزان. این نسخه که به‌تازگی و زورتر از موعد مقرر در دسترس گیمرها قرار گرفته است، موتورهای جدید، مکان‌های جدید، حالت‌های جدید بازی و وسایل نقلیه جدید را شامل می‌شود و طبق گفته سازندگان بازی قرار است به‌طور منظم به‌روزرسانی شود. در این نسخه تمامی مهارت‌های شما در رانندگی به چالش کشیده خواهد شد و مورد آزمون قرار خواهد گرفت. در طول مسیرهای پر پیچ و خم و خطرناک به‌شدت مراقب سرعت خود باشید زیرا یک اشتباه ضررهای جبران ناپذیری به بار خواهد آورد. اگر تا پایان مسیر بتوانید بدون برخورد به‌جایی به خط پایان برسید، پاداش قابل توجهی دریافت خواهید کرد. در هر مرحله تست جداگانه از شما گرفته خواهد شد، به‌طوری که تفاوت سطوح مسابقات را به‌خوبی درک کرده و در پایان مراحل به آن‌چنان مهارتی رسیده‌اید که می‌توانید در طیف گسترده‌ای از انواع آب و هوا به‌راحتی به رانندگی خود ادامه دهید. پس از پایان هر مرحله، وسیله نقلیه شما نیاز به رسیدگی دارد و اگر به‌مرور توجهی به آن نشود، آسیب جدی به مکانیک ماشین وارد خواهد شد. گرافیک خیره کننده، تجربه 3 منطقه جدید، 36 مرحله چالش برانگیز، رانندگی در طول روز و در شرایط جوی خشک، ابری، آفتابی، مرطوب، بارانی و برفی و در طول شب، گذشت از شهرهای ولز و مونت‌کارلو، بیش از 20 مدل مختلف از ماشین‌های کلاسیک، تغییر فیزیک رانندگی و بهبود گیم پلی، امکان استخدام چهار مهندس برای کار بر روی وسیله نقلیه و مناظر چشم‌نواز در کنار موسیقی متن گوش‌نواز تنها بخشی از ویژگی‌های منحصر به فرد این بازی است.

این بازی نیز مثل نسخه‌های قبلی آن از موتور اختصاصی کمپانی Codemasters یعنی EGO Engine استفاده می‌کند. بدون شک عملکرد فوق‌العاده کارآمد این موتور در عنوان‌هایی نظیر F1 و DRIT نیز بارها در عمل ثابت شده است.

 

 

 

 

این بازی از جمله عناوینی است که تکنیک‌های فشرده سازی رنگ معماری Pascal به‌خصوص در رزولوشن UHD و تکنیک 8X MSAA که افزایش وصف ناپذیر حجم بافت‌ها را به دنبال دارد، به صورتی کاملاً محسوس نقش تعیین کننده‌ای در افزایش کارایی دارد.

تست گیمینگ - (Unigine Heaven v4.0 (DirectX 11

(Unigine Heaven v4.0 (DirectX 11

بنچ مارک Unigine Heaven v4.0 آخرین نسخه از این نرم‌افزار محسوب می‌شود که بر پایه موتور UNIGINE Engine یکی از بهترین و معتبرترین تست‌های مبتنی بر DirectX 11 محسوب می‌شود. محیط گرافیکی بنچ مارک دهکده‌ای جادویی را شبیه‌سازی می‌کند که در آن انواع و اقسام بافت‌ها مشاهده می‌شوند. از جمله ویژگی‌های گرافیکی این بنچ مارک می‌توان به hardware tessellation،global illumination و screen-space ambient occlusion اشاره کرد.

 

 

 

 

تست گیمینگ - (Unigine Valley Benchmark 1.0 (DirectX 11

(Unigine Valley Benchmark 1.0 (DirectX 11

نسخه Valley که جدیدترین بنچ مارک این کمپانی محسوب می‌شود در فضایی کاملاً متفاوت نسبت به نسخه قبل دنبال می‌شود. رندر تصاویر بسیار بدیع و زیبا از طبیعت سبز و کوهستان دست نخورده در کنار تکنولوژی‌های واقع‌گرایانه نظیر dynamic sky، volumetric clouds، sun shafts، Depth Of Field و ambient occlusion در کنار قابلیت dynamic weather این بنچ مارک را به یکی از مدرن‌ترین‌های حال حاضر مبدل کرده است.

 

 

 

 

تست اورکلاکینگ به کمک نرم افزار GIGABYTE XTREME Engine

تست اورکلاکینگ به کمک نرم افزار GIGABYTE XTREME Engine

نوبتی هم باشد نوبت تست هیجان انگیز اورکلاکینگ است. برای این منظور از آخرین نسخه نرم افزار مخصوص اورکلاک کارت گرافیک انحصاری کمپانی GIGABYTE یعنی XTREME Engine کمک گرفتیم.

 این نرم افزار که به تازگی جایگزین OC GURU II شده است چه از نظر ظاهری و چه از حیث امکانات و قابلیت‌ها به مراتب بهتر، پایدارتر و حرفه‌ای‌تر به نظر می‌رسد. امکانات این نرم افزار در 4 تب مختلف طبقه بندی می‌شود که در تب OC امکان تنظیم و مانیتورینگ تمامی پارامترهای مورد نیاز جهت اورکلاک فراهم شده است. همچنین این امکان فراهم شده تا برای وضعیت‌های مختلف چند پروفایل با مقادیر مختلف تنظیم و در کوتاه‌ترین زمان ممکن آن‌ها را فراخوانی کرد.

 در تب Advanced OC برای این کارت گرافیک 3 پروفایل مختلف OC Mode، Gaming Mode و ECO Mode در نظر گرفته شده است که هر یک دارای تنظیمات منحصر به فرد برای پارامترهای فرکانس، ولتاژ و پروفایل سرعت چرخش فن هستند. لازم به ذکر است برای این مدل در حالت پیش فرض پروفایل GAMING Mode فعال شده است. همچنین به دلیل پیچیدگی عملکرد تکنولوژی GPU Boost 3.0 در حالت Advanced Settings این قابلیت فراهم شده تا فرآیند اورکلاک به سه روش مختلف Clock Offset، تنظیم حداقل و حداکثر فرکانس هسته GPU در یک نمودار خطی و همچنین به‌صورت کاملاً دستی انجام شود.

 در تب FAN نیز دوباره 3 پروفایل آماده برای تنظیم سرعت چرخش فن در نظر گرفته شده است. علاوه بر این در حالت پیشرفته نیز این امکان فراهم شده تا کاربر طبق سلیقه و حساسیت‌های خود سرعت چرخش فن را تعیین کند.

 

در تصویر بالا نیز بخشی از امکانات مانیتورینگ این نرم افزار را مشاهده می‌کنید.

اما ما قصد داشتیم تا حداکثر پتانسیل اورکلاکینگ این کارت گرافیک را محک بزنیم. به همین منظور حدوداً 1 ساعتی به تست و تغییر پارامترهای مختلف فرکانسی، ولتاژی، سرعت چرخش فن و البته کم کردن تأثیر محدود کننده توان مصرفی پرداختیم.

 برای این منظور ابتدا ولتاژ هسته GPU را بر روی حداکثر مقدار ممکن تنظیم کردیم. سپس محدود کننده توان را نیز تا حداقل مقدار ممکن (111%) کاهش و محدودیت‌های حرارتی را نیز تا 9 درجه سانتی‌گراد افزایش دادیم. در این وضعیت همان‌طور که ملاحظه می‌کنید در فرکانس توربو 1925MHz برای هسته GPU و 9376MHz برای حافظه‌های GDDR5 به مرز ناپایداری رسیدیم. این یعنی حدود 15 درصد اورکلاک هسته GPU و 17 درصد اورکلاک حافظه نسبت به فرکانس مدل مرجع که نتیجه بسیار خوبی محسوب می‌شود.

 

 

 البته همان‌طور که در تصویر بالا ملاحظه می‌کنید در این وضعیت حداکثر فرکانس Boost از 1949MHz به مرز 2113MHz نیز رسیده است. همچنین در نمودارهای زیر می‌توانید دمای GPU، نویز صوتی فن و توان مصرفی کل سیستم را در این وضعیت مشاهده کنید.

 

 

 در این حالت حداکثر سرعت چرخش فن‌ها از 2760RPM به 2931RPM رسیده و این میزان افزایش سرعت چرخش فن‌ها حداکثر 1dB به نویز صوتی آن‌ها افزوده است. البته کم کردن محدودیت توان مصرفی این کارت نیز در عمل محدودیت‌های حرارتی پیش فرض تعیین شده را نیز کمتر کرده و حداکثر دمای هسته GPU به 75 درجه سانتی‌گراد رسیده است. هم چنین در این حالت توان مصرفی کل سیستم نیز تا 313W افزایش یافته است که طبق محاسبات ما توان مصرفی این کارت گرافیک در وضعیت فوق حدود 215W الی 220W است.

همچنین در تست‌های زیر نیز می‌توانید کارایی گیمینگ این کارت گرافیک را در چند تست مختلف مشاهده کنید:

 

 

جمع بندی، سخن پایانی و امتیاز شهر سخت افزار

جمع بندی، سخن پایانی و امتیاز شهر سخت افزار

بدون شک پردازنده‌های گرافیکی (GPU) مبتنی بر معماری Nvidia Pascal کارآمدترین و در عین حال قدرتمندترین تراشه‌های گرافیکی حال حاضر می‌باشند. همان‌طور که در تست‌های حرارتی، توان مصرفی و اغلب تست‌های کارایی مشاهده کردید عملکرد بعضاً حیرت انگیز این تراشه‌های گرافیکی مدرن و پربازده (از حیث کارایی نسبت به مصرف انرژی) جای هیچ بحث و حاشیه‌ای را باقی نمی‌گذارد. ولی از سوی دیگر بر روی ضعف آن‌ها نیز در گیم های مبتنی بر DirectX 12 و عملکرد ناکارآمد در پردازش داده‌های ناهم‌زمان (Async Compute) نیز نمی‌توان سرپوش گذاشت. البته این در حالی است که در اکثر مواقع این تراشه‌ها آن‌قدر قدرتمند هستند که حتی با وجود عملکرد ناکارآمد آن‌ها در وضعیت‌های نام برده باز هم در اکثر مواقع بهتر از قدرتمندترین تراشه‌های کمپانی رقیب عمل می‌کنند. همچنین اگر کاربردهای شما به‌گونه‌ای است که محاسبات GPGPU و به‌خصوص نوع FP64 یا Double-precision آن نقش تعیین کننده‌ای را بازی می‌کنند اکیداً به شما توصیه می‌کنیم که به هیچ وجه به سراغ کارت‌های گرافیکی مجهز به تراشه‌های گرافیکی GP104 و ضعیف‌تر، با معماری Pascal نروید.

 

اما اگر با دیدی کلی به GIGABYTE GeForce GTX 1070 G1 Gaming بنگریم با توجه به رنج قیمت، کارایی و قابلیت‌های این کارت گرافیک 420 دلاری می‌توان نمره خوبی برای آن در نظر گرفت. از طرفی عملکرد بسیار خوب این مدل در تست‌های کارایی و مخصوصاً اورکلاکینگ را شاید بتوان پوششی برای کم رنگ کردن نقطه ضعف آن در تست‌های مدیریت مصرف انرژی به حساب آورد. از سوی دیگر قابلیت‌های کم نظیر دیگر این کارت گرافیک نیز نظیر نورپردازی RGB LED همراه با جلوه‌های جدید و بی‌نظیر و تجهیز آن به جدیدترین نسخه 3 فن کولر WINDFORCE 3X نیز بیش از پیش به ارزش‌های GIGABYTE GeForce GTX 1070 G1 Gaming افزوده است.

 

اما به‌عنوان سخن پایانی GIGABYTE GeForce GTX 1070 G1 Gaming در مقایسه با مدل‌های مشابه موجود در بازار بهترین نیست ولی با توجه رنج قیمت، کیفیت ساخت، کارایی و البته اعتبار برند گیگابایت و خدمات پس از فروش باسابقه درخشان آن در کشورمان یکی از گزینه‌های خرید موفق محسوب می‌شود.

نقاط قوت

  • نورپردازی با جلوه‌های کم نظیر
  • کارکرد خنک و در عین حال کم‌صدا
  • همراه داشتن 8GB حافظه گرافیکی
  • پشتیبانی از خروجی تصویر HDMI 2.0 و DisplayPort 1.4

 
نقاط ضعف

  • خروجی تصویر DVI-D این کارت گرافیک فاقد سیگنال آنالوگ (VGA) است
  • عملکرد GPGPU به‌خصوص در پردازش اطلاعات به‌صورت Double-precision ناامید کننده است
  • عملکرد نه چندان خوب در تست‌های مدیریت مصرف انرژی

GIGABYTE GEFORCE GTX 1070 G1 GAMING 8GB

کلاس عرضه : گران قیمت / رده بالا
9
بسته‌بندی
8.5
کارایی
9
کیفیت ساخت و طراحی
9
اورکلاکینگ
9
امکانات و سازگاری
9
ارزش خرید
8.9
امتیاز شهرسخت‌افزار
نشان شهرسخت‌افزار
8.9

با تمامی این تفاسیر کارت گرافیک " GIGABYTE GeForce GTX 1070 G1 Gaming " موفق به کسب امتیاز 8.9، نشان "Gamer’s Choice" و ریز امتیازات زیر در کلاس محصولات (H (High-End از لابراتوار شهر سخت‌افزار شد.

نکته مهم: تمامی مراحل نگارش این بررسی اعم از تست ها، عکس ها، ویدئوها، نمودارها و تحلیل ها همگی در لابراتوار تخصصی شهرسخت افزار انجام شده است. این بررسی هیچ منبع داخلی و خارجی ندارد.

در صفحه بعد نیز می‌توانید گالری کاملی از تصاویر مربوط به این محصول را ببینید.

گالری تصاویر

گالری تصاویر

 

نظر خود را اضافه کنید.

ارسال نظر بدون عضویت در سایت

0

نظرات (10)

  • مهمان - محسن

    با تشکر از زحمات شما،لطفا بررسی تخصصی کارت گرافیک Zotac GTX 1070 AMP! extreme Edition 8GB رو هم در نظر داشته باشید.

  • سلام
    منم بهات موافقم مهدی.دمت گرم با این حرفت.

  • مهمان - ali

    قیمت کارت گرافیک برای امسال بنده خیلی بالاست باید یکسالی صبر کنیم بلکه کمی پایین بیاد

  • سلام من میخواستم سیستممو به نسل جدید ارتقا بدم ولی بودجم کافی نیست
    اول میخوام گرافیک بگیرم مرحله بعد مادربرد و cpu و ram
    حالا سوال اینجاست گرافیک 1060 با مادربرد asus p5p43td همخوانی داره؟ مرسی

  • هی دوران خاتمی ....
    دلار چند بود
    اگه دلار همون بود الان یه 1080 داشتیم !!!!!!!!!
    خدا باعث و بانیش رو لعنت کنه

  • مهمان - ارشیا

    در پاسخ به: مهدی

    حرف دلم رو زدی داداش.

  • مهمان - Yousef

    بسیار عالی بود
    ولی مدل asus strix بهتر بود با مدل gigabyte xtreme مقایسه بشه

  • سلام مهدی جان
    خسته نباشید . بسیار عالی

  • مهمان - ali

    سلام
    asus Geforce GTX 1070 STRIX GAMING OC
    بهتره یا این کارت گرافیک؟؟؟

  • در پاسخ به: مهمان - ali

    سلام gigabyte g1 قویتره

ورود به شهرسخت‌افزار

ثبت نام در شهر سخت افزار
ورود به شهر سخت افزار

ثبت نام در شهر سخت افزار

نام و نام خانوادگی(*)
لطفا نام خود را وارد کنید

ایمیل(*)
لطفا ایمیل خود را به درستی وارد کنید

رمز عبور(*)
لطفا رمز عبور خود را وارد کنید

شماره موبایل
Invalid Input

جزو کدام دسته از اشخاص هستید؟(*)

لطفا یکی از موارد را انتخاب کنید