سرانجام با ورود GTX 680 انتظار به پایان رسید و وقت آن می رسد تا نگاهی مختصر و مفید به ابعاد گوناگون این محصول جدید و جذاب داشته باشیم.
معماری Kepler :
حدود یک سال پیش بود که انویدیا در کنفرانس های خبری ، دور نمایی از محصولات آینده خود را ترسیم کرد. در این دورنما ، تاکید اصلی بر روی افزایش کارایی به ازای هر وات مصرف انرژی الکتریکی بود ( Performance Per Watt ). در واقع این کمپانی ادعا کرد که تمرکز اصلی خود را بر روی ساخت چیپ هایی با بازدهی بالا( High Efficiency ) متمرکز کرده است.
فرمی ( Fermi ) نام معماری ای بود که در کارت های سری 400 و 500 انویدیا در طول سال های 2010 و 2011 از آن استفاده شد که به واسطه اعمال تغییرات ساختاری فراوان توانست موفقیت قابل توجهی را کسب کند. اما حال بعد از گذشت دو سال نوبت به معرفی یک معماری جدیدتر می رسد. همانطور که در پارگراف قبل اشاره شد ، انویدیا به دنبال بهینه سازی هرچه بیشتر محصولات خود می باشد که حاصل این تلاش ، معماری جدیدی به نام کپلر ( Kepler ) می باشد.
کلیه چیپ های مبتنی بر معماری کپلر با کدهای GK1xx رده بندی می شوند. در واقع هر کد نماینگر خصوصیات اصلی چیپ های مبتنی بر آن می باشد. به طور مثال یک چیپ گرافیکی با کد GK104 عمدتا برای گیمرها بهینه و طراحی شده است و در مبحث GPGPU عملکرد قابل چشمگیری ندارد ، اما چیپ GK110 دارای ساختار پیشرفته تری خواهد بود که هم در بخش گیم و هم در بخش GPGPU عملکرد بسیار مطلوبی را خواهد داشت.در همین راستا GTX 680 ، اولین محصول معرفی شده از سری GTX 6xx از یک چیپ گرافیکی با کد GK104 بهره می برد. احتمالا محصولات مبتنی بر چیپ قدرتمندتر GK110 همراه با سری جدید GTX 7xx معرفی و عرضه خواهند شد.
در ادامه این قسمت قصد داریم تا ساختار چیپ GK104 و بهبود های اصلی آن نسبت به چیپ های سابق فرمی را به طور مختصر بررسی کنیم:
چیپ های گرافیکی ( GPU ) به کار رفته در محصولات انویدیا ، از قسمت گوناگونی تشکیل شده اند که از این میان می توان به اجزایی مانند کنترلر حافظه (Memory Controller ) ، رابط PCI Express ، GigaThread Engine ، Raster Engine ، هسته های کودا ، حافظه های کش و ... اشاره کرد. برای درک بهبودهای ایجاد شده در معماری کپلر باید به درون واحدهای SMX ، جایی که هسته های کودا و اجزای مهم دیگری چون واحدهای Texture Mapping ، موتور مخصوص انجام پردازش های هندسی ( PolyMorph Engine یا Geometry Engine ) و Warp Scheduler قرار دارند ، سرک بکشیم.
در طراحی معماری کپلر، هدف اصلی انویدیا دو برابر کردن منابع اصلی چیپ گرافیکی ، نسبت به چیپ های مشابه فرمی می باشد. در اصل می توان گفت که کپلر چیزی جز یک فرمی بهبود داده شده نمی باشد. در این قسمت به منظور مقایسه ، چیپ به کار رفته در GTX 460 با کد GF104 ( مشابه GK104 ) مبتنی بر معماری فرمی را نظر می گیریم. در تصویر زیر اجزای اصلی به کار رفته به ازای هر واحد SM در دو چیپ GK104 و GF104 مقایسه شده است ( واحد SM در معماری کپلر به SMX تغییر نام داده است ) :
همانطور که مشاهده کردید ، به جز چند استثنا تمامیه منابع دو برابر شده اند که این موارد استثنا را بررسی خواهیم کرد:
یکی از این موارد هسته های کودا و واحدهای اجرایی ویژه ( Special Function Unit ) هستند. تعداد این هسته ها بر روی کاغذ 4 برابر شده است که علت آن حذف سرعت کلاک سایه زنی ( Shader Clock ) و یکسان شدن آن با سرعت کلاک چیپ گرافیکی می باشد. حتما به خاطر دارید که ما در محصولات قبلی انویدیا همواره با دو سرعت متفاوت برای چیپ گرافیکی مواجه می شدیم:
یکی سرعت Core Clock که تعیین کننده سرعت اجرایی اکثر قسمت های GPU بود و دیگری Shader Clock ( همواره دو برابر Core Clock ) که تنها ، تعیین کننده سرعت هسته های کودا و واحدهای Load/Store بود. حال ، انویدیا به منظور بهینه کردن چیپ های خود ، تصمیم بر آن گرفت تا سرعت کاری تمام قسمت های GPU را یکسان کند ، در واقع دیگر سرعت سایه زنی وجود ندارد و هسته های کودا در نصف سرعت لازم یعنی همان سرعت Core Clock عمل خواهند کرد. بدین ترتیب دو برابر کردن تعداد هسته های کودا تنها افت سرعت کلاک را جبران خواهد کرد و در قدم بعدی با دو برابر شدن مجدد این منابع ، هدف نهایی محقق می شود. به گفته انویدیا هر دو هسته کودای کپلر تنها 90% یک هسته کودای فرمی مصرف خواهند داشت ! که استفاده از تکنولوژی ساخت کوچکتر و پیشرفته تر28nm در این مورد بی تاثیر نیست.
اما مورد استثنای دیگر واحد PolyMorph Engine بوده که تعداد آن در مقایسه با فرمی هیچ تغییری نداشته است. انویدیا در جواب به این مورد هم اعمال بهبودهایی در عملکرد محاسباتی این واحد اعلام کرده است. در واقع در نسخه 2.0 این واحد ، سرعت پردازش های هندسی در هرکلاک تا دو برابر نسبت به قبل افزایش داده شده است.
هر دو واحد SMX به همراه یک عدد Raster Engine یک واحد GPC تشکیل می دهند و درنهایت یک چیپ کامل GK104 که شامل 1536 هسته کودا ، 128 واحد Texture Mapping و 32 واحد ROPs می شود. ساختار کنترلر حافظه نیز در مقایسه با GF104 تغییر بنیادین نداشته و از پهنای باند 256Bit بهره می برد. انویدیا به منظور دستیابی به سرعت حافظه ای مشابه GTX580 از چیپ هایی با سرعت موثر 6GHz استفاده کرد که سرعتی حافظه ای معادل 192GB/s را به ارمغان می آورد.
این موارد در کنار افزایش سرعت کلاک GPU تا 1006MHz و رساندن حداکثر توان مصرفی به 195 وات ، بهبود چشمگیر کارایی در کنار بازدهی بالا را بدنبال خواهد داشت.
در آخر کلیه اجزای GPU که شامل 3.5 میلیارد ترانزیستور می شود بر روی مساحتی به اندازه 294mm^2 ( در قیاس با مساحت 520mm^2 چیپ GTX 580 ) و به کمک تکنولوژی ساخت 28nm مجتمع شده است.






پاسخ با نقل قول
Bookmarks