برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
در چند ماه گذشته خبر های مختلفی در مورد این کارت به بیرون درز کرد که بعضی از آنها خوب و امیدوار کننده و برخی دیگر نا امید کننده بودند. همانطور که گفته شد انویدیا کاملا دیر تولید چیپ های مبتنی بر DirectX 11 را آغاز کرد و در همین فرصت رقیب Nvidia یعنی ATI توانست گزینه های زیادی از قدرت و قیمت را در اختیار کاربران بگذارد که از 100 دلار تا 700 دلار متغیر بود. شاید انویدیا در عرضه کارت های کلاس DX11 دیر کرده باشد، اما شروع این کار با به نمایش گذاشتن محصولاتی قدرتمند و سریع برای رقابت همراه بوده است. مدتی زیادی نیست که Nvidia رسما اقدام به پرده برداری از محصول جدیدش کرده، بنابراین ما فرصت را غنیمت شمردیم تا به تست این کارت به همراه نسل های دیگر GeForce و سری 5800 و 5900 بپردازیم.
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
مشخصات:
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
در جدول بالا می توانید مشخصات هر دو چیپ GTX470 و GTX480 را مشاهده نمایید. هر دو چیپ دارای 4 کلاستر (گروه) پردازش گرافیکی است و تعداد پردازنده های جریانی چندگانه این کارت به ترتیب به 14 و 15 عدد می رسد. تعداد هسته های CUDA نیز به ترتیب به 448 و 480 عدد می رسد (CUDA نام واحد های پردازشی ای هستند که چندی پیش توسط Nvidia ابداع شدند و توانستند که جای پردازنده های جریانی را تا حد زیادی پر کنند) در این کارت ها به ترتیب 56 و 60 واحد پردازش متریال و تکسچر نیز قرار دارند. با توجه به این اعداد و ارقام، کارت GTX 480 از نظر عملکرد پردازشی نسبتا قوی تر از GTX470 می باشد. اما در مورد سرعت پردازش، فرکانس کل بخش پردازش گرافیکی چیپ GTX 480 برابر با 700 مگاهرتز می باشد و فرکانس هسته های CUDA برابر با 1401 مگاهرتز است. فرکانس واقعی حافظه برابر با 924 مگاهرتز است و فرکانس موثر آن به 3696 مگاهرتز می رسد.
حجم حافظه نیز برابر با 1536 مگا بایت و اینترفیس آن برابر با 384 بیت است که البته چیپ های قبلی از 448 بیت اینترفیس بهره می بردند. پهنای باند حافظه نیز به 177.4 گیگابایت در ثانیه می رسد این چیپ از طراحی 40 نانو متری بهره می برد.
پورت های خروجی پشتیبانی شده توسط این چیپ عبارتند از 2 پورت Dual-link DVI-I و یک پورت mini HDMI با این تفاسیر این کارت در بخش حافظه و پورت های خروجی ضعیف تر از کارت های رقیب شرکت ATI (سری 5800 و سری 5900) میباشد. کانکتور های این کارت کمی عجیب به نظر می رسند. اگر چه GTX 470 از دو کانکتور شش پین استفاده می کند اما GTX 480 از ترکیب نامتداول 1 کانکتور 8 پین و 1 کانکتور 6 پین بهره میبرد! آستانه دمای چیپ هم به 105 درجه سانتی گراد می رسد.
اما شرکت Nvidia از یک جهت توانسته اعداد و ارقام فرکانس حافظه را به ATI نزدیک تر کند و آن استفاده از حافظه های GDDR5 می باشد که پس از مدت زیادی انتظار، سرانجام از سوی Nvidia نیز به کار گرفته شد. اما اکنون وقت آن رسیده که به چند عکس از ظاهر این کارت (اولین کارت GTX 480 از سوی Nvidia) نگاهی بیاندازیم.
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
سیستم خنک سازی کارت به خوبی طراحی شده است و از Heat-pipeهای بزرگی برای دفع گرما بهره می برد.
- مشخصات معماری
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
این چیپ از معماری Fermi استفاده میکند. (Enrico Fermi نام یک فیزیک دان برجسته است که برای اولین بار موفق به کشف سلسله مراتبی هسته ای شد. او برنده جایزه نوبل فیزیک در سال 1938 می باشد) شاید Nvidia به این دلیل از نام Fermi استفاده کرده که چیپ هایش برای پردازش از سلسله مراتب خاصی استفاده می کنند به هر حال Nvidia معمولا نام های جالبی را برای فناوری های خود انتخاب می کند.
چیپ GTX 480 از بیش از 3 میلیارد ترانزیستور در قالب معماری 40 نانومتری سود میبرد. در حالی که رقیب اصلی این چیپ یعنی Radeon HD 5870 از حدود دو میلیارد و پانزده میلیون ترانزیستور استفاده میکند. معماری 40 نانومتری فِرمی توانسته این چیپ را به 480 CUDA Cores مجهز نماید. یعنی بیش از دوبرابر تعدادی که در سری GT200 استفاده می شد. این تعداد به GTX 480 کمک می کنند که با قدرت گرافیکی بسیار بیشتر خود در راس قوی ترین ها قرار گیرد!
همچنین، فِرمی اولین GPU با قابلیت پشتیبانی از ECC خواهد بود. ECC به GPU این امکان را میدهد که نرخ خطا های نرم افزاری (SER: Soft Error Rate) را با تصحیح کردن آنها کاهش دهد. این خطا ها باعث می شوند که قسمت مخصوص ثبت اطلاعات حاشیه ای مدار های مجتمع (IC) نسبتا بزرگ و با اهمیت، مشکلاتی به وجود آید که میتواند سرعت پردازش را کاهش دهد. پس استفاده از ECC باعث عملکرد و پایداری بهتر نیز می شود. همچنین این GPU کد های C++ را به طور مستقیم اجرا خواهد کرد.
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
به نظر میرسد Nvidia قصد دارد معماری Fermi GF100 را جایگزین نسل های قبلی معماری خود نماید. همانطور که در تصویر Diagram معماری GTX 480 مشاهده میکنید، در این چیپ 4 عدد GPC(Graphic processing Cluster) (گروه پردازش گرافیکی) قرار دارند و در این طراحی جدید هر GPC از چهار موتور پردازش اَشکال بهره می برد.
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
وجود این تعداد موتور در هر یک از بخش های این چیپ به GPC ها اجازه می دهد که هر یک به عنوان یک GPU (Graphic Processing Unit) کامل فعالیت کنند.
یعنی GTX 480 را می توان یک GPU چهار هسته ای نامید این طراحی همچنین باعث شده که GTX 480 بتواند هندسه اجسام را راحت تر از قبل پردازش کند و مقیاس پذیری آن در سرتاسر انجام عمل پردازش هندسه اجسام بیشتر شود.
بنابر ادعای Nvidia آخرین نتایج به دست آمده ، حکایت از این موضوع دارد که پردازش هندسه اجسام، در معماری Fermi GF100 ، نسبت به معماری GT200 ، 8 برابر بهبود یافته است . پردازش سگمنت ها نیز در این GPU نیز بهتر شده و مقیاس پذیری بالاتری دارد.
در هر GPU Fermi GF100 ظرفیت گنجاندن 512 CUDA Cores ، 16 واحد پردازش هندسه اجسام، 4 موتور موقعیت دهی تصویر (raster Engine) و پشتیبانی حافظه GDDR5 با اینترفیس 384 بیت نیز صورت می گیرد. با این حال در GTX 480 فقط 480 CUDA Cores وجود دارد ولی بقیه مشخصات دقیقا همان چیزی است که در بالا ذکر شده.
سوالی که در ذهن بعضی پیش می آید این است که چرا GTX 480 از اینترفیس حافظه 384 بیتی استفاده میکند، درحالی که سری GT200 از اینترفیس 448 بیتی بهره مند بودند؟ در پاسخ باید گفت که با توجه به حافظه GDDR 5 این کارت، مقدار موثر (Effective) فرکانس حافظه و پهنای باند بسیار بیشتر شده است و عملا نیازی به استفاده از اینترفیس 448 بیتی احساس نمی شود.
هر موتور SM(Streaming Multiprocessor) از بخش هایی که در تصویر می بینید تشکیل شده است:
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
در هر SM ، 32 عدد CUDA Core وجود دارد که از این قسمت ها تشکیل شده است:
اطلاعات وارد حافظه نهان دستورالعمل ها می شوند و سپس در بخش Warp Scheduler، زمان بندی مشخصی برای هر یک از اجزای پردازشی صورت می گیرد. در ادامه اطلاعات وارد Dispatch Unit می شوند و عملکرد هر یک از اجزا تعیین می شود و سپس یک فایل اطلاعات مورد نیاز برای پردازش را در خود نگه می دارد و آنها را به CUDA Coreها اعمال می کند. اطلاعات در CUDA Coreها، ابتدا وارد Dispatch Port می شود و بدین وسیله عملی که از CUDA Core می خواهیم مشخص می شود سپس عملوندها (تعیین کننده های روش عملکرد CUDA Core) جمع آوری می شوند و پس از پردازش اطلاعات، هر هسته CUDA نتیجه عملکرد خود و همچنین اعمالی که برای ادامه ی فرایند پردازش باید اجرا شوند را به CUDA Core بعدی اطلاع می دهد و این فرایند تا پردازش کامل ادامه می یابد.
همزمان با این عملیات موتور پردازش اشکال (Polymorph Engine)، اطلاعات مربوط به شکل و هندسه جسم را پردازش می کند. برای این کار ابتدا راس ها را مشخص می کند سپس توسط Tessellator فواصل بین راس ها را پر می کند. در قسمت Viewport Transform اندازه اجسام و جای آنها روی صفحه تعیین می شود. در Attribute Setup، ویژگی های خاص اجسام پردازش شده، تنظیم می شوند و سپس در قسمت Stream Output، اطلاعات اجسام پردازش شده خارج می شوند.
اطلاعات پردازش شده در CUDA Coreها و Polymorph Engine در قسمت Interconnect Network (شبکه اتصالات داخلی) با یکدیگر ادغام می شوند.
در جدول زیر مقدار Cache های به کار رفته در سری GT 200 و سری GF 100 با یکدیگر مقایسه شده اند:
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
میزان Cache L2 در این چیپ بسیار بیشتر از سری GT200 میباشد و این مزیت امکان پوشش دادن سطح وسیع تری از تکسچرها و پردازش راحت تر و قوی تر را به GTX480 می دهد.
در تصویر زیر می توانید مراحل کار Raster Engine و Poly Morph Engine را مشاهده کنید:
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
وظیفه Raster Engine تنظیم اندازه و کیفیت اجسام پردازش شده و همچنین جایگاه آنها بر روی مونیتور است. بدین منظور ابتدا لبه های اجسام تنظیم می شوند، سپس Rasterizer مسئولیت اسکن خطی تصاویر را بر عهده می گیرد.
نحوه کار Polymorph Engine هم در بالا شرح داده شده است اما برای این که عمل Tessellation (در لغت به معنای موزاییک کاری است اما در این مورد وظیفه پر کردن فواصل بین راس ها را بر عهده دارد) را بهتر درک کنید، به عکس های زیر توجه نمایید:
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
در این تصاویر سطوح مختلف Tessellation دیده می شوند و تفاوت بسیار زیادی بین آنها وجود دارد. البته طبعا با بیشتر شدن جزئیات بار پردازش گرافیکی افزایش زیادی می یابد.
NVIDIA چند دموی جالب از فعالیت های مختلف گرافیکی تهیه کرده که در زیر می توانید تصاویری از آنها مشاهده نمایید:
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
تصاویر بالا بهبود عملکرد معماری Fermi GF100 را نسبت به معماری های پیشین نشان می دهد. همچنین سیستم Anti-Aliasing در این معماری بهبود قابل توجهی داشته است. در مورد تصاویری که از دریا میبینید باید گفت که این کارت در تصویر با جزئیات کمتر 300 فریم و در تصویر با جزئیات بالا 150 فریم در ثانیه ارائه داده است.
ستمی که از سوی Nvidia برای رقابت با Eyefinity در نظر گرفته شده Multi-Panel Gaming Across نام دارد که از سه مانیتور به صورت همزمان پشتیبانی می کند و در نمایشگاه CES 2010 در Las Vegas از آن رونمایی شد. به هر حال فعلا Eyefinity قدرتمند تر است چون از 6 مانیتور هم پشتیبانی می کند!
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید






پاسخ با نقل قول
Bookmarks