درود.
در بخش قبل به بررسی نتایج قدرت پردازش FX-8150 در مقابل جمعی از پردازنده های سندی بریج،نهالم،K10 ...پرداختیم که تمرکز بر روی دو محیط Super pi و Wprime صورت گرفت و مجدد یادآوری میکنم که Superpi تنها از یک هسته پردازنده استفاده کرده و Wprime از تمامی هسته های پردازنده استفاده می کند.اما برنامه نویسی دو محیط نامبرده،مبتنی بر معماری مجموعه دستورات x86 می باشند و در حال حاضر از I-Set های جدید پردازنده همانند XOP،AVX،FMA4...استفاده نمی کنند.در نهایت، مقایسه ای بین ماژول های بولدوزر، نقش شش هسته فیزیکیphenom II X6 1100T و سیستم HyperThreading اینتل در پردازش برنامه های Multithread صورت گرفت.
در این بخش می خواهیم قدرت پردازش دو تراشه Zambezi FX-8150 و Deneb-phenom II X4 980 را به صورت کلاک به کلاک مقایسه نماییم.از این جهت،در ابتدا هر دو پردازنده بر روی فرکانس 3.7 گیگاهرتز و تایمینگ های حافظه یکسان ست شدند:
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
اما ویژگی های ذاتی پردازنده که جزئی از خاصیت معماری آنها به حساب می آید،به صورت پیشفرض رها گردید که یکی فرکانس پل شمالی 2200 مگاهرتزی FX-8150 در مقابل فرکانس پل شمالی 2000 مگاهرتزی Phenom II بوده و دیگری فرکانس 2600 مگاهرتزی Hyper Transport پردازنده FX-8150 در مقابل فرکانس 2000 مگاهرتزی HT پردازنده Phenom II می باشد.موضوع مهمتر که در بررسی کلاک به کلاک مورد توجه قرار می گیرید،تاکید بر یکسان بودن تعداد هسته های فیزیکی پردازنده می باشد و خاصیت ماژول های بولدوزر،کمی این آزمایش را با سختی مواجه می کند.در مرحله اول می بایست،تعداد هسته های فعال پردازنده FX-8150 به 4 عدد(یکسان با تعداد هسته های Phenom II X4 980) کاهش یابد و این امر در حال حاضر در بخش بایوس امکان پذیر نمی باشد و به اجبار در محیط سیستم عامل (win7 x64) صورت پذیرفته و جهت صحت هر چه بیشتر، آزمایش ها در دو مرحله صورت پذیرفت؛یکی زمانی که دو ماژول یا 4 هسته FX-8150 توسط تنظیمات بوت سیستم عامل غیر فعال گردید و دیگری زمانی که تنها یک هسته از هر ماژول برای هر یک از تست ها،از طریق processor affinity در TASK Manager غیر فعال گردید و در این حالت،هسته های شماره 0،2،4 و 6 در پردازش برنامه بنچمارک شرکت می کنند.(طبق گفته AMD،این شماره از هسته های هر ماژول،بازدهی بهینه ای را در پردازش به ارمغان می آوردند). در نهایت می توانیم با تلاش های صورت گرفته و مقایسه دو مرحله با یکدیگر،از این ازمایش Clock per Clock ،انتظار کمترین درصد خطا را داشته باشیم.
مرحله نخست:زمانی که 4 هسته پردازنده FX-8150 از طریق تنظیمات بوت سیستم عامل غیر فعال گشته است و متعاقبا در آغاز بوت و بالا آمدن سیستم عامل،تنها با 4 هسته پردازنده و یا تنها 2 ماژول فعال روبرو هستیم:
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
جهت تحلیل هرچه بهتر تست ها، محیط ها را به دو گروه Lower Is Better و Higher Is Better تقسیم می نماییم؛همچنین محیط های تست با توجه به نوع پردازش،در رنگ های مختلفی طبقه بندی شده اند:
Lower Is Better:،Lame Front-End،WinRAR،SuperPI،Wprime،Photoshop
Higher Is Better:Dirt3،Team Fortress2،X3:Terran Conflict،Pov-Ray،Cinebench،X264HD
همانطور که اشکار است در این مرحله،پردازنده Phenom II X4 980 در بیش از 90% موارد با اختلاف زیادی،رقیب خود را به زانو در آورده است!!!
تنها موردی که پردازنده FX-8150 توانسته عملکرد بهتری نشان دهد،برنامه Win-RAR 4.0.1 می باشد که برخی دوستان در این مورد دچار اشتباه و سردرگمی هایی شده اند و بنده دلیل این موضوع را در بخش قبل به وضوح شرح دادم که چرا FX-8150 در برخی موارد خاص،عملکرد بهتری از خود نشان می دهد:
و اکنون در تست WinRAR 4.0.1 به دلیل استفاده از اینستراکشن ست AESه( Advanced Encryption Standard) در فرایند 128 بیتی اریشو سازی ،توانسته است از قدرت معماری بولدوزر ،استفاده بهینه ای نمایید.( I-Set های برجسته بولدوزر شامل AES, AVX, FMA4, و XOP می باشد).سندی بریج اینتل فوق العاده قدرتمند تر از سیستم ماژول های بولدوزر عمل میکنه و AMD در پردازش Multithreading هیچ قدرتی در مقابل اینتل نداره. تست هایی که AMD بهتر عمل کرده بیشتر به نوع الگوریتم های ناب و بهینه سازی اینستراکشن ست های AMD اشاره میکنه تا قدرت پردازش که در پست های بعد به طور دقیق به اون ها می پردازیم.
معماری بولدوزر نه تنها در قدرت پردازش Clock per Clock و Multithreading نمی تواند با معماری سندی بریج مقابل کند بلکه حتی ضعیف تر از معماری نسل پیشین خود K10.5 ظاهر شده است و شاید بتوان معماری بولدوزر را یک نسخه تضعیف شده از پلتفرم 1156 اینتل به حساب آورد!
مرحله دوم:پردازنده FX-8150 در محیط سیستم عامل،با تمامی 8 هسته خود فعالیت می کند،اما هر یک از برنامه های به واسطه Task Manager و متد processor affinity ،فقط از 4 هسته پردازنده استفاده می کنند.هسته های درگیر پردازش،شامل هسته های 0،2،4،6 می باشند و در واقع از یک هسته، در هر ماژول برای پردازش بنچمارک استفاده گردید و این متد آزمایش،بهینه ترین حالت پردازش پردازنده های سری FX و معماری بولدوزر می باشد.(به دلیل کمترین تداخل و تاخیر دو هسته در یک ماژول برای دسترسی به منابع پردازنده،همانند حافظه کش داده ها،دستورات...)
برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید
در این دوره از آزمایش ها نیز با توجه به بهینه سازی پردازش هسته های FX-8150 و کاهش درصد خطا،همچنان شاهد ضعف غیر قابل انکار این پردازنده و معماری بولدوزر هستیم.شایان ذکر است که به دلیل عدم پذیرش پروسه WinRAR و DIRT 3 در غیر فعال سازی هسته های مورد نظر توسط Preocessor Affinity ،این دو ازمایش در این مرحله صورت نپذیرفت.
تحلیل و نتیجه گیری:همانطور که مشاهده فرمودید،در ازمایش کلاک به کلاک دو پردازنده Deneb-Phenom II X4 980 و Zambezi FX-8150 ،دو مرحله ازمایش در طیف وسیعی از برنامه صورت گرفت و جهت کاهش درصد خطا و اطمینان بیشتر،تنها یک هسته از هر ماژول بولدوزر درگیر پردازش شدند.اکنون می توان با قاطعیت اعلام نمود که در آزمایش پردازش کلاک به کلاک؛ بولدوزر در دوئل رو در رو معماری نسل قبل AMD،K10.5 به زانو در آمد.!
صرف نظر از مبحث Instruction Per Cycle، ضعف معماری بولدوزر را شاید بتوان در دو نقطه اصلی جستوجو کرد؛یکی تداخل هسته های هر ماژول برای دسترسی به منابع پردازنده و درنتیجه افزایش تاخیر در پردازش و دیگری تعداد بیش از حد مراحل Pipeline که هر داده تا پردازش کامل طی می کنید.اما قدرت بولدوزر را نیز نمی توان نادیده گرفت و آن، اینستراکش ست های فوق العاده بهینه و پرسرعت AES،AVX،FMA4 و XOP می باشد.اما متاسفانه اکثریت برنامه ها و نرم افزاری های کنونی از این مجموعه دستورات استفاده نمی کنند و درواقع برگ برنده بولدوزر،در بیش از 90% نرم افزار های کنونی باطل می باشد.اما در سال های آینده به دنبال اپگرید و توسعه نرم افزار ها در استفاده از Instruction Set های جدید،پردازنده های مبتنی بر معماری بولدوزر و نسل های بعد،عملکرد بهتری خواهند داشت. در هر صورت اگر AMD با چنین روندی در ارائه معماری های بعدی ظاهر گردد،برای سالیان دراز از کورس رقابت با کمپانی اینتل خارج خواهد شد.
در بخش های بعد،شاهد بررسی نتایج بنچمارک و تحلیل بولدوزر در ابعاد دیگر خواهیم بود.
_______________
تیم خبری شهر سخت افزار
Bookmarks