K1LOU
12-11-09, 16:36
آیا پردازندهها نیازی به حافظه L3 Cache دارند؟
سرويس سختافزار- در پردازندههای جدید استفاده از حافظه اختصاصی پرسرعت برای پردازندههای چند هستهای رواج زيادي یافته که این حافظه به صورت اشتراکی برای تمامی هستهها در دسترس است. در این حالت حافظه پرسرعت لایه سوم میتواند سرعت دسترسی به اطلاعاتی که زیاد مورد استفاده پردازنده قرار میگیرند را افزایش دهد و هستهها مجبور به تبادل اطلاعات با حافظههای کندتر (همان حافظه اصلی RAM) نیستند.
تمامي این مطالب حداقل در حد یک تئوری مقبول اعتبار دارند. پردازندههای جدید Athlon II X4 تولید AMD که در واقع همان پردازندههای Phenom II X4 بدون حافظه L3 Cache به شمار ميروند به نوعی دلیلی بر عدم اهمیت حافظههای لایه سوم در همه موارد هستند.
برای اکتشاف میزان اهمیت حافظههای لایه سوم تصمیم گرفتيم این دو پردازنده را در موارد مختلف مقايسه كنيم، اما پيش از اینکه بخواهیم در نتایج به دست آمده دقیق شویم لازم است ابتدا نیمنگاهی به نحوه عملکرد حافظه Cache و برخی نکات ابتدایی داشته باشيم.
عملکرد کلی حافظه Cache بسیار ساده است، این حافظهها در حقیقت وظیفه همزمانسازی دسترسی به اطلاعات را بر عهده دارند و در نقش یک بافر، اطلاعات مورد نیاز را در خود نگهداری میکنند تا پردازنده نیازی به مراجعه به فواصل دورتر و منابع حافظه کندتر نداشته باشد. معماری رایانههای امروزی به شکلی است که پردازنده شامل سه مرحله حافظه Cache پیش از رسیدن و دسترسی به حافظه اصلی سیستم (RAM) است.
لایه دوم و به ويژه لایه سوم تنها به عنوان بافر ایفای نقش نمیکنند. آنها همچنین وظیفه جلوگیری از توقف عملکرد و تبادل داده پردازنده در زمان افزایش ترافیک تبادل اطلاعات و دادهها میان هستهها را بر عهده دارند.
اثربخشی حافظه Cache در کارکرد سیستم به میزان پاسخگوییهای موفق آن به درخواستها بستگی دارد، اگر به اطلاعاتی نیاز باشد که روی Cache وجود دارند این یک موفقیت برای حافظه به حساب میآید و اگر این دادهها روی این حافظه موجود نباشند سیستم به حافظههای ثانویه دیگر مراجعه میکند. مراجعه به این حافظهها و در واقع عدم موفقیت حافظه Cache سبب کندی پردازش ميشود، همانطور که موفقیت حافظه Cache قدرت و توان پردازش را افزایش میدهد.
میزان بیشتر حافظه Cache میتواند دادههای بیشتری را آماده پردازش (Buffer) کند، اما ظرفیت بیشتر حافظه با افزایش زمان تاخیر دسترسی به اطلاعات آن نیز همراه خواهد بود. از آنجایی که این حافظه میزان زیادی از ترانزیستورهای پردازنده را درگير ميكند، بنابراين بسیار مهم است که نسبت مناسبی میان اندازه ترانزیستورها، مصرف انرژی، توان پردازشی و میزان تاخیرها در این مورد برقرار باشد.
حافظههای لایه اول، دوم و سوم...
تمامی پردازندههای امروزی به حافظههای اختصاصی مجهز هستند. اين حافظهها اطلاعات و ساختار ضروری آنها جهت پردازش را در خود نگهداری میکنند. ابتداییترین نوع این حافظهها که حافظههای لایه اول یا L1 Cache نیز خطاب میشوند اولینبار در پردازندههای 486DX مشاهده شدند. در حال حاضر میزان حافظه استاندارد L1 Cache در پردازندههای AMD، 64 کیلوبایت حافظه L1 Cache برای هر هسته است در حالی که اینتل فقط از 32 کیلوبایت حافظه L1 Cache برای هر یک از هستهها بهره میگیرد.
حافظههای L1 Cache در پردازنده 468DX اینتل معرفی شدند و تا به امروز جزء لاینفک پردازندهها به شمار ميروند.
حافظههای لایه دوم (L2 Cache) از زمان پردازندههای Pentium III به بعد در تمامی پردازندهها قابل مشاهده هستند، هرچند که در پردازندههای Pentium pro نیز به شکل دیگری به کار گرفته شده بودند. پردازندههای امروزی تا 6 مگابايت حافظه L2 Cache روی ساختار اصلی خود دارند. برای مثال، این میزان را میتوانید در پردازندههای دوهستهای Core2 Duo اینتل مشاهده میکنید که به صورت اشتراکی میان دو هسته استفاده میشود. حافظههای L2 Cache به طور معمول بین 512 کیلوبایت تا 1 مگابایت برای هر هسته استفاده ميشوند. پردازندههایی با حافظه L2 Cache کمتر، به طور معمول پردازندههای کمی ارزان قیمتتر هستند.
اما پردازندههای چهارهستهای طراحی و معماری کنونی را با خود به ارمغان آوردند. در این میان شرکت AMD توانست با قرار دادن دو هسته به صورت مجتمع، کنترلکننده حافظه را نیز به درون پردازنده منتقل كند، در حالي که اینتل از قرار دادن دو هسته جداگانه درون یک بسته، اولین دوهستهای خود را معرفی كرد.
حافظه Cache اختصاصی برای اولینبار در پردازندههای سری Core2 Duo اینتل استفاده شد که از حافظه L2 Cache اشتراکی برای دو هسته استفاده میکرد. اما باز این AMD بود که موفق شد اولین پردازنده چهارهستهای واقعی را -که چهار هسته به صورت مجتمع در یک پردازنده مستقر كرده بود- در پردازندههای چهارهستهای Phenom معرفی كند. اینتل نيز اينبار با ترکیب دو پردازنده دوهستهای در کنار يكديگر اولین پردازنده چهارهستهای خود را معرفی كرد.
تاریخچه حافظههای L3 Cache به سال 1995 بازمیگردد، اما پردازندههای Phenom محصول شرکت AMD اولین پردازندههای دسکتاپی بودند که از حافظه L3 Cache در آنها استفاده میشد. پردازندههای 65 نانومتری Phenom X4 به همراه 2 مگابایت حافظه L3 Cache اشتراکی همچنین پردازندههای 45 نانومتری PhenomII X4 نیز به همراه 6 مگابایت حافظه L3 Cache اشتراکی تولید و عرضه شدند. پردازندههای Core i7 و Core i5 نیز به 8 مگابایت حافظه L3 Cache اختصاصی تجهیز شدهاند.
مقایسه پردازندههای AthlonII X4 و PhenomII X4
در این بررسی که میان دو پردازنده متفاوت از AMD شكل گرفته بیشترین دقت متوجه میزان بازدهی حافظه L3 Cache در پردازندههای چهارهستهای مدرن این شرکت است.
در یک سمت پردازنده Athlon II X4 620 قرار دارد که به نوعی شاید بتوان آن را به عنوان ضعیفترین پردازنده چهارهستهای معرفی كرد، اما این پردازنده اولین پردازنده چهارهستهای بود که تا امروز با قیمت زیر 100 دلار به بازار عرضه شده است. این پردازنده از توان خوبی برخوردار است که البته همواره نمیتواند این کارایی را از خود بروز دهد، زيرا فاقد حافظه L3 Cache است. برای زورآزمایی با این پردازنده در این رقابت از پردازنده پرقدرت Phenom II X4 965 استفاده کردهایم.
پردازنده Phenom II X4 965 پرچمدار نسل جدید پردازندههای AMD است در حالیکه پردازنده Athlon II X4 620 در مرز ورودی پردازندههای چهارهستهای جدید AMD قرار دارد. اما باید توجه داشت که بطن هر دو پردازنده از لحاظ معماری و طراحی مشابه هستند به بيان ديگر هستههای پردازشی حافظههاي L1 Cache و L2 Cache به طور كامل مشابه يكديگرند. در واقع باید گفت تنها تفاوت این دو گروه پردازنده این است که در پردازندههای AthlonII حافظه L3 Cache پردازندههای PhenomII غیرفعال شده است.
البته برای ملموستر شدن آزمایشهاي شكل گرفته روی این دو پردازنده فرکانس پردازنده Phenom II X4 965 را از 4/3 به 6/2 گیگاهرتز کاهش دادیم تا از این جهت نیز دو پردازنده، فرکانس مشابهی را داشته باشند.
در حالت کلی باید گفت که توان مصرفی و راندمان پردازنده چهارهستهای -که فاقد حافظه L3 Cache است- به طور قطع بهتر خواهد بود.
در تستهای انجام شده در بنچمارکهای PCMark Vantage و SiSoftware Sandra 2009 تنها تفاوت کمی به نفع پردازنده Phenom II X4 965 مشاهده میشود که میتوان آن را به حافظه 6 مگابایتی L3 Cache آن نسبت داد. در تست حافظه PCMark، این پردازنده 12 درصد کارایی بهتری دارد در حالی که در مجموع نتایج تستهای بنچمارک Sandra، این تفاوت به 8 درصد کاهش مییابد.
در آزمایشهاي پردازنده بنچمارک 3DMark Vantage نیز فقط 5 درصد تفاوت کارایی مشاهده میشد، این در حالی است که نتایج کارایی GPU در سیستمهای مجهز به هر دو گونه پردازنده به طور كامل مشابه بود.
در بازیها و نرمافزارهای گرافیکی نیز تفاوت کارایی میان 8 تا 20 درصد و گاهی اوقات نیز نتایج مشابهی مشاهده میشود. برای مثال، در تستهای شكل گرفته در نرمافزار Photoshop CS4 هیچگونه تفاوت کارایی مشاهده نشد!
در مجموع باید گفت که کارایی پردازندههای AthlonII در مقابل پردازندههای PhenomII ما را به وجد آورد! زيرا با توجه به تفاوتهای میان این دو پردازنده، به خصوص تفاوت قیمت آنها استفاده از پردازندههای AthlonII -به ویژه برای آن دسته از کاربرانی که نیمنگاهی نیز به هزینه خرید پردازنده دارند- به شدت توصیه میشود! اما نباید از کارایی و قابلیتهای بالای پردازندههای PhenomII نیز به آسانی گذشت. در کل مشخص است که کارایی مناسب پردازندههای AthlonII (نسبت مناسب کارایی به قیمت آنها) دلیل خوب نبودن پردازندههای PhenomII نیست، تمام!
منبع:Only the registered members can see the link
سرويس سختافزار- در پردازندههای جدید استفاده از حافظه اختصاصی پرسرعت برای پردازندههای چند هستهای رواج زيادي یافته که این حافظه به صورت اشتراکی برای تمامی هستهها در دسترس است. در این حالت حافظه پرسرعت لایه سوم میتواند سرعت دسترسی به اطلاعاتی که زیاد مورد استفاده پردازنده قرار میگیرند را افزایش دهد و هستهها مجبور به تبادل اطلاعات با حافظههای کندتر (همان حافظه اصلی RAM) نیستند.
تمامي این مطالب حداقل در حد یک تئوری مقبول اعتبار دارند. پردازندههای جدید Athlon II X4 تولید AMD که در واقع همان پردازندههای Phenom II X4 بدون حافظه L3 Cache به شمار ميروند به نوعی دلیلی بر عدم اهمیت حافظههای لایه سوم در همه موارد هستند.
برای اکتشاف میزان اهمیت حافظههای لایه سوم تصمیم گرفتيم این دو پردازنده را در موارد مختلف مقايسه كنيم، اما پيش از اینکه بخواهیم در نتایج به دست آمده دقیق شویم لازم است ابتدا نیمنگاهی به نحوه عملکرد حافظه Cache و برخی نکات ابتدایی داشته باشيم.
عملکرد کلی حافظه Cache بسیار ساده است، این حافظهها در حقیقت وظیفه همزمانسازی دسترسی به اطلاعات را بر عهده دارند و در نقش یک بافر، اطلاعات مورد نیاز را در خود نگهداری میکنند تا پردازنده نیازی به مراجعه به فواصل دورتر و منابع حافظه کندتر نداشته باشد. معماری رایانههای امروزی به شکلی است که پردازنده شامل سه مرحله حافظه Cache پیش از رسیدن و دسترسی به حافظه اصلی سیستم (RAM) است.
لایه دوم و به ويژه لایه سوم تنها به عنوان بافر ایفای نقش نمیکنند. آنها همچنین وظیفه جلوگیری از توقف عملکرد و تبادل داده پردازنده در زمان افزایش ترافیک تبادل اطلاعات و دادهها میان هستهها را بر عهده دارند.
اثربخشی حافظه Cache در کارکرد سیستم به میزان پاسخگوییهای موفق آن به درخواستها بستگی دارد، اگر به اطلاعاتی نیاز باشد که روی Cache وجود دارند این یک موفقیت برای حافظه به حساب میآید و اگر این دادهها روی این حافظه موجود نباشند سیستم به حافظههای ثانویه دیگر مراجعه میکند. مراجعه به این حافظهها و در واقع عدم موفقیت حافظه Cache سبب کندی پردازش ميشود، همانطور که موفقیت حافظه Cache قدرت و توان پردازش را افزایش میدهد.
میزان بیشتر حافظه Cache میتواند دادههای بیشتری را آماده پردازش (Buffer) کند، اما ظرفیت بیشتر حافظه با افزایش زمان تاخیر دسترسی به اطلاعات آن نیز همراه خواهد بود. از آنجایی که این حافظه میزان زیادی از ترانزیستورهای پردازنده را درگير ميكند، بنابراين بسیار مهم است که نسبت مناسبی میان اندازه ترانزیستورها، مصرف انرژی، توان پردازشی و میزان تاخیرها در این مورد برقرار باشد.
حافظههای لایه اول، دوم و سوم...
تمامی پردازندههای امروزی به حافظههای اختصاصی مجهز هستند. اين حافظهها اطلاعات و ساختار ضروری آنها جهت پردازش را در خود نگهداری میکنند. ابتداییترین نوع این حافظهها که حافظههای لایه اول یا L1 Cache نیز خطاب میشوند اولینبار در پردازندههای 486DX مشاهده شدند. در حال حاضر میزان حافظه استاندارد L1 Cache در پردازندههای AMD، 64 کیلوبایت حافظه L1 Cache برای هر هسته است در حالی که اینتل فقط از 32 کیلوبایت حافظه L1 Cache برای هر یک از هستهها بهره میگیرد.
حافظههای L1 Cache در پردازنده 468DX اینتل معرفی شدند و تا به امروز جزء لاینفک پردازندهها به شمار ميروند.
حافظههای لایه دوم (L2 Cache) از زمان پردازندههای Pentium III به بعد در تمامی پردازندهها قابل مشاهده هستند، هرچند که در پردازندههای Pentium pro نیز به شکل دیگری به کار گرفته شده بودند. پردازندههای امروزی تا 6 مگابايت حافظه L2 Cache روی ساختار اصلی خود دارند. برای مثال، این میزان را میتوانید در پردازندههای دوهستهای Core2 Duo اینتل مشاهده میکنید که به صورت اشتراکی میان دو هسته استفاده میشود. حافظههای L2 Cache به طور معمول بین 512 کیلوبایت تا 1 مگابایت برای هر هسته استفاده ميشوند. پردازندههایی با حافظه L2 Cache کمتر، به طور معمول پردازندههای کمی ارزان قیمتتر هستند.
اما پردازندههای چهارهستهای طراحی و معماری کنونی را با خود به ارمغان آوردند. در این میان شرکت AMD توانست با قرار دادن دو هسته به صورت مجتمع، کنترلکننده حافظه را نیز به درون پردازنده منتقل كند، در حالي که اینتل از قرار دادن دو هسته جداگانه درون یک بسته، اولین دوهستهای خود را معرفی كرد.
حافظه Cache اختصاصی برای اولینبار در پردازندههای سری Core2 Duo اینتل استفاده شد که از حافظه L2 Cache اشتراکی برای دو هسته استفاده میکرد. اما باز این AMD بود که موفق شد اولین پردازنده چهارهستهای واقعی را -که چهار هسته به صورت مجتمع در یک پردازنده مستقر كرده بود- در پردازندههای چهارهستهای Phenom معرفی كند. اینتل نيز اينبار با ترکیب دو پردازنده دوهستهای در کنار يكديگر اولین پردازنده چهارهستهای خود را معرفی كرد.
تاریخچه حافظههای L3 Cache به سال 1995 بازمیگردد، اما پردازندههای Phenom محصول شرکت AMD اولین پردازندههای دسکتاپی بودند که از حافظه L3 Cache در آنها استفاده میشد. پردازندههای 65 نانومتری Phenom X4 به همراه 2 مگابایت حافظه L3 Cache اشتراکی همچنین پردازندههای 45 نانومتری PhenomII X4 نیز به همراه 6 مگابایت حافظه L3 Cache اشتراکی تولید و عرضه شدند. پردازندههای Core i7 و Core i5 نیز به 8 مگابایت حافظه L3 Cache اختصاصی تجهیز شدهاند.
مقایسه پردازندههای AthlonII X4 و PhenomII X4
در این بررسی که میان دو پردازنده متفاوت از AMD شكل گرفته بیشترین دقت متوجه میزان بازدهی حافظه L3 Cache در پردازندههای چهارهستهای مدرن این شرکت است.
در یک سمت پردازنده Athlon II X4 620 قرار دارد که به نوعی شاید بتوان آن را به عنوان ضعیفترین پردازنده چهارهستهای معرفی كرد، اما این پردازنده اولین پردازنده چهارهستهای بود که تا امروز با قیمت زیر 100 دلار به بازار عرضه شده است. این پردازنده از توان خوبی برخوردار است که البته همواره نمیتواند این کارایی را از خود بروز دهد، زيرا فاقد حافظه L3 Cache است. برای زورآزمایی با این پردازنده در این رقابت از پردازنده پرقدرت Phenom II X4 965 استفاده کردهایم.
پردازنده Phenom II X4 965 پرچمدار نسل جدید پردازندههای AMD است در حالیکه پردازنده Athlon II X4 620 در مرز ورودی پردازندههای چهارهستهای جدید AMD قرار دارد. اما باید توجه داشت که بطن هر دو پردازنده از لحاظ معماری و طراحی مشابه هستند به بيان ديگر هستههای پردازشی حافظههاي L1 Cache و L2 Cache به طور كامل مشابه يكديگرند. در واقع باید گفت تنها تفاوت این دو گروه پردازنده این است که در پردازندههای AthlonII حافظه L3 Cache پردازندههای PhenomII غیرفعال شده است.
البته برای ملموستر شدن آزمایشهاي شكل گرفته روی این دو پردازنده فرکانس پردازنده Phenom II X4 965 را از 4/3 به 6/2 گیگاهرتز کاهش دادیم تا از این جهت نیز دو پردازنده، فرکانس مشابهی را داشته باشند.
در حالت کلی باید گفت که توان مصرفی و راندمان پردازنده چهارهستهای -که فاقد حافظه L3 Cache است- به طور قطع بهتر خواهد بود.
در تستهای انجام شده در بنچمارکهای PCMark Vantage و SiSoftware Sandra 2009 تنها تفاوت کمی به نفع پردازنده Phenom II X4 965 مشاهده میشود که میتوان آن را به حافظه 6 مگابایتی L3 Cache آن نسبت داد. در تست حافظه PCMark، این پردازنده 12 درصد کارایی بهتری دارد در حالی که در مجموع نتایج تستهای بنچمارک Sandra، این تفاوت به 8 درصد کاهش مییابد.
در آزمایشهاي پردازنده بنچمارک 3DMark Vantage نیز فقط 5 درصد تفاوت کارایی مشاهده میشد، این در حالی است که نتایج کارایی GPU در سیستمهای مجهز به هر دو گونه پردازنده به طور كامل مشابه بود.
در بازیها و نرمافزارهای گرافیکی نیز تفاوت کارایی میان 8 تا 20 درصد و گاهی اوقات نیز نتایج مشابهی مشاهده میشود. برای مثال، در تستهای شكل گرفته در نرمافزار Photoshop CS4 هیچگونه تفاوت کارایی مشاهده نشد!
در مجموع باید گفت که کارایی پردازندههای AthlonII در مقابل پردازندههای PhenomII ما را به وجد آورد! زيرا با توجه به تفاوتهای میان این دو پردازنده، به خصوص تفاوت قیمت آنها استفاده از پردازندههای AthlonII -به ویژه برای آن دسته از کاربرانی که نیمنگاهی نیز به هزینه خرید پردازنده دارند- به شدت توصیه میشود! اما نباید از کارایی و قابلیتهای بالای پردازندههای PhenomII نیز به آسانی گذشت. در کل مشخص است که کارایی مناسب پردازندههای AthlonII (نسبت مناسب کارایی به قیمت آنها) دلیل خوب نبودن پردازندههای PhenomII نیست، تمام!
منبع:Only the registered members can see the link