ساعتی پیش شرکت ARM به صورت رسمی از نسل جدید هستههای پردازشی خود در سه رده پرچمدار، کارآمد و عملکردی به همراه انبوه قابلیتهای جدیدی که قرار است برای تراشههای بر پایه محصولات این شرکت به کار روند، رونمایی کرد. در ادامه این مطلب به صورت ویژه، قابلیت این هستهها را مورد بررسی قرار خواهیم داد.
شرکت ARM طراح اصلی هستههای CPU است که در اغلب گوشیهای هوشمند اندرویدی به کار میروند، اما امسال، وضعیت کمی متفاوت است. با تغییر مسیر کوالکام (یا شاید بازگشت به رویه چند سال پیش خود) به سمت استفاده از هستههای مبتنی بر ARM خود با نام Oryon جهت استفاده در Snapdragon 8 نسل چهارم، تعداد قابل توجهی از گوشیهای هوشمند که سال آینده عرضه خواهند شد، بدون هستهای طراحی شده توسط ARM روانه بازار میشوند. با این حال، انتظار میرود که مدیاتک همچنان هستههای ساخت ARM را به کار گرفته و کوالکام نیز ممکن است در آینده SoC غیر پرچمداری را با ترکیبی از این هستهها عرضه کند.
با این وجود، ساعتی پیش شرکت ARM از معماری هسته پرچمدار جدید Cortex-X925، هسته عملکردی Cortex-A725 و هسته کارآمدی بهروز شده Cortex-A520 رونمایی کرد. این هستهها با مجموعه دستورالعمل ARM v9.2 سازگار هستند و پایهای برای طرح جدید شرکت موسوم به CSS برای مشتریان خواهند بود که تا پیش از این به عنوان راهحلهای کامپیوتری جامع شناخته میشدند. CSS مخفف Compute SubSystems است، اصطلاحی که پیشتر در هستههای Neoverse متمرکز بر دیتاسنتر شرکت آرم استفاده میشد. همچنین شاهد واحد مشترک DynamIQ جدید (DSU) و GPU بهبود یافته به شکل Immortalis G925 در تراشههای آینده ساخته شده توسط مشتریان خواهیم بود.
برای اولین بار شرکت ARM، این هستهها را به شکل یک فایل GDSII بستهبندی کرده تا در اختیار تولیدکنندگان OEM قرار دهد. فایلهای GDSII شامل هرگونه ویژگی خاص یا نکات فنی سازنده میشوند، میتواند به صورت مستقیم برای تولید به یک سازنده مانند TSMC یا سامسونگ ارائه شود. ARM میگوید که یکی از مزایای بزرگ این طرح آن است که میتواند زمان ورود به بازار تراشههای اختصاصی را برای شرکتهایی که از این هستهها استفاده میکنند، بهبود بخشد. البته این امکان همچنان وجود خواهد داشت که دقیقاً مانند هستههای قبلی ARM، شرکتها قادر باشند تا به سادگی طرحها را لایسنس کرده و کل فرایند توسعه را نیز خودشان انجام دهند.
در ادامه به بررسی این هستهها و ویژگیهای بروز شده آنها خواهیم پرداخت.
Cortex X925؛ بهتر کردن بهترین
همانطور که میدانید معماری سری X هستههای ARM از سری A آن چندین سال پیش جدا شده و با فلسفهای که برای یک هسته قدرتمند تصویر شده، اجازه دارد مصرف انرژی (کمی) بیشتر را در زمان نیاز نسبت به سری A داشته باشد. معمولاً، سازندگان تراشه فقط یک یا دو تا از این هستهها را در CPUهای خود به کار میگیرند و علت اصلی این تصمیم همان مصرف توان بالاتر آنها نسبت به هستههای سری A است.
امسال نیز این فلسفه همچنان برقرار است، اما ARM از بهبودهای بزرگ در هر دو زمینه AI و IPC معمولی خبر میدهد. دلیل ادامه این روند آن است که ARM معتقد است بیشتر تسکهای AI نوشته شده توسط توسعهدهندگان نرمافزاری هنوز روی هستههای CPU اجرا میشود. در واقع با توجه به تنوع گسترده سختافزارهای بر پایه هوش مصنوعی که در حال حاضر در بازار وجود دارد، برای توسعهدهندگان سخت است که پردازش AI خود را روی NPUهای داخلی انجام دهند.
فرکانس هدف X925 بیش از 3.6 گیگاهرتز است و جالب اینجاست که ARM از این هسته به عنوان یک پلتفرم مقیاسپذیر برای نسل بعدی AI PCها صحبت میکند.
بر اساس اعلام شرکت ARM، مجموع بهبودهای صورت گرفته در این هسته منجر به افزایش 30 درصدی عملکرد خوشه حاوی این هستهها در CPU به صورت میانگین است. ARM اعلام کرده است که این هسته برای سالهای آینده تغییرات بنیادینی در هستههای Cortex ایجاد خواهد کرد. همچنین، شما عملکرد بهتری را با مصرف انرژی کمتر دریافت خواهید کرد.
در مورد نحوه بهبود چند وجهی نیز آرم تلاش کرده تا بسیاری از بخشها را بازطراحی یا بهینه کند. برای مثال واحد کلاستر پیشبین Cortex X925 میتواند عملیات مورد نظر خود را برای دادههای دو برابر بیشتر از قبل انجام دهد و همزمان دقت این پیشبینیهای نیز به طور قابل توجهی بهبود یافته است. علاوه بر این، دو برابر پهنای باند برای پیشخوانی دستورالعملها در اختیار هسته قرار خواهد گرفت که این امر منجر به کسب مزایای مهمی میشود.
تغییرات دیگر شامل بهینهسازیها برای decode و dispatch میشود. همچنین افزایش پهنای باند برداری از 4 خط 128 بیتی در هر چرخه 6 خط 128 بیتی در هر چرخه تبدیل شده و پایپ لاین ALU اینتجر نیز افزایش یافتهاند. ARM همچنین میگوید که یکی از مزایای ارائه GDSII به شرکای تجاری این است که ARM میتواند از بهبودهای خاصی که یک گره فرآیند میتواند ارائه دهد، بهرهمند شود، به این معنی که ALU آنها میتواند عملیات یک و دو چرخهای را صرفاً به دلیل بهبودهای گره انجام دهد. تقریباً تمام این مزایا خود را در اجرای عملیات AI نشان خواهند داد و این بدان معناست که عملکرد بسیار بهتری در اجرای دستورات برپایه هوش مصنوعی را SoCهای سال آینده بر پایه ARM خواهیم دید.
Cortex A725؛ سلاح قدرتمند ARM برای پردازش AI با لحاظ کردن توان
ARM به هستههای قدرتمند سری X خود اجازه میدهد تا به اندازه نیاز خود انرژی مصرف کنند، در حالی که هستههای سری A معمولاً به دنبال تعادل بین مصرف انرژی و عملکرد هستند. با Cortex-A725، ARM وعده یک هسته با کارایی عملکردی 35 درصد بیشتر را همزمان با عملکرد افزایش یافته در همان میزان قدرت به عنوان A715 از سال گذشته میدهد.
همانطور که قبلاً ذکر شد، بیشتر بارهای کاری AI در نهایت روی CPU اجرا میشوند و ARM هدفگذاری A725 را دقیقاً برای این بارهای کاری انجام میدهد. این هسته مصرف انرژی را در یک کارایی ثابت تا 25 درصد کاهش داده و همزمان برخی بهینهسازیها را به کار خواهند بست تا به هستههای بهتر برای انجام عملیات AI تبدیل شوند.
این هستهها، هستههایی هستند که بیشتر کارهای پردازشی یک تراشه در کلیه دستگاهها را بر دوش خود میکشند و به همین دلیل هر گونه بهبودی در این فاز میتواند بسیار مثبت تلقی شده و از آن استقبال میشود.
Cortex-A520 Refresh؛ یک بروزرسانی مطلوب بدون نیاز به تغییرات اساسی
از آنجایی که این هستهها نیز در طرح یکپارچه GDSII جای میگیرند، آرم وعده داده که عملکردی حتی بهتر از هستههای جذاب و کممصرف سال گذشته یعنی A520 را در آنها خواهیم دید. به صورت کلی در مورد این هستهها نمیتوانیم توضیحات خاصی بدهیم به جز اینکه مصرف این هستهها از سال قبل کمتر خواهد شد.
البته آرم به ذکر این توضیحات بسنده کرده که یک روش توسعه کاملاً جدید را برای این هستهها در نظر گرفته که همزمان منجر به افزایش سرعت عملکرد این هستهها نیز خواهد شد.
از دید منطقی نیز شرکت در نظر گرفته تا این هستهها را هر دو سال یکبار دگرگون کند و به همین دلیل بهتر است برویم و سال دیگر برگردیم تا ببینیم نسل جدید سری A5xx چه تحفههایی را با خود برایمان به ارمغان خواهد آورد.
DSU-120؛ تغییرات جزئی ولی بهتر از قبل
واحد DynamIQ Shared Unit یا DSU، یک یا چند هسته را با یک سیستم حافظه L3، واحد کنترل عملیات منطقی و رابطهای خارجی ترکیب میکند تا یک خوشه چند هستهای تشکیل دهد. این بخش در واقع راهکار ویژه ARM است که اجازه میدهد تمام این هستهها با یکدیگر ارتباط برقرار کرده و منابع با به اشتراکگذاری منابعشان، قطعه مهمی از پازل برای هر سازنده تراشهای را تکمیل کننده که به دنبال ساخت یک تراشه با طرحهای کامل هسته ARM است.
DSU-120 سال گذشته با TCS23 راهاندازی شد و این نسخه بهروز شده همان DSU سال گذشته است. اما یک تغییر اساسی وجود دارد و آن L3 Quick Nap است.
فناوری مدیریت حافظه کش L3 Quick Nap در DSU-120 یک حالت صرفهجویی در مصرف انرژی پیچیده است که به طور مستقل اجرا میشود و نیازی به مداخله از سوی سازندگان تراشه مانند MediaTek یا Qualcomm برای فعالسازی یا تنظیم ندارد. این ویژگی تضمین میکند که حافظه L3 وقتی مورد استفاده نیست وارد حالت کممصرف شود و به طور خودکار هر زمان که نیاز باشد بیدار شود. این انتقال بدون ایجاد عقبماندگی (برای عملیات بیدار شدن از خواب) برای کاهش مصرف انرژی ضمن حفظ عملکرد بالا صورت خواهد گرفت.
آرم همچنان مدعی است که این حالت تأثیر ناچیزی بر تأخیر دارد. مهندسان شرکت تضمین میکند که تأخیر بیدار شدن L3 به حدی کم است که میتواند در مراحل عبور دستورالعملها از پایپ لاین پردازنده پنهان شود. زمانی که درخواستهای دسترسی به حافظه L3 به آن برسند، حافظه از چُرت کوتاه خود بیدار شده و تا زمانی که دسترسی لازم باشد، کاملاً عملیاتی خواهد بود.
CSS for Client چه تأثیری بر عملکرد خواهد داشت؟
انتظار میرود که تاثیر CSS for Client در چند نوع عملکرد ویژه ظاهر شود، اما نکته جالب این است که اکنون احتمالاً تراشههای پرچمدار Qualcomm از آن محروم خواهند بود. با توجه به صحبتهای ARM در مورد AI PC در طول ارائههای خود، ممکن است که برخی تراشهها نیز تولید شوند که راه ورود هستههای جدید به دنیای AI PCها را نیز باز کنند.
با این حال، احتمالاً MediaTek همچنان از هستههای ARM آمادهسازی شده استفاده خواهد کرد و شاید حتی برخی از تراشههای رده 7 کوالکام نیز از آنها استفاده کنند. منتظر میمانیم تا ببینیم این هستهها در تراشههایی که در ادامهی سال معرفی میشوند چگونه عمل خواهند کرد ولی بدون شک اتفاقات ویژهای در سال آتی را پیش رو خواهیم داشت که با رقابت آرم و کوالکام بسیار جذابتر از سالیان گذشته خواهند بود.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت