شاید اسم کمپانی آمریکایی تاکیوم، به گوش کمتر کسی خورده باشد ولی این شرکت جذاب یک ایده فوق العاده برای پردازندههای همه کاره را دنبال میکند. ساعاتی پیش Tachyum اولین برگه اطلاعات معماری پردازشی Prodigy خود را منتشر کرد که قابلیتهای باورنکردنی از آن را نشان میدهد که بارها سریعتر از سریعترین پردازندههای CPU و GPU است که تا به امروز از سوی غولهایی مانند اینتل، انویدیا، AMD و حتی گوگل معرفی شدهاند.
همه ما به خوبی میدانیم که این روزها دنیای پردازش کامپیوتری به صورت ویژه در دو نوع پردازنده محاسبات و منطقی (CPU) و پردازنده گرافیکی (GPU) خلاصه میشود. البته به تازگی شرکتهای فعال در حوزه موبایل مانند اپل، سامسونگ، گوگل و مدیاتک نوع جدیدی از پردازندهها موسوم به NPU یا پردازندههای عصبی را عرضه کردهاند که به صورت ویژه برای عملیات مخصوص هوش مصنوعی و شبکه عصبی کاربرد دارند.
در حال حاضر ایده SoCها با ترکیب این سه نوع پردازنده در داخل یک پکیج واحد، ایده پردازش همه منظوره را با استفاده از یک تراشه پردازشی مرکزی پیاده کرده ولی ایدهای که شرکت Tachyum دنبال میکند استفاده از پردازش همه منظوره در مقیاس وسیع و برای امور خارج از دنیای موبایل است.
شرکت تاکیوم ساعاتی پیش اولین برگه اطلاعات فنی پردازنده Prodigy خود را منتشر کرده است. این پردازنده که نوع جدیدی از SoCهای مقیاس بزرگ محسوب میشود اولین ایده پردازنده همه منظوره یا Universal Processor (UP) را دنبال کرده و برگه اطلاعات منتشر شده توسط این شرکت اولین نمود مشخصات و قابلیتهایی است که این پردازنده ارائه خواهد داد.
مشخصات پردازنده Tachyum Prodigy
پرودیگی اولین تراشه پردازشی همه منظوره تولید شده توسط تاکیوم دارای 128 هسته پردازشی، 16 کنترلر حافظه DDR5-7200 و 64 خط درگاه PCIe 5.0 است که با استفاده از واحدهای عملکردی متصل خود قادر به رسیدن به سرعت 10 ترابیت بر ثانیه برای شبکه غیربلوکی خواهد بود.
مدل پردازنده | تعداد هسته | فرکانس هسته | حافظه | PCIE | TDP | بازار هدف |
PRODIGY T16128-AIX | 128 | 5,7 GHz | 16x DDR5-7200 | Gen5 x64 | 950W | HPC, Big AI |
PRODIGY T16128-AIM | 128 | 4,5 GHz | 16x DDR5-7200 | Gen5 x64 | 700W | HPC, Big AI |
PRODIGY T16128-AIE | 128 | 4,0 GHz | 16x DDR5-7200 | Gen5 x64 | 600W | HPC, Big AI |
PRODIGY T16128-HT | 128 | 4,5 GHz | 16x DDR5-6400 | Gen5 x64 | 300W | Analytics, Big Data |
PRODIGY T864-HS | 64 | 5,7 GHz | 8x DDR5-6400 | Gen5 x32 | 300W | Cloud, Databases |
PRODIGY T864-HT | 64 | 4,5 GHz | 8x DDR5-6400 | Gen5 x32 | 300W | Cloud, Databases |
PRODIGY T832-HS | 32 | 5,7 GHz | 8x DDR5-6400 | Gen5 x32 | 300W | Scalar Workloads |
PRODIGY T832-LP | 32 | 3,2 GHz | 8x DDR5-4800 | Gen5 x32 | 180W | Hosting, Storage, Edge |
این پردازندهها که بر بستر فناوری 5 نانومتری شرکت TSMC ساخته خواهند شد در حال حاضر در سه نسخه با 32، 64 یا 128 هسته طراحی شده و حداکثر فرکانس هسته نیز در آنها به 5.7 گیگاهرتز خواهد رسید. همچنین امکان پیکربندی 4 سوکته یا 2 سوکته روی مادربردهای مخصوص نیز در نظر گرفته شده است. میتوان برای خنکسازی این پردازندهها از راهکاری خنکسازی با هوا یا مایع نیز استفاده کرد.
طبق اعلام شرکت میزان توان مصرفی این پردازندهها از 180 تا 900 وات است و امکان اتصال تا 32 ترابایت حافظه رم نیز به آنها وجود دارد. با توجه به ساختار چند سوکته امکان ساخت یک آرایه پردازشی تا 512 هسته و توان پردازشی 3600 وات نیز وجود دارد که همه پردازندهها در آن میتوانند از نسخه Prodigy T16128-AIX باشند.
خانواده پردازندههای پرودیگی از چند SKU برای ساخت در بازارهای مختلف و کاربردهای متفاوت بهره خواهد برد که قرار است طی برنامههای آتی شرکت اعلام شوند. عمده کاربرد این پردازندهها در سیستمهای HPC، هوش مصنوعی، پردازش ابری مقیاس بزرگ، سیستمهای پردازش مخابراتی و امور پردازش پیشرفته خواهد بود.
عملکرد پردازنده همه منظوره Prodigy
اما فارغ از اطلاعات دقیق فنی که با مراجعه به سند منتشر شده در بالا میتوانید در جریان آنها قرار بگیرید، عملکرد سطح بالا و فوقالعادهای توسط Prodigy ارائه خواهد شد که اسناد منتشر شده توسط تاکیوم از آنها خبر میدهد.
پردازنده Tachyum Prodigy عملکردی تا 4 برابر سریعتر از پردازنده های x86 (برای بار کاری ابری) و تا 3 برابر بیشتر از عملکرد پردازنده گرافیکی برای HPC و 6 برابر برای برنامههای کاربردی هوش مصنوعی ارائه میدهد.
به طور خاص، عملکرد (FP64) برتر 128 هستهای Prodigy T16128-AIX سه برابر سریعتر از آخرین شتابدهنده تولید شده توسط انویدیا یعنی H100 است. در نظر داشته باشید که توان پردازشی مورد ادعای 30 ترافلاپسی H100 انویدیا پس از بروزرسانی اخیر در این نسل از پردازندههای شرکت مورد بحث قرار گرفته که با این اوصاف، Prodigy T16128-AIX توان پردازشی معادل 90 TFLOPS را ارائه خواهد داد!
عملکرد پردازشی FP32 نیز سه برابر سریعتر از جدیدترین پردازنده هوپر انویدیا خواهد بود که با فرض توان 60 ترافلاپسی برای آن، از پردازنده پرودیگی باید تا 180 ترافلاپس توان پردازشی را انتظار داشته باشیم. علاوه بر این، در برخی حالتهای پردازشی دیگر (INT8 و FP8)، ادعای تاکیوم رسیدن به توان پردازشی تا شش برابر سریعتر از غول شتابدهنده اخیر Nvidia است.
همچنین میتوان اشاره کرد که یک رک سرور استاندارد با پردازندههای Prodigy T16128-AIX و خنکشونده مایع، عملکرد (FP64) 12.9 PFLOPS در مقابل 960 TFLOPS را برای همان رک با Nvidia H100 ارائه میکند.
مضاف بر این در مقایسه با CPUهای سرور، ادعای تاکیوم آن است که Prodigy T16128-AIX تا 40 برابر سریعتر از Xeon Platinum 8380 نیز خواهد بود.
در مقایسه با پردازندههای معمولی، Prodigy T16128-AIX چهار برابر سریعتر از Intel Xeon Platinum 8380 در تستهای عملکرد Specrate 2017 INT و 40 برابر در محاسبات ممیز شناور با دقت دو برابر بیشتر است.
همانطور که عنوان شد، ساختار پردازنده های Prodigy عملکرد همه منظوره است؛ این بدان معنی است که این پردازندهها میتوانند هر کدی را به صورت مشروط با استفاده از یک مترجم باینری پویا اجرا کنند. بنابراین این پردازندهها می توانند کارهایی را انجام دهند که برای CPUها و GPUها یا TPUها معمول یا در نظر گرفته شده است.
به صورت خلاصه میتوان عملکرد این پردازندهها در مقابل رقبا را به صورت زیر عنوان کرد:
- تا 3 برابر سریعتر از NVIDIA H100 در عملکرد Double Precision Floating-Point
- تا 6 برابر سریعتر از NVIDIA H100 در عملکرد AI FP8
- تا 9 برابر سریعتر از NVIDIA H100 در نسبت عملکرد به توان مصرفی
- تا 4 برابر سریعتر از Intel Xeon Platinum 8380 در عملکرد Specrate 2017 INT
- تا 30 برابر سریعتر از Intel Xeon Platinum 8380 در عملکرد FP64
- تا 150 برابر سریعتر از Google TPU v4 در عملکرد هوش مصنوعی
تاکیوم انتظار دارد که اولین نمونههای پردازندههای خود را قبل از پایان سال جاری میلادی در اختیار توسعهدهندگان مخصوصش قرار داده و تولید انبوه این پردازندهها در نیمه دوم سال آینده آغاز شود.
درباره شرکت Tachyum
شرکت Tachyum Inc. که مرکز اصلی آن در سانتاکلارا قرار گرفته و یک مرکز طراحی نیز در کشور اسلواکی دارد، یک کمپانی فعال در حوزه طراحی سیستمهای پردازشی HPC، دیتاسنترها و راهکارهای هوش مصنوعی مقیاس بزرگ است که به تازگی ایده Prodigy برای پردازش همه منظوره یا Universal Processors را مطرح کرده است. این واحد پردازشی قرار است کلیه وظایف مربوط به CPU، GPU و TPU را در یک پردازنده واحد قرار داده تا بتواند علاوه بر صرفهجویی در ابعاد و هزینه، عملکرد سطح بالایی را نیز ارائه دهد.
پردازندههای Prodigy در یک مرکز داده در مقیاس بزرگ مورد استفاده قرار خواهند گرفت که کاربری آن را برای کلیه امور هوش مصنوعی، HPC و برنامههای کاربردی همه منظوره گسترده خواهد کرد. استفاده از این پردازندهها میتواند تا میلیاردها دلار برای شرکتهای بزرگ صرفهجویی ایجاد کند.
طبق اعلام شرکت، با توجه به اینکه مراکز داده در حال حاضر بیش از 4 درصد از انرژی الکتریکی تولیدی توسط نیروگاهها در کره زمین را مصرف می کنند و پیش بینی می شود تا سال 2030 این میزان به 10 درصد برسد، استفاده در مقیاس جهانی از پردازندههای Prodigy میتواند امری ضروری برای کاهش این حجم گسترده از مصرف برق محسوب شود.
جالب است بدانید شرکت Tachyum، که در سال 2016 توسط دکتر Radoslav Danilak تأسیس شد، در حال ساخت سریعترین ابررایانه هوش مصنوعی جهان با 128 اگزافلاپس توان پردازشی در اتحادیه اروپا بر پایه پردازندههای Prodigy است.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت