شاید اسم کمپانی آمریکایی تاکیوم، به گوش کمتر کسی خورده باشد ولی این شرکت جذاب یک ایده فوق العاده برای پردازنده‌های همه کاره را دنبال می‌کند. ساعاتی پیش Tachyum اولین برگه اطلاعات معماری پردازشی Prodigy خود را منتشر کرد که قابلیت‌های باورنکردنی از آن را نشان می‌دهد که بارها سریعتر از سریعترین پردازنده‌های CPU و GPU است که تا به امروز از سوی غول‌هایی مانند اینتل، انویدیا، AMD و حتی گوگل معرفی شده‌اند.

همه ما به خوبی می‌دانیم که این روزها دنیای پردازش کامپیوتری به صورت ویژه در دو نوع پردازنده محاسبات و منطقی (CPU) و پردازنده گرافیکی (GPU) خلاصه می‌شود. البته به تازگی شرکت‌های فعال در حوزه موبایل مانند اپل، سامسونگ، گوگل و مدیاتک نوع جدیدی از پردازنده‌ها موسوم به NPU یا پردازنده‌های عصبی را عرضه کرده‌اند که به صورت ویژه برای عملیات مخصوص هوش مصنوعی و شبکه عصبی کاربرد دارند.

در حال حاضر ایده SoCها با ترکیب این سه نوع پردازنده در داخل یک پکیج واحد، ایده پردازش همه منظوره را با استفاده از یک تراشه پردازشی مرکزی پیاده کرده ولی ایده‌ای که شرکت Tachyum دنبال می‌کند استفاده از پردازش همه منظوره در مقیاس وسیع و برای امور خارج از دنیای موبایل است.

شرکت تاکیوم ساعاتی پیش اولین برگه اطلاعات فنی پردازنده Prodigy خود را منتشر کرده است. این پردازنده که نوع جدیدی از SoCهای مقیاس بزرگ محسوب می‌شود اولین ایده پردازنده همه منظوره یا Universal Processor (UP) را دنبال کرده و برگه اطلاعات منتشر شده توسط این شرکت اولین نمود مشخصات و قابلیت‌هایی است که این پردازنده ارائه خواهد داد.

برد توسعه پردازنده Prodigy شرکت تاکیوم

مشخصات پردازنده Tachyum Prodigy

پرودیگی اولین تراشه پردازشی همه منظوره تولید شده توسط تاکیوم دارای 128 هسته پردازشی، 16 کنترلر حافظه DDR5-7200 و 64 خط درگاه PCIe 5.0 است که با استفاده از واحدهای عملکردی متصل خود قادر به رسیدن به سرعت 10 ترابیت بر ثانیه برای شبکه غیربلوکی خواهد بود.

مدل پر‌دازندهتعداد هستهفرکانس هستهحافظهPCIET‌DPبازار هدف
PRODIGY T16128-AIX1285,7 GHz16x DDR5-7200Gen5 x64950WHPC, Big AI
PRODIGY T16128-AIM1284,5 GHz16x DDR5-7200Gen5 x64700WHPC, Big AI
PRODIGY T16128-AIE1284,0 GHz16x DDR5-7200Gen5 x64600WHPC, Big AI
PRODIGY T16128-HT1284,5 GHz16x DDR5-6400Gen5 x64300WAnalytics, Big Data
PRODIGY T864-HS645,7 GHz8x DDR5-6400Gen5 x32300WCloud, Databases
PRODIGY T864-HT644,5 GHz8x DDR5-6400Gen5 x32300WCloud, Databases
PRODIGY T832-HS325,7 GHz8x DDR5-6400Gen5 x32300WScalar Workloads
PRODIGY T832-LP323,2 GHz8x DDR5-4800Gen5 x32180WHosting, Storage, Edge

این پردازنده‌ها که بر بستر فناوری 5 نانومتری شرکت TSMC ساخته خواهند شد در حال حاضر در سه نسخه با 32، 64 یا 128 هسته طراحی شده و حداکثر فرکانس هسته نیز در آنها به 5.7 گیگاهرتز خواهد رسید. همچنین امکان پیکربندی 4 سوکته یا 2 سوکته روی مادربردهای مخصوص نیز در نظر گرفته شده است. می‌توان برای خنک‌سازی این پردازنده‌ها از راهکاری خنک‌سازی با هوا یا مایع نیز استفاده کرد.

تصویر دای تراشه پردازنده Prodigy شرکت تاکیوم

ساختار حافظه پردازنده Prodigy شرکت تاکیوم

پل جنوبی تراشه تاکیوم Prodigy

طبق اعلام شرکت میزان توان مصرفی این پردازنده‌ها از 180 تا 900 وات است و امکان اتصال تا 32 ترابایت حافظه رم نیز به آنها وجود دارد. با توجه به ساختار چند سوکته امکان ساخت یک آرایه پردازشی تا 512 هسته و توان پردازشی 3600 وات نیز وجود دارد که همه پردازنده‌ها در آن می‌توانند از نسخه Prodigy T16128-AIX باشند.

مدل صنعتی مادربرد تاکیوم Prodigy

خانواده پردازنده‌های پرودیگی از چند SKU برای ساخت در بازارهای مختلف و کاربردهای متفاوت بهره خواهد برد که قرار است طی برنامه‌های آتی شرکت اعلام شوند. عمده کاربرد این پردازنده‌ها در سیستم‌های HPC، هوش مصنوعی، پردازش ابری مقیاس بزرگ، سیستم‌های پردازش مخابراتی و امور پردازش پیشرفته خواهد بود.

عملکرد پردازنده همه منظوره Prodigy

اما فارغ از اطلاعات دقیق فنی که با مراجعه به سند منتشر شده در بالا می‌توانید در جریان آنها قرار بگیرید، عملکرد سطح بالا و فوق‌العاده‌ای توسط Prodigy ارائه خواهد شد که اسناد منتشر شده توسط تاکیوم از آنها خبر می‌دهد.

مقایسه تاکیوم Prodigy با انویدیا H100 و Intel Xeon Platinum 8380

پردازنده Tachyum Prodigy عملکردی تا 4 برابر سریعتر از پردازنده های x86 (برای بار کاری ابری) و تا 3 برابر بیشتر از عملکرد پردازنده گرافیکی برای HPC و 6 برابر برای برنامه‌های کاربردی هوش مصنوعی ارائه می‌دهد.

به طور خاص، عملکرد (FP64) برتر 128 هسته‌ای Prodigy T16128-AIX سه برابر سریعتر از آخرین شتاب‌دهنده تولید شده توسط انویدیا یعنی H100 است. در نظر داشته باشید که توان پردازشی مورد ادعای 30 ترافلاپسی H100 انویدیا پس از بروزرسانی اخیر در این نسل از پردازنده‌های شرکت مورد بحث قرار گرفته که با این اوصاف، Prodigy T16128-AIX  توان پردازشی معادل 90 TFLOPS را ارائه خواهد داد!

مقایسه پردازنده پرودیگی و انویدیا H100

عملکرد پردازشی FP32 نیز سه برابر سریعتر از جدیدترین پردازنده هوپر انویدیا خواهد بود که با فرض توان 60 ترافلاپسی برای آن، از پردازنده پرودیگی باید تا 180 ترافلاپس توان پردازشی را انتظار داشته باشیم. علاوه بر این، در برخی حالت‌های پردازشی دیگر (INT8 و FP8)، ادعای تاکیوم رسیدن به توان پردازشی تا شش برابر سریع‌تر از غول شتاب‌دهنده اخیر Nvidia است.

همچنین می‌توان اشاره کرد که یک رک سرور استاندارد با پردازنده‌های Prodigy T16128-AIX و خنک‌شونده مایع، عملکرد (FP64) 12.9 PFLOPS در مقابل 960 TFLOPS را برای همان رک با Nvidia H100 ارائه می‌کند.

مقایسه ابعاد تراشه پردازشی تاکیوم Prodigy و انویدیا H100

مضاف بر این در مقایسه با CPUهای سرور، ادعای تاکیوم آن است که Prodigy T16128-AIX تا 40 برابر سریعتر از Xeon Platinum 8380 نیز خواهد بود.

در مقایسه با پردازنده‌های معمولی، Prodigy T16128-AIX چهار برابر سریع‌تر از Intel Xeon Platinum 8380 در تست‌های عملکرد Specrate 2017 INT و 40 برابر در محاسبات ممیز شناور با دقت دو برابر بیشتر است.

همانطور که عنوان شد، ساختار پردازنده های Prodigy عملکرد همه منظوره است؛ این بدان معنی است که این پردازنده‌ها می‌توانند هر کدی را به صورت مشروط با استفاده از یک مترجم باینری پویا اجرا کنند. بنابراین این پردازنده‌ها می توانند کارهایی را انجام دهند که برای CPUها و GPUها یا TPUها معمول یا در نظر گرفته شده است.

به صورت خلاصه می‌توان عملکرد این پردازنده‌ها در مقابل رقبا را به صورت زیر عنوان کرد:

  • تا 3 برابر سریعتر از NVIDIA H100 در عملکرد Double Precision Floating-Point
  • تا 6 برابر سریعتر از NVIDIA H100 در عملکرد  AI FP8
  • تا 9 برابر سریعتر از NVIDIA H100 در نسبت عملکرد به توان مصرفی
  • تا 4 برابر سریعتر از Intel Xeon Platinum 8380 در عملکرد Specrate 2017 INT
  • تا 30 برابر سریعتر از Intel Xeon Platinum 8380 در عملکرد FP64
  • تا 150 برابر سریعتر از Google TPU v4 در عملکرد هوش مصنوعی

تاکیوم انتظار دارد که اولین نمونه‌های پردازنده‌های خود را قبل از پایان سال جاری میلادی در اختیار توسعه‌دهندگان مخصوصش قرار داده و تولید انبوه این پردازنده‌ها در نیمه دوم سال آینده آغاز شود.

چشم انداز توسعه نسل دوم تراشه Prodigy

درباره شرکت Tachyum

شرکت Tachyum Inc. که مرکز اصلی آن در سانتاکلارا قرار گرفته و یک مرکز طراحی نیز در کشور اسلواکی دارد، یک کمپانی فعال در حوزه طراحی سیستم‌های پردازشی HPC، دیتاسنترها و راهکارهای هوش مصنوعی مقیاس بزرگ است که به تازگی ایده Prodigy برای پردازش همه منظوره یا Universal Processors را مطرح کرده است. این واحد پردازشی قرار است کلیه وظایف مربوط به CPU، GPU و TPU را در یک پردازنده واحد قرار داده تا بتواند علاوه بر صرفه‌جویی در ابعاد و هزینه، عملکرد سطح بالایی را نیز ارائه دهد.

پردازنده‌های Prodigy در یک مرکز داده در مقیاس بزرگ مورد استفاده قرار خواهند گرفت که کاربری آن را برای کلیه امور هوش مصنوعی، HPC و برنامه‌های کاربردی همه منظوره گسترده خواهد کرد. استفاده از این پردازنده‌ها می‌تواند تا میلیاردها دلار برای شرکت‌های بزرگ صرفه‌جویی ایجاد کند.

طبق اعلام شرکت، با توجه به اینکه مراکز داده در حال حاضر بیش از 4 درصد از انرژی الکتریکی تولیدی توسط نیروگاه‌ها در کره زمین را مصرف می کنند و پیش بینی می شود تا سال 2030 این میزان به 10 درصد برسد، استفاده در مقیاس جهانی از پردازنده‌های Prodigy می‌تواند امری ضروری برای کاهش این حجم گسترده از مصرف برق محسوب شود.

جالب است بدانید شرکت Tachyum، که در سال 2016 توسط دکتر Radoslav Danilak تأسیس شد، در حال ساخت سریع‌ترین ابررایانه هوش مصنوعی جهان با 128 اگزافلاپس توان پردازشی در اتحادیه اروپا بر پایه پردازنده‌های Prodigy است.

نظر خود را اضافه کنید.

ارسال نظر بدون عضویت در سایت

0

نظرات (4)

  • سل هم زمانی که اومد سونی با ابرکامپیوتر مقایسش کرد و همه جور محاسبه ای می توتست بکنه اما چون برنامه نویسیش سخت بود و خیلی مهم تر آخرش که از 360 عقب موند دیگه ادامه ندادند

  • مهمان - پدرام

    اینقدر مشخصاتش در همه زمینه بالا و با جدیدترین تکلنلوژی ها سازگاری داره که ادم فکر میکنه خالی بندیه :D
    در یک کلام
    عالیه عالیه عالیه

  • مهمان - تولیدکننده ساندیس

    این است قدرت ایالات متحده ...
    فقط من متوجه نشدم چرا SoC هست ... GPU که نداره ... یه CPU هست و Memory Controller که CPUهای امروزی هم همین ها رو دارن ...
    در مورد مترجم باینری پویا یا DBT، تا جایی که خوانده ایم و می دونیم، مربوط به اجرای کدهای حتی Non-native روی اون معماری هست و در مقایسه با چیزی که در متن نوشته به شک افتادم

  • یا امام زاده تاکیوم
    بازار گیم رو هم مورد عنایت قرار بده
    بگو تا حال کجا بودی!

ورود به شهرسخت‌افزار

ثبت نام در شهر سخت افزار
ورود به شهر سخت افزار

ثبت نام در شهر سخت افزار

نام و نام خانوادگی(*)
لطفا نام خود را وارد کنید

ایمیل(*)
لطفا ایمیل خود را به درستی وارد کنید

رمز عبور(*)
لطفا رمز عبور خود را وارد کنید

شماره موبایل
Invalid Input

جزو کدام دسته از اشخاص هستید؟(*)

لطفا یکی از موارد را انتخاب کنید