این روزها شاید شما هم اصطلاح "TOPS" یا تاپس را در حوزه AI شنیده باشید. اما TOPS چیست و چرا برای علاقهمندان به هوش مصنوعی اهمیت دارد؟ به بیان ساده، واحد TOPS برای اندازهگیری، سادهسازی و تبلیغ عملکرد واحد پردازش عصبی (NPU) در رایانههای مجهز به هوش مصنوعی به کار میرود.
مقدمه
با ورود به دنیای رایانههای مجهز به هوش مصنوعی، اصطلاحات و مخففهای جدیدی ظاهر شدهاند که سختافزار و قابلیتهای جدید را توضیح میدهند. بسیاری از لپتاپهای مدرن و حتی دسکتاپهای سری Ryzen PRO 8000 AMD، دارای پردازندههایی (CPU) با واحد پردازش عصبی (NPU) برای افزایش عملکرد در زمینه هوش مصنوعی هستند. با ظهور NPU، نیاز به معیار جدیدی برای سنجش عملکرد احساس شد که TOPS نام گرفت. به همین دلیل است که در آینده شاهد استفاده گسترده از TOPS در رایانههای مجهز به هوش مصنوعی خواهیم بود.
TOPS اصطلاح جدیدی نیست، اما با افزایش محبوبیت رایانههای مجهز به هوش مصنوعی (که هنوز تعریف دقیقی برای آن وجود ندارد، اما شامل پردازنده، کارت گرافیک و NPU مدرن است) توجه زیادی را به خود جلب کرده است. در همین زمینه ما مقالهای عالی در مورد تفاوت NPU با GPU و CPU را پیش از این تولید کردهایم که برای کسب اطلاعات بیشتر میتوانید به آن مراجعه کنید.
TOPS چیست؟
TOPS مخفف عبارت Tera Operations Per Second است و به معنای تریلیون عملیات در ثانیه میباشد. بیان ساده جهت معرفی واحد TOPS باید گفت که این واحد برای اندازهگیری سرعت پردازش و قدرت محاسباتی سیستمهای رایانهای، به ویژه در زمینه هوش مصنوعی و یادگیری ماشین به کار میرود. بهطور سادهتر، TOPS نشان میدهد که یک سیستم در هر ثانیه قادر به انجام چند تریلیون عملیات ریاضی است.
معیار TOPS میتواند برای سنجش عملکرد کلی سیستم یا اجزای خاص مانند کارت گرافیک استفاده شود. به عنوان مثال، کارت گرافیک RTX 4090 انویدیا میتواند بیش از ۱۳۰۰ TOPS عملکرد ارائه دهد که هم برای بازی و هم برای تسریع وظایف هوش مصنوعی قابل استفاده است. این کارت یکی از قدرتمندترین کارتهای گرافیک موجود در بازار است، اما این عدد همچنان گیجکننده است. در نظر داشته باشید که حتی GPUهای موبایل انویدیا نیز میتوانند تا ۱۰۰۰ تریلیون عملیات در ثانیه قدرت برای کارهای هوش مصنوعی ارائه دهند.
در همین رابطه بخوانید:
- هوش مصنوعی جامع (AGI) چیست و چرا باید نگران آن باشیم؟
- معایب، مضرات و خطرات هوش مصنوعی برای بشریت
- آیندهای که برایش آماده نیستیم: هکرهای هوش مصنوعی
اگرچه TOPS معیار کاملی نیست و عوامل متعددی بر توانایی یک سیستم در پردازش وظایف هوش مصنوعی تأثیر میگذارند، اما همچنان مرجعی سریع برای سنجش سرعت NPU و مقایسه آن با رقبا محسوب میشود. در ادامه این مطلب در خصوص اهمیت TOPS در پردازش دادهها نیز صحبت خواهیم کرد.
کاربرد واحد TOPS
مانند هر واحد سنجش قدرت پردازشی، بهتر است از تاپس نیز در مکان مناسب آن استفاده کنیم. به صورت کلی میتوان سه دسته عمومی را به عنوان بخشهایی که سنجش توانایی پردازش هوش مصنوعی TOPS (تریلیون عملیات در ثانیه) عملکرد مناسبتری ارائه میدهد عنوان کرد:
- سنجش قدرت پردازندههای گرافیکی (GPU): از واحد TOPS برای مقایسه عملکرد GPUهای مختلف، به ویژه در زمینههای گرافیکی، محاسبات علمی و هوش مصنوعی استفاده میشود.
- سنجش قدرت واحدهای پردازش عصبی (NPU): تراشههای NPU تراشههایی هستند که به طور خاص برای انجام محاسبات مورد نیاز در یادگیری عمیق (Deep Learning) طراحی شدهاند. واحد TOPS برای سنجش سرعت و کارایی NPUها نیز به کار میرود.
- مقایسه عملکرد سیستمهای هیبریدی: با استفاده از TOPS میتوان قدرت محاسباتی سیستمهایی که از انواع پردازندهها برای انجام عملیات مورد نظر خود بهره میگیرند نیز استفاده کرد.
عملکرد TOPS در محاسبات
در کنار موارد عنوان شده به عنوان کاربردهای TOPS میتوانیم به عنوان موارد عملکردی نیز از تاپس در بخشهای مختلفی استفاده کنیم. عملکرد تاپس در محاسبات میتوان شامل موارد زیر باشد و به شما کمک کند که استفاده از واحد TOPS در هوش مصنوعی را مورد تحلیل قرار دهید:
- یادگیری عمیق: در یادگیری عمیق، شبکههای عصبی مصنوعی برای یادگیری الگوها در دادهها استفاده میشوند. هر لایه از این شبکهها شامل میلیونها یا میلیاردها پارامتر است که باید به روزرسانی شوند. TOPS نشان میدهد که یک سیستم چقدر سریع میتواند این بهروزرسانیها را انجام دهد.
- پردازش تصویر و ویدیو: در پردازش تصویر و ویدیو، عملیاتهای پیچیدهای مانند تشخیص اشیاء، ردیابی حرکت و تولید تصاویر واقعگرایانه انجام میشود. TOPS نشان میدهد که یک سیستم چقدر سریع میتواند این عملیاتها را انجام دهد.
- محاسبات علمی: در محاسبات علمی، برای حل مسائل پیچیده ریاضی و شبیهسازی سیستمهای فیزیکی از محاسبات با دقت بالا استفاده میشود. «تریلیون عملیات در ثانیه» نشان میدهد که یک سیستم چقدر سریع میتواند این محاسبات را انجام دهد. البته این مورد بستگی زیادی به نوع عملکرد داشته و چندان صریح و مشخص نیست.
در همین رابطه بخوانید:
- مدل زبانی بزرگ (LLM) در هوش مصنوعی چیست؟
- ربات هوش مصنوعی چت جی پی تی (ChatGPT) چیست و چگونه کار می کند؟
سنجش قدرت محاسباتی TOPS
برای سنجش قدرت محاسباتی با واحد TOPS در یک پردازنده، معمولاً از فرمول یا بنچمارکهای خاصی استفاده میشود. این معیارها مجموعهای از محاسبات پیچیده را روی سیستم اجرا نموده و زمان انجام این محاسبات را اندازهگیری میکنند. با تقسیم تعداد عملیات بر زمان انجام شده، میتوان میزان TOPS سیستم را محاسبه کرد.
برای مثال شرکت کوالکام در وبسایت رسمی خود روشی تخصصی و پایه را برای محاسبه میزان تاپس یک پردازنده عنوان میکند که در ادامه آن را به زبان ساده به شما توضیح خواهیم داد:
معیار TOPS ظرفیت پردازشی یک NPU را با شمارش تعداد عملیات (جمع، ضرب و غیره) انجامشده در هر ثانیه، به تریلیونها واحد اندازهگیری میکند. عملیات ضرب-جمع یا multiply-accumulate operation (MAC) فرمولهای ریاضیِ اصلیِ بار کاری هوش مصنوعی را اجرا میکند.
یک واحد MAC میتواند یک عمل ضرب و جمع را در هر سیکل ساعت اجرا کند؛ به این معنی که دو عمل را در هر سیکل ساعت انجام میدهد. هر NPU دارای تعداد مشخصی واحد MAC است که میتواند با سطوح مختلف دقت و فرکانس هسته (بسته به معماری NPU)، عمل کند.
فرکانس بالاتر امکان انجام عملیات بیشتر در واحد زمان را فراهم میکند و منجر به سرعت پردازش بالاتر میشود. با این حال، افزایش فرکانس همچنین منجر به مصرف انرژی بالاتر و تولید گرما میشود که بر عمر باتری و تجربه کاربر تأثیر میگذارد.
عدد TOPS ذکر شده برای پردازندهها معمولاً در بالاترین فرکانس عملیاتی آنها بیان میشود.
دقت به درجهبندی محاسبات اشاره دارد و دقت بالاتر معمولاً با افزایش دقت مدل با هزینه شدت محاسباتی همراه است. رایجترین مدلهای هوش مصنوعی با دقت بالا، ممیز شناور 32 بیتی و 16 بیتی هستند، در حالی که مدلهای سریعتر، کمدقت و کممصرف، معمولاً از دقت عدد صحیح 8 بیتی و 4 بیتی استفاده میکنند. استاندارد فعلی صنعت برای اندازهگیری استنتاج هوش مصنوعی در TOPS، در دقت INT8 است.
برای محاسبه TOPS، باید با ابتدا واحد کوچکتر آن یعنی OPS شروع کرد که مساوی است با دو برابر تعداد واحدهای MAC ضربدر فرکانس کاری آنها. TOPS تعداد OPS تقسیم بر یک تریلیون است که لیست کردن و مقایسه آن را سادهتر میکند، یعنی:
TOPS = (2 x MAC تعداد واحدهای x فرکانس) / 1 تریلیون
TOPS و عملکرد دنیای واقعی
اگرچه واحد تریلیون عملیات در ثانیه بینش ارزشمندی درباره قابلیتهای واحدهای پردازش عصبی (NPU) ارائه میدهد، اما هنوز باید فاصله بین معیارهای نظری و کاربردهای دنیای واقعی را پر کنیم. در واقع، یک عدد TOPS بالا به تنهایی تضمینکننده عملکرد بهینه هوش مصنوعی نیست؛ بلکه مجموعهای از عوامل مختلف است که در کنار هم توانایی واقعی یک NPU را تعیین میکنند. این بدان معناست که هنگام ارزیابی عملکرد NPU، جنبههایی مانند پهنای باند حافظه، بهینهسازی نرمافزار و یکپارچگی سیستم را نیز در نظر بگیرید.
بنچمارکها میتوانند به ما کمک کنند تا فراتر از اعداد نگاه کنیم و درک کنیم که NPUها چگونه در سناریوهای دنیای واقعی عمل میکنند، جایی که تأخیر، توان عملیاتی و بهرهوری انرژی اهمیت بیشتری نسبت به گذشته دارند. بنچمارک هوش مصنوعی Procyon از شش مدل بار کاری واقعی برای کمک به ترجمه اندازهگیری نظری TOPS به پاسخگویی و قابلیتهای پردازشی استفاده میکند که یک کاربر میتواند در برنامههای واقعی که از استنتاج هوش مصنوعی استفاده میکنند، انتظار داشته باشد.
مدلهای مشابه به طور فزایندهای در حوزههای بهرهوری، رسانه، تولید محتوا و سایر کاربردها رایج بوده که در این زمینه نیز عملکرد سریعتر در Procyon AI و سایر معیارها با استنتاج سریعتر و تجربه کاربری بهتر مرتبط است. در نهایت باید گفت که معیارهای عملکرد باید از منظر عملیگرایی و واقعگرایی مورد بررسی قرار گیرند.
تفاوت TOPS و FLOPS
اگر از افراد علاقهمند به دنیای پردازش و کامپیوتر باشید بدون شک با واحد فلاپس غریبه نیستید. این واحد که اولین بار در سال 1985 به صورت یک استاندارد IEEE عنوان شد اگرچه شباهت ظاهری زیادی با تاپس دارد ولی در ماهیت عملکردی و کاربردی بسیار با آن متفاوت است. در خصوص مقایسه TOPS با دیگر واحدهای محاسباتی باید گفت که هر دو واحد TOPS و FLOPS برای اندازهگیری سرعت محاسبات به کار میروند، اما TOPS به طور خاص برای محاسباتی که در هوش مصنوعی و یادگیری ماشین استفاده میشوند، مناسبتر است.
- FLOPS: مخفف Floating-point Operations Per Second و به معنای تعداد عملیات ممیز شناور در ثانیه است. FLOPS به طور کلی برای سنجش قدرت پردازندههای مرکزی (CPU) استفاده میشود و اصول محاسبه آن اعداد ممیز شناور است.
- TOPS: همانطور که گفته شد، برای سنجش قدرت پردازندههای گرافیکی (GPU) و واحدهای پردازش عصبی (NPU) به کار میرود و اصول محاسبه آن اعداد صحیح است.
با این اوصاف طبیعی است که میزان توان پردازشی FLOPS و TOPS یک پردازنده با هم یکسان نباشد.
واحد TOPS در پردازنده های امروزی
همه موارد بالا را گفتیم که ببینیم قدرت محاسباتی با واحد TOPS در یک پردازنده تا چه حد کاربرد دارد. اما این پردازندهها به صورت ویژه چه محصولاتی هستند؟ در ادامه سعی میکنیم استفاده از واحد سنجش میزان توان پردازش هوش مصنوعی TOPS را در آخرین محصولات تیمهای آبی و قرمز دنیای پردازنده با هم مورد بررسی قرار دهیم.
پردازندههای Core Ultra "Meteor Lake"
در مطلبی که Windows Central از منابع نزدیک به مایکروسافت، در مورد تاپس نوشته اطلاعات جالبی در مورد پشتیبانی پردازندههای شرکتهای مختلف از پردازش هوش مصنوعی با لحاظ کردن اطلاعات مربوط به TOPS درج شده است. طبق این اطلاعات، اینتل برای پردازندههای لپتاپ جدید خود از خانواده Meteor Lake، در مجموع ۳۴ تریلیون عملیات در ثانیه عملکرد را وعده داده که حدود ۱۱.۵ تاپس آن مربوط به NPU است. نسل بعدی تراشههای موبایل اینتل، "Lunar Lake"، انتظار میرود تا قدرت محاسباتی با واحد TOPS را به عدد 48 برساند.
تیم آبی برای توصیف بهتر عملکرد، اصطلاحات جدیدی معرفی کرده و در آن مجموع توان پردازش پلتفرمی را مد نظر قرار داده است. Platform TOPS یا PTOPS برای محاسبه مجموع عملکرد پردازنده، کارت گرافیک و NPU استفاده میشود و Peak TOPS یا pTOPS برای نشان دادن عملکرد هر قطعه به کار میرود. اینتل میگوید تراشههای Lunar Lake دارای NPU با ۴۸ pTOPS و عملکرد کلی ۱۲۸ PTOPS خواهند بود.
همچنین، این شرکت در تور فناوری ۲۰۲۴ خود در تایوان، به قابلیت اجرای ویژگیهای Copilot+ مایکروسافت بر روی واحدهای پردازش عصبی جدید (خانواده Meteor Lake که حدود ۱۱.۵ pTOPS توان دارند) در آینده اشاره کرد.
در همین رابطه بخوانید:
- هوش مصنوعی Copilot ویندوز 11 چیست و چه قابلیتهایی دارد؟
AMD Ryzen 8040 و Ryzen AI 300
پردازندههای موبایل Ryzen 8040 AMD تا ۱۶ TOPS عملکرد NPU ارائه میدهند که کمی بیشتر از تراشههای Meteor Lake اینتل است. همچنین، APUهای دسکتاپ Ryzen PRO AMD برای کاربران حرفهای نیز با NPU ۱۶ TOPS در دسترس هستند. این تراشهها در حال حاضر در بازار عرضه شدهاند، اما علاقهمندان به عملکرد هوش مصنوعی باید منتظر عرضه تراشههای Ryzen AI 300 AMD باشند که در Computex 2024 معرفی شدند.
دو پردازنده موبایل جدید AMD مبتنی بر معماری Zen 5، یعنی Ryzen AI 9 HX 370 و Ryzen AI 9 365، هر کدام دارای NPU با ۵۰ TOPS قدرت پردازشی هستند. لپتاپهای مجهز به تراشههای Ryzen AI 300 از اواخر سال 2024 توسط Acer، ASUS، HP، Lenovo و MSI عرضه خواهند شد.
Qualcomm Snapdragon X و Copilot+
مایکروسافت و کوالکام در اوایل سال 1403 از قابلیت هوش مصنوعی ویژه ویندوز با نام Copilot+ رونمایی کردند. Copilot+ یک اصطلاح کلی برای مجموعهای از ویژگیهای پیشرفته هوش مصنوعی است که شامل Windows Recall، Live Caption و ایجاد تصویر و متن به صورت محلی و روی دستگاه بدون نیاز به اینترنت میشود.
در همین زمینه برند Copilot+ PC برای لپتاپهایی استفاده میشود که قادر به اجرای این ویژگیها به صورت محلی با کمک NPU قدرتمند با حداقل ۴۰ TOPS باشند. کوالکام در رویداد معرفی این برند نیز از تعدادی لپتاپ Copilot+ با تراشههای Snapdragon X Elite و Snapdragon X Plus رونمایی کرد.
در همین رابطه بخوانید:
- قابلیت AutoSR برای ویندوز 11 منتشر شد؛ FPS بیشتر با هوش مصنوعی
- از لنوو و دل تا سامسونگ و ایسر؛ معرفی لپتاپهای بر پایه ARM با تراشه Snapdragon X Elite
- برنامه مدیاتک برای توسعه پردازنده ARM برای پلتفرم +Copilot مایکروسافت
این دستگاههای با ویندوز بر پایه ARM از شرکتهای بزرگ تولیدکننده لپتاپ، از واحد NPU Hexagon با ۴۵ تریلیون عملیات در ثانیه استفاده میکنند و اولین کامپیوترهای Copilot+ خواهند بود که از خرداد ماه 1403 وارد بازار شدهاند. تراشههای نسل بعدی اینتل Lunar Lake و AMD Ryzen AI 300 نیز در آینده به ویژگیهای Copilot+ دسترسی خواهند داشت.
همچنین در Computex 2024 اعلام شد که دستگاههای مجهز به پردازندههای گرافیکی RTX انویدیا نیز در آینده به Copilot+ دسترسی خواهند داشت.
چرا عملکرد هوش مصنوعی با TOPS اندازه گیری می شود؟
بدیهی است که TOPS تصویر کاملی از عملکرد NPU ارائه نمیدهد. سازندگان تراشهها برای تبلیغ محصولات خود به TOPS تکیه میکنند تا عملکرد را ساده کرده و به خریداران در فهم بهتر توان پردازشی محصولاتی که میخرند، کمک کنند. شاید در این زمینه بتوان شوق و علاقه شرکتها بر اعلام میزان TOPS محصولات تولیدیشان را به جنون شرکتهای سونی و مایکروسافت در تبلیغ میزان TFLOPs کنسولهای نسل جدید در سال ۲۰۲۰ تشبیه کرد.
یک NPU با دو یا سه برابر قدرت محاسباتی با واحد TOPS نسبت به رقیب خود روی کاغذ بهتر به نظر میرسد، اما این معیار فاقد ظرافت لازم در بیان توان پردازشی است. از نظر تئوری، یک NPU خاص با ۱۰۰ تریلیون عملیات در ثانیه ممکن است برای یک کار خاص تنظیم شده باشد و در آن کار از NPU دیگری با ۲۰۰ TOPS که برای کار دیگری تنظیم شده است، بهتر عمل کند.
سنجش عملکرد کلی یک رایانه معمولاً به اعداد مشخص بنچمارک و مشاهدات انتزاعی خلاصه میشود. به عنوان مثال، در بررسی لپتاپها، اعداد صریح با استفاده از نرمافزار تست تخصصی ارائه میشود تا یک احساس کلی از عملکرد سیستم در سناریوهای دنیای واقعی ارائه شود.
بنابراین، حتی اگر TOPS بهترین معیار برای سنجش عملکرد NPU نباشد، به خریداران یک استاندارد میدهد تا بتوانند تقریباً رایانههای مجهز به هوش مصنوعی را با هم مقایسه کنند.
آیا باید به TOPS اهمیت دهیم؟
یکی از مزایای استفاده از TOPS آن است که این معیار، راهی سریع و آسان برای مقایسه NPUها یا قضاوت در مورد توانایی یک NPU برای انجام کارهای خاص است. با این حال، TOPS نباید به عنوان معیار نهایی برای قدرت NPU در نظر گرفته شود. پیچیدگیهای زیادی وجود دارد و باید مطمئن شوید که سختافزار مناسب برای کار مورد نظر خود را دریافت میکنید.
اگر شما یک کاربر معمولی هستید که عمده کاربرد شما از کامپیوترتان ارسال و دریافت پیام یا ایمیل، مرور وب و امور اداری است، میتوانید بدون نگرانی در مورد NPU و روشهای اندازهگیری عملکرد آن به استفاده از PC یا لپتاپ خود ادامه دهید. در واقع نقش TOPS در تحلیل دادهها بیشتر ارتباط با عملیات هوش مصنوعی دارد.
در نقطه مقابل اگر به دنبال خرید لپتاپ جدید هستید و بیشتر با ابزارهایی کار خواهید کرد که در آنها از الگوهای هوش مصنوعی استفاده شده یا این روند در حال افزایش است، شاید بهتر باشد به توان پردازشی TOPS آنها نیز توجه کنید.
از سوی دیگر، اگر به دنیای نوظهور رایانههای مجهز به هوش مصنوعی علاقهمند هستید، NPUها و قابلیتهای آنها که با TOPS اندازهگیری میشوند، احتمالاً موضوعات آشنایی هستند. فقط مطمئن شوید که تاپس معیار کاملی نیست و تنها راهی آسان برای سازندگان تراشه برای مقایسه و تبلیغ محصولاتشان است.
جمع بندی و پاسخ به سوالات پرتکرار
واحد TOPS نقش محوری در پیشرفت فناوریهای هوش مصنوعی ایفا میکند. با افزایش پیچیدگی مدلهای یادگیری ماشین و گسترش کاربردهای هوش مصنوعی در صنایع مختلف، نیاز به پردازندههای قدرتمندتر با توان محاسباتی بالاتر بیش از پیش احساس میشود. TOPS به عنوان یک معیار استاندارد، امکان مقایسه و انتخاب NPUهای مناسب برای کاربردهای مختلف را فراهم کرده و به پیشرفت سریعتر این حوزه کمک میکند. با توجه به پیشرفتهای اخیر در زمینه معماری پردازندهها و فناوریهای ساخت، انتظار میرود در آینده شاهد افزایش چشمگیر توان محاسباتی NPUها و گسترش کاربردهای TOPS در صنایع مختلف باشیم.
با ظهور فناوریهای جدید مانند محاسبات کوانتومی و هوش مصنوعی فراگیر، ممکن است نیاز به تعریف معیارهای عملکرد جدیدی باشد. با این حال، قدرت محاسباتی با واحد TOPS در آینده نزدیک همچنان به عنوان یک معیار مهم برای سنجش توان محاسباتی NPUها باقی خواهد ماند.
تفاوت بین TOPS و FLOPS چیست؟
TOPS بهطور خاص برای اندازهگیری توان محاسباتی واحدهای پردازش عصبی (NPU) در هوش مصنوعی طراحی شده و بر عملیات ضرب-جمع (MAC) و عملیات محاسبات عدد صحیح تمرکز دارد. FLOPS یک واحد کلیتر است که تعداد کل عملیات نقطه شناور را در ثانیه اندازهگیری میکند. TOPS برای مقایسه عملکرد NPUها دقیقتر و تخصصیتر است.
چه مزایایی در استفاده از واحد TOPS وجود دارد؟
TOPS با تمرکز بر عملیات MAC، مقایسه عملکرد NPUها را در حوزه هوش مصنوعی سادهتر میکند. همچنین، استفاده از واحد تریلیون، اعداد بسیار بزرگ را به شکلی قابل فهمتر نمایش میدهد و به عنوان یک استاندارد در صنعت هوش مصنوعی پذیرفته شده است.
کاربردهای TOPS در فناوریهای نوین کداماند؟
TOPS برای ارزیابی عملکرد پردازندههای مورد استفاده در دستگاههای هوشمند، خودروهای خودران، رباتها، سیستمهای تشخیص تصویر، مدلهای پیچیده یادگیری ماشین، سیستمهای ترجمه ماشینی و دستگاههای واقعیت مجازی به کار میرود. بهطور خلاصه، «تریلیون عملیات در ثانیه» در هر جایی که محاسبات پیچیده هوش مصنوعی مورد نیاز است، کاربرد دارد.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت