در دنیای امروز، مدل‌های هوش مصنوعی به قدری بزرگ و پیچیده شده‌اند که مصرف تراشه‌ها به شدت افزایش یافته است. این موضوع باعث کمبود تراشه و هزینه‌های سرسام‌آور برای توسعه‌دهندگان شده است. هواوی با معرفی نرم‌افزار Flex:ai وعده داده که بدون خرید سخت‌افزار جدید، می‌توان سرعت پردازش‌های عظیم هوش مصنوعی را تا هزار برابر افزایش داد و بهره‌وری تراشه‌ها را به شکل قابل توجهی بالا برد.

از بحران کارت گرافیک گرفته تا کمبود شدید حافظه رم که این روزها با آن دست و پنجه نرم می‌کنیم، همه و همه فقط یک مقصر دارد و آن ولع سیری‌ناپذیر تب ایجاد شده در شرکت‌ها برای ساخت سرورهای بیشتر پردازش هوش مصنوعی و یادگیری ماشین است. در این شرایط که سخت‌افزارها بیش از پیش از سوی شرکت‌ها سفارش داده شده و احساس نیاز بی‌پایانی به آنها احساس می‌شود، شاید راه نجات ما، تکیه بر بهینه‌سازی نرم‌افزاری باشد و نه خرید سخت‌افزارهای بیشتر و قوی‌تر!

تکیه بر نرم‌افزار بهینه‌تر به جای سخت‌افزار قوی‌تر

با همین تفکر، شرکت هواوی راهکاری نرم‌افزاری به نام Flex:ai را معرفی کرده که بدون نیاز به افزودن سخت‌افزار جدید، امکان افزایش بهره‌وری و سرعت پردازش تراشه‌های هوش مصنوعی را به شکل چشمگیری فراهم می‌کند.

Flex:ai یک نرم‌افزار متن‌باز است که برای افزایش بهره‌وری تراشه‌های هوش مصنوعی در خوشه‌های پردازشی بزرگ طراحی شده است. این ابزار بر پایه Kubernetes ساخته شده و قرار است از طریق جامعه توسعه‌دهندگان ModelEngine هواوی منتشر شود. هواوی ادعا می‌کند که Flex:ai می‌تواند متوسط استفاده واقعی از GPU و NPU را حدود ۳۰ درصد افزایش دهد و حتی به چین کمک کند تا «... یک تراشه هوش مصنوعی آنالوگ را هزار برابر سریع‌تر از تراشه‌های انویدیا بسازد».

felxai-2.jpg

چگونه Flex:ai مشکل محدودیت تراشه را حل می‌کند؟

از دید فنی، Flex:ai با تقسیم هر کارت GPU یا NPU به چند نمونه محاسباتی مجازی، امکان اجرای هم‌زمان چندین بار کاری را فراهم می‌کند. این روش باعث می‌شود وظایف کوچک که معمولاً از ظرفیت کامل شتاب‌دهنده استفاده نمی‌کنند، بهتر پردازش شوند و مدل‌های بزرگ‌تر که ظرفیت یک کارت را پر می‌کنند، روی چندین کارت پخش شوند.

یکی از ویژگی‌های کلیدی این ابزار، زمان‌بند هوشمند Hi Scheduler است که منابع بلااستفاده را در زمان واقعی میان گره‌ها توزیع کرده و به‌صورت خودکار محاسبات را به جایی که بار کاری هوش مصنوعی در صف قرار دارد، منتقل می‌کند.

معماری و قابلیت‌های ویژه

با توجه به طراحی Flex:ai بر پایه Kubernetes، این بسته نرم‌افزاری قابلیت‌هایی را ارائه می‌دهد که در پیاده‌سازی‌های متن‌باز رایج کمتر دیده می‌شوند. Kubernetes از پلاگین‌های سخت‌افزاری برای دسترسی به شتاب‌دهنده‌ها پشتیبانی می‌کند و زمان‌بندهایی مانند Volcano یا چارچوب‌هایی مثل Ray امکان تخصیص جزئی و زمان‌بندی گروهی را فراهم می‌آورند. Flex:ai این قابلیت‌ها را در یک سطح بالاتر یکپارچه کرده و پشتیبانی از NPUهای Ascend را در کنار GPUهای استاندارد فراهم می‌کند.

این ابزار شباهت زیادی به پلتفرم Run:ai دارد که در سال ۲۰۲۴ توسط انویدیا خریداری شد و امکان زمان‌بندی چندکاربره و اولویت‌بندی بار کاری در خوشه‌های بزرگ GPU را فراهم می‌کند. با این تفاوت که نسخه هواوی با تمرکز بر متن‌باز بودن و سازگاری میان شتاب‌دهنده‌ها طراحی شده و می‌تواند اهمیت بیشتری در خوشه‌های مبتنی بر تراشه‌های چینی، به ویژه Ascend، داشته باشد.

زمان عرضه و انتشار عمومی

تا کنون کد متن‌باز Flex:ai منتشر نشده و هواوی مستندات و معیارهای عملکردی آن را ارائه نکرده است. پس از انتشار، پرسش‌های کلیدی شامل جزئیات تقسیم‌بندی، تعامل با زمان‌بندهای استاندارد Kubernetes و پشتیبانی از انواع GPUهای رایج خواهد بود.

ذکر این نکته قابل توجه است که طبق اعلام هواوی محققانی از دانشگاه‌های Shanghai Jiao Tong، Xi’an Jiaotong و Xiamen در توسعه این ابزار مشارکت داشته‌اند. این بدان معناست که این ابزار کاملاً چینی است و فناوری بومی این کشور است که البته می‌تواند به صورت متن‌باز نیز در اختیار محققان و مهندسان دیگر نیز قرار گیرد.

نظر خود را اضافه کنید.

ارسال نظر بدون عضویت در سایت

0
نظر شما پس از تایید مدیر منتشر خواهد شد.
  • هیچ نظری یافت نشد

ورود به شهرسخت‌افزار

ثبت نام در شهر سخت افزار
ورود به شهر سخت افزار

ثبت نام در شهر سخت افزار

نام و نام خانوادگی(*)
لطفا نام خود را وارد کنید

ایمیل(*)
لطفا ایمیل خود را به درستی وارد کنید

رمز عبور(*)
لطفا رمز عبور خود را وارد کنید

شماره موبایل
Invalid Input

جزو کدام دسته از اشخاص هستید؟(*)

لطفا یکی از موارد را انتخاب کنید