در دنیای امروز، مدلهای هوش مصنوعی به قدری بزرگ و پیچیده شدهاند که مصرف تراشهها به شدت افزایش یافته است. این موضوع باعث کمبود تراشه و هزینههای سرسامآور برای توسعهدهندگان شده است. هواوی با معرفی نرمافزار Flex:ai وعده داده که بدون خرید سختافزار جدید، میتوان سرعت پردازشهای عظیم هوش مصنوعی را تا هزار برابر افزایش داد و بهرهوری تراشهها را به شکل قابل توجهی بالا برد.
از بحران کارت گرافیک گرفته تا کمبود شدید حافظه رم که این روزها با آن دست و پنجه نرم میکنیم، همه و همه فقط یک مقصر دارد و آن ولع سیریناپذیر تب ایجاد شده در شرکتها برای ساخت سرورهای بیشتر پردازش هوش مصنوعی و یادگیری ماشین است. در این شرایط که سختافزارها بیش از پیش از سوی شرکتها سفارش داده شده و احساس نیاز بیپایانی به آنها احساس میشود، شاید راه نجات ما، تکیه بر بهینهسازی نرمافزاری باشد و نه خرید سختافزارهای بیشتر و قویتر!
تکیه بر نرمافزار بهینهتر به جای سختافزار قویتر
با همین تفکر، شرکت هواوی راهکاری نرمافزاری به نام Flex:ai را معرفی کرده که بدون نیاز به افزودن سختافزار جدید، امکان افزایش بهرهوری و سرعت پردازش تراشههای هوش مصنوعی را به شکل چشمگیری فراهم میکند.
Flex:ai یک نرمافزار متنباز است که برای افزایش بهرهوری تراشههای هوش مصنوعی در خوشههای پردازشی بزرگ طراحی شده است. این ابزار بر پایه Kubernetes ساخته شده و قرار است از طریق جامعه توسعهدهندگان ModelEngine هواوی منتشر شود. هواوی ادعا میکند که Flex:ai میتواند متوسط استفاده واقعی از GPU و NPU را حدود ۳۰ درصد افزایش دهد و حتی به چین کمک کند تا «... یک تراشه هوش مصنوعی آنالوگ را هزار برابر سریعتر از تراشههای انویدیا بسازد».

چگونه Flex:ai مشکل محدودیت تراشه را حل میکند؟
از دید فنی، Flex:ai با تقسیم هر کارت GPU یا NPU به چند نمونه محاسباتی مجازی، امکان اجرای همزمان چندین بار کاری را فراهم میکند. این روش باعث میشود وظایف کوچک که معمولاً از ظرفیت کامل شتابدهنده استفاده نمیکنند، بهتر پردازش شوند و مدلهای بزرگتر که ظرفیت یک کارت را پر میکنند، روی چندین کارت پخش شوند.
یکی از ویژگیهای کلیدی این ابزار، زمانبند هوشمند Hi Scheduler است که منابع بلااستفاده را در زمان واقعی میان گرهها توزیع کرده و بهصورت خودکار محاسبات را به جایی که بار کاری هوش مصنوعی در صف قرار دارد، منتقل میکند.
معماری و قابلیتهای ویژه
با توجه به طراحی Flex:ai بر پایه Kubernetes، این بسته نرمافزاری قابلیتهایی را ارائه میدهد که در پیادهسازیهای متنباز رایج کمتر دیده میشوند. Kubernetes از پلاگینهای سختافزاری برای دسترسی به شتابدهندهها پشتیبانی میکند و زمانبندهایی مانند Volcano یا چارچوبهایی مثل Ray امکان تخصیص جزئی و زمانبندی گروهی را فراهم میآورند. Flex:ai این قابلیتها را در یک سطح بالاتر یکپارچه کرده و پشتیبانی از NPUهای Ascend را در کنار GPUهای استاندارد فراهم میکند.
این ابزار شباهت زیادی به پلتفرم Run:ai دارد که در سال ۲۰۲۴ توسط انویدیا خریداری شد و امکان زمانبندی چندکاربره و اولویتبندی بار کاری در خوشههای بزرگ GPU را فراهم میکند. با این تفاوت که نسخه هواوی با تمرکز بر متنباز بودن و سازگاری میان شتابدهندهها طراحی شده و میتواند اهمیت بیشتری در خوشههای مبتنی بر تراشههای چینی، به ویژه Ascend، داشته باشد.
زمان عرضه و انتشار عمومی
تا کنون کد متنباز Flex:ai منتشر نشده و هواوی مستندات و معیارهای عملکردی آن را ارائه نکرده است. پس از انتشار، پرسشهای کلیدی شامل جزئیات تقسیمبندی، تعامل با زمانبندهای استاندارد Kubernetes و پشتیبانی از انواع GPUهای رایج خواهد بود.
ذکر این نکته قابل توجه است که طبق اعلام هواوی محققانی از دانشگاههای Shanghai Jiao Tong، Xi’an Jiaotong و Xiamen در توسعه این ابزار مشارکت داشتهاند. این بدان معناست که این ابزار کاملاً چینی است و فناوری بومی این کشور است که البته میتواند به صورت متنباز نیز در اختیار محققان و مهندسان دیگر نیز قرار گیرد.












نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت