DeepSeek با دستیابی به روشی نوین در پردازش هوش مصنوعی، معادلات صنعت را به چالش کشیده است. این شرکت توانسته مدل زبانی Mixture-of-Experts (MoE) خود را با ۶۷۱ میلیارد پارامتر، روی یک کلاستر متشکل از تنها ۲۰۴۸ پردازنده گرافیکی Nvidia H800، ظرف دو ماه آموزش دهد. نتیجه این کار، بهبود ده برابری کارایی نسبت به شرکتهایی مانند متا بوده است. جزئیات را در ادامه خبر بخوانید.
در این روش DeepSeek به جای تکیه بر استاندارد رایج CUDA، از برنامهنویسی سطح پایین PTX (Parallel Thread Execution) انویدیا بهره برده است.
تحولی در برنامهنویسی پردازندههای گرافیکی
PTX که بهعنوان یک مجموعه دستورالعمل میانی برای پردازندههای گرافیکی انویدیا شناخته میشود، بین زبانهای سطح بالایی مانند ++CUDA C و کد ماشین سطح پایین (SASS) قرار میگیرد. این معماری نزدیک به سختافزار، به توسعهدهندگان اجازه میدهد تا بهینهسازیهای دقیقی مانند تخصیص ثباتها (register allocation) و تنظیمات در سطح تِرِد (thread) و وُرپ (warp) انجام دهند؛ اقداماتی که در محیط CUDA بهسادگی ممکن نیست. در نهایت، PTX به SASS تبدیل شده و برای نسل خاصی از پردازندههای انویدیا بهینه میشود.
DeepSeek در مدل V3 خود، دست به تغییرات اساسی در پردازندههای H800 انویدیا زده است. از ۱۳۲ واحد SM، این شرکت ۲۰ واحد را برای ارتباطات سرور به سرور اختصاص داده است؛ احتمالاً برای فشردهسازی و رفع محدودیتهای اتصال پردازنده، با هدف افزایش سرعت پردازش دادهها. علاوه بر این، DeepSeek الگوریتمهای پیشرفتهای برای بهینهسازی پایپ لاین پردازشی به کار گرفته است که شامل تنظیمات دقیق در سطح تِرِد و وُرپ میشود.
هرچند استفاده از PTX و دسترسی مستقیم به منابع سختافزاری، کارایی را به شکل چشمگیری افزایش میدهد، اما توسعه و نگهداری این روش بسیار دشوار است. این سطح از بهینهسازی، نیازمند مهارت فنی بالایی بوده و تنها تعداد معدودی از تیمهای مهندسی قادر به اجرای آن هستند. در شرایطی که کمبود جهانی پردازندههای گرافیکی و تحریمهای ایالات متحده بر دسترسی به سختافزار تأثیر گذاشته است، DeepSeek با این نوآوری توانسته پاسخی خلاقانه به این چالشها بدهد.
در همین رابطه بخوانید:
- دیپ سیک چیست؟ چطور از هوش مصنوعی DeepSeek استفاده کنیم؟
با انتشار این خبر، برخی سرمایهگذاران نگران شدند که در آینده، نیاز به سختافزارهای قدرتمند برای آموزش مدلهای هوش مصنوعی کاهش یابد؛ موضوعی که میتواند بر فروش شرکتهایی مانند انویدیا تأثیر منفی بگذارد. با این حال، پَت گِلسینگر، مدیرعامل پیشین اینتل، معتقد است که هوش مصنوعی از تمام توان پردازشی در دسترس استفاده خواهد کرد و این پیشرفت DeepSeek، راه را برای گسترش هوش مصنوعی در دستگاههای ارزانتر هموار میکند. با وجود این، هنوز مشخص نیست که DeepSeek برای دستیابی به این موفقیت، چه میزان سرمایهگذاری انجام داده است.
این پیشرفت، میتواند مسیر تحقیقات و توسعه در حوزه هوش مصنوعی را تغییر دهد و نشان میدهد که نرمافزار، حتی در دوران کمبود سختافزار، همچنان میتواند برگ برندهای برای رقابت باشد.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت