شاهکار هوش مصنوعی چینی DeepSeek؛ دور زدن CUDA با برنامه‌نویسی سطح پایین PTX

توضیحات: خبات کریمی; دسته: اخبار فناوری; 10 بهمن 1403 10:00

DeepSeek با دستیابی به روشی نوین در پردازش هوش مصنوعی، معادلات صنعت را به چالش کشیده است. این شرکت توانسته مدل زبانی Mixture-of-Experts (MoE) خود را با ۶۷۱ میلیارد پارامتر، روی یک کلاستر متشکل از تنها ۲۰۴۸ پردازنده گرافیکی Nvidia H800، ظرف دو ماه آموزش دهد. نتیجه این کار، بهبود ده برابری کارایی نسبت به شرکت‌هایی مانند متا بوده است. جزئیات را در ادامه خبر بخوانید.

در این روش DeepSeek به جای تکیه بر استاندارد رایج CUDA، از برنامه‌نویسی سطح پایین PTX (Parallel Thread Execution) انویدیا بهره برده است.

تحولی در برنامه‌نویسی پردازنده‌های گرافیکی

PTX که به‌عنوان یک مجموعه دستورالعمل میانی برای پردازنده‌های گرافیکی انویدیا شناخته می‌شود، بین زبان‌های سطح بالایی مانند ++CUDA C و کد ماشین سطح پایین (SASS) قرار می‌گیرد. این معماری نزدیک به سخت‌افزار، به توسعه‌دهندگان اجازه می‌دهد تا بهینه‌سازی‌های دقیقی مانند تخصیص ثبات‌ها (register allocation) و تنظیمات در سطح تِرِد (thread) و وُرپ (warp) انجام دهند؛ اقداماتی که در محیط CUDA به‌سادگی ممکن نیست. در نهایت، PTX به SASS تبدیل شده و برای نسل خاصی از پردازنده‌های انویدیا بهینه می‌شود.

DeepSeek در مدل V3 خود، دست به تغییرات اساسی در پردازنده‌های H800 انویدیا زده است. از ۱۳۲ واحد SM، این شرکت ۲۰ واحد را برای ارتباطات سرور به سرور اختصاص داده است؛ احتمالاً برای فشرده‌سازی و رفع محدودیت‌های اتصال پردازنده، با هدف افزایش سرعت پردازش داده‌ها. علاوه بر این، DeepSeek الگوریتم‌های پیشرفته‌ای برای بهینه‌سازی پایپ لاین پردازشی به کار گرفته است که شامل تنظیمات دقیق در سطح تِرِد و وُرپ می‌شود.

شتاب دهنده هوش مصنوعی انویدیا

هرچند استفاده از PTX و دسترسی مستقیم به منابع سخت‌افزاری، کارایی را به شکل چشمگیری افزایش می‌دهد، اما توسعه و نگهداری این روش بسیار دشوار است. این سطح از بهینه‌سازی، نیازمند مهارت فنی بالایی بوده و تنها تعداد معدودی از تیم‌های مهندسی قادر به اجرای آن هستند. در شرایطی که کمبود جهانی پردازنده‌های گرافیکی و تحریم‌های ایالات متحده بر دسترسی به سخت‌افزار تأثیر گذاشته است، DeepSeek با این نوآوری توانسته پاسخی خلاقانه به این چالش‌ها بدهد.

در همین رابطه بخوانید:

- دیپ سیک چیست؟ چطور از هوش مصنوعی DeepSeek استفاده کنیم؟

با انتشار این خبر، برخی سرمایه‌گذاران نگران شدند که در آینده، نیاز به سخت‌افزارهای قدرتمند برای آموزش مدل‌های هوش مصنوعی کاهش یابد؛ موضوعی که می‌تواند بر فروش شرکت‌هایی مانند انویدیا تأثیر منفی بگذارد. با این حال، پَت گِلسینگر، مدیرعامل پیشین اینتل، معتقد است که هوش مصنوعی از تمام توان پردازشی در دسترس استفاده خواهد کرد و این پیشرفت DeepSeek، راه را برای گسترش هوش مصنوعی در دستگاه‌های ارزان‌تر هموار می‌کند. با وجود این، هنوز مشخص نیست که DeepSeek برای دستیابی به این موفقیت، چه میزان سرمایه‌گذاری انجام داده است.

این پیشرفت، می‌تواند مسیر تحقیقات و توسعه در حوزه هوش مصنوعی را تغییر دهد و نشان می‌دهد که نرم‌افزار، حتی در دوران کمبود سخت‌افزار، همچنان می‌تواند برگ برنده‌ای برای رقابت باشد.