استارتاپ چینی دیپ‌سیک (DeepSeek) با ادعای آموزش مدل R1 تنها با 2,048 پردازنده‌ی گرافیکی و 6 میلیون دلار، توجهات را جلب کرد. اما گزارش SemiAnalysis نشان می‌دهد که این شرکت در واقع 50 هزار پردازنده گرافیکی انویدیا دارد و تاکنون بیش از 1.6 میلیارد دلار صرف سخت‌افزار کرده است؛ ادعایی که روایت رسمی دیپ‌سیک را زیر سؤال می‌برد.

طبق یافته‌های SemiAnalysis، دیپ‌سیک از شبکه‌ی گسترده‌ای از سخت‌افزارهای قدرتمند بهره می‌برد که شامل 10 هزار شتاب دهنده H800، تعداد 10 هزار شتاب دهنده H100 و تعداد نامشخصی از مدل H20 می‌شود. این سخت‌افزارها در چندین مرکز داده توزیع شده‌اند و علاوه بر آموزش مدل‌های هوش مصنوعی، در تحقیقات و مدل‌سازی مالی نیز به کار گرفته می‌شوند. مجموع هزینه‌های عملیاتی این شرکت تاکنون حدود 944 میلیون دلار برآورد شده است.

منابع هوش مصنوعی دیپ سیک

تردیدها درباره دیپ‌سیک

دیپ‌سیک که از دل صندوق سرمایه‌گذاری High-Flyer بیرون آمده، در سال 2023 به عنوان یک پروژه‌ی مستقل متمرکز بر هوش مصنوعی شکل گرفت. برخلاف بسیاری از استارتاپ‌های مشابه، دیپ‌سیک از منابع خودگردان تأمین مالی می‌شود که این امر به آن اجازه داده تا بدون وابستگی به سرویس‌های ابری خارجی، مراکز داده‌ی اختصاصی خود را راه‌اندازی کند. این استقلال زیرساختی نه تنها به کاهش هزینه‌های بلندمدت کمک کرده، بلکه امکان آزمایش‌های سریع‌تر و بهینه‌سازی مدل‌ها را نیز فراهم آورده است.

نهنگ دیپ سیک

یکی دیگر از ویژگی‌های غیرمعمول دیپ‌سیک در مقایسه با سایر شرکت‌های چینی، عدم جذب نیرو از تایوان و ایالات متحده است. بر اساس گزارش SemiAnalysis، این شرکت صرفاً استعدادهای داخلی چین را به کار می‌گیرد و تمرکز اصلی‌اش بر توانایی حل مسئله است، نه صرفاً مدارک دانشگاهی. این رویکرد باعث شده دیپ‌سیک موفق به جذب پژوهشگرانی با حقوق بیش از 1.3 میلیون دلار در سال شود؛ حتی بیش از شرکت‌های مطرحی همچون Moonshot.

یکی از نوآوری‌های کلیدی دیپ‌سیک، توسعه‌ی Multi-Head Latent Attention (MLA) است، روشی که ماه‌ها تحقیق و مصرف گسترده‌ی GPUها را در بر داشته است. با این حال، تمرکز اصلی این شرکت بر بهبودهای الگوریتمی به جای مقیاس‌پذیری صرف است، رویکردی که برخی آن را عاملی برای کاهش وابستگی به پردازنده‌های گرافیکی قدرتمند و تأثیر منفی بر فروش شرکت‌هایی مانند انویدیا می‌دانند.

در همین رابطه بخوانید:

- دیپ سیک چیست؟ 0 تا 100 هوش مصنوعی چینی DeepSeek
شاهکار هوش مصنوعی چینی DeepSeek؛ دور زدن CUDA با برنامه‌نویسی سطح پایین PTX
انقلابی در هوش مصنوعی؛ DeepSeek را می‌توان تنها با 30 دلار بازسازی کرد!

اما شاید بزرگ‌ترین ابهام پیرامون دیپ‌سیک، ادعای آن در مورد هزینه‌ی 6 میلیون دلاری آموزش مدل اخیرش باشد. گزارش‌های تحلیلی نشان می‌دهند که این رقم تنها مربوط به بخش پیش‌آموزش (Pre-training) است و هزینه‌های دیگر از جمله تحقیق، بهینه‌سازی مدل و زیرساخت‌های پردازشی در این برآورد لحاظ نشده‌اند. در حقیقت، تخمین‌ها حاکی از آن است که سرمایه‌گذاری دیپ‌سیک روی توسعه‌ی هوش مصنوعی تاکنون بیش از 500 میلیون دلار بوده است.

هزینه کاری دیپسیک

در نهایت، ظهور دیپ‌سیک نشان می‌دهد که یک استارتاپ مستقل با سرمایه‌گذاری هوشمندانه و جذب نیروهای مستعد می‌تواند رقبای بزرگ را به چالش بکشد. اما در عین حال، یافته‌های جدید SemiAnalysis این دیدگاه را تقویت می‌کند که هیچ معجزه‌ای در کار نیست؛ آنچه به موفقیت در دنیای هوش مصنوعی منجر می‌شود، میلیاردها دلار سرمایه، نوآوری‌های فنی و رقابت بر سر جذب استعدادها است؛ همان نکته‌ای که ایلان ماسک نیز پیش‌تر بر آن تأکید کرده بود.

نظر خود را اضافه کنید.

ارسال نظر بدون عضویت در سایت

0
نظر شما پس از تایید مدیر منتشر خواهد شد.

نظرات (4)

  • مهمان - رضا

    خوبه deepseek یک میلیون کارت گرافیک انویدیا ندارد
    وگرنه الان میگفتن این هوش مصنوعی روی یک میلیون کارت گرافیک انویدا اموزش دیده و صدمیلیارد دلار هزینه اموزش بوده :D

  • مهمان - مهمان

    خوبیش اینه که متن باز هست
    یعنی هر کسی میتونه این مدل رو بررسی کنه و بفهمه که به چه تعداد پردازش نیاز داره
    وقتی بازیگرهای بزرگ این صنعت مثه انویدیا و AMD و مایکروسافت و .... لب به تحسین باز کردند و دارن مدل هاشون رو بر اساس این دیپ سیک توسعه میدن دیگه تحلیل های غیر علمی و بر اساس گمانه زنی ارزشی نداره

  • مهمان - علیرضا

    باز هم مشخص شد چینی ها فقط کپی کاری، تقلب و دروغگویی کردن. کل سخت افزارهاشون ساخت آمریکا و تایوانه و نرم افزارشون هم کپی برداری از ChatGPT آمریکایی هست و کدها و دیتاهاشون رو هم به روش Distillation از ChatGPT استخراج کردن.

    قیمت های پایین و رایگان بودن مدل استاندارد شون هم فقط به خاطر حمایت دولت چینه. در واقع این شرکت برخلاف ظاهر خصوصی اش یک شرکت دولتیه. وگرنه که با وجود ۱.۶ میلیارد دلار خرجی که کردن، قیمت های پایین API شون غیرمنطقی بود. از نظر سانسور و ذخیره داده های کاربران و عدم رعایت حریم خصوصی کاربران هم که به شدت مشکوک هستن و سانسورهاشون احتمال دولتی بودن شون رو تقویت می‌کنه.

  • مهمان - برنامه نویس

    در پاسخ به: مهمان - علیرضا

    افرین دقیق و درست گفتی
    فقط دولت چین سوبسید داده که ارزون در بیاد و رقبا رو حذف کنه و بعد گرونش کنن

ورود به شهرسخت‌افزار

ثبت نام در شهر سخت افزار
ورود به شهر سخت افزار

ثبت نام در شهر سخت افزار

نام و نام خانوادگی(*)
لطفا نام خود را وارد کنید

ایمیل(*)
لطفا ایمیل خود را به درستی وارد کنید

رمز عبور(*)
لطفا رمز عبور خود را وارد کنید

شماره موبایل
Invalid Input

جزو کدام دسته از اشخاص هستید؟(*)

لطفا یکی از موارد را انتخاب کنید