استارتاپ چینی دیپسیک (DeepSeek) با ادعای آموزش مدل R1 تنها با 2,048 پردازندهی گرافیکی و 6 میلیون دلار، توجهات را جلب کرد. اما گزارش SemiAnalysis نشان میدهد که این شرکت در واقع 50 هزار پردازنده گرافیکی انویدیا دارد و تاکنون بیش از 1.6 میلیارد دلار صرف سختافزار کرده است؛ ادعایی که روایت رسمی دیپسیک را زیر سؤال میبرد.
طبق یافتههای SemiAnalysis، دیپسیک از شبکهی گستردهای از سختافزارهای قدرتمند بهره میبرد که شامل 10 هزار شتاب دهنده H800، تعداد 10 هزار شتاب دهنده H100 و تعداد نامشخصی از مدل H20 میشود. این سختافزارها در چندین مرکز داده توزیع شدهاند و علاوه بر آموزش مدلهای هوش مصنوعی، در تحقیقات و مدلسازی مالی نیز به کار گرفته میشوند. مجموع هزینههای عملیاتی این شرکت تاکنون حدود 944 میلیون دلار برآورد شده است.
تردیدها درباره دیپسیک
دیپسیک که از دل صندوق سرمایهگذاری High-Flyer بیرون آمده، در سال 2023 به عنوان یک پروژهی مستقل متمرکز بر هوش مصنوعی شکل گرفت. برخلاف بسیاری از استارتاپهای مشابه، دیپسیک از منابع خودگردان تأمین مالی میشود که این امر به آن اجازه داده تا بدون وابستگی به سرویسهای ابری خارجی، مراکز دادهی اختصاصی خود را راهاندازی کند. این استقلال زیرساختی نه تنها به کاهش هزینههای بلندمدت کمک کرده، بلکه امکان آزمایشهای سریعتر و بهینهسازی مدلها را نیز فراهم آورده است.
یکی دیگر از ویژگیهای غیرمعمول دیپسیک در مقایسه با سایر شرکتهای چینی، عدم جذب نیرو از تایوان و ایالات متحده است. بر اساس گزارش SemiAnalysis، این شرکت صرفاً استعدادهای داخلی چین را به کار میگیرد و تمرکز اصلیاش بر توانایی حل مسئله است، نه صرفاً مدارک دانشگاهی. این رویکرد باعث شده دیپسیک موفق به جذب پژوهشگرانی با حقوق بیش از 1.3 میلیون دلار در سال شود؛ حتی بیش از شرکتهای مطرحی همچون Moonshot.
یکی از نوآوریهای کلیدی دیپسیک، توسعهی Multi-Head Latent Attention (MLA) است، روشی که ماهها تحقیق و مصرف گستردهی GPUها را در بر داشته است. با این حال، تمرکز اصلی این شرکت بر بهبودهای الگوریتمی به جای مقیاسپذیری صرف است، رویکردی که برخی آن را عاملی برای کاهش وابستگی به پردازندههای گرافیکی قدرتمند و تأثیر منفی بر فروش شرکتهایی مانند انویدیا میدانند.
در همین رابطه بخوانید:
- دیپ سیک چیست؟ 0 تا 100 هوش مصنوعی چینی DeepSeek
- شاهکار هوش مصنوعی چینی DeepSeek؛ دور زدن CUDA با برنامهنویسی سطح پایین PTX
- انقلابی در هوش مصنوعی؛ DeepSeek را میتوان تنها با 30 دلار بازسازی کرد!
اما شاید بزرگترین ابهام پیرامون دیپسیک، ادعای آن در مورد هزینهی 6 میلیون دلاری آموزش مدل اخیرش باشد. گزارشهای تحلیلی نشان میدهند که این رقم تنها مربوط به بخش پیشآموزش (Pre-training) است و هزینههای دیگر از جمله تحقیق، بهینهسازی مدل و زیرساختهای پردازشی در این برآورد لحاظ نشدهاند. در حقیقت، تخمینها حاکی از آن است که سرمایهگذاری دیپسیک روی توسعهی هوش مصنوعی تاکنون بیش از 500 میلیون دلار بوده است.
در نهایت، ظهور دیپسیک نشان میدهد که یک استارتاپ مستقل با سرمایهگذاری هوشمندانه و جذب نیروهای مستعد میتواند رقبای بزرگ را به چالش بکشد. اما در عین حال، یافتههای جدید SemiAnalysis این دیدگاه را تقویت میکند که هیچ معجزهای در کار نیست؛ آنچه به موفقیت در دنیای هوش مصنوعی منجر میشود، میلیاردها دلار سرمایه، نوآوریهای فنی و رقابت بر سر جذب استعدادها است؛ همان نکتهای که ایلان ماسک نیز پیشتر بر آن تأکید کرده بود.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت