شرکت چینی هوش مصنوعی DeepSeek، ساعتی قبل، پیشنمایشی از مدل هوش مصنوعی نسل جدید خود با عنوان V4 را منتشر کرد و گفت که این مدل منبع باز میتواند با مدلهای پیشرو از رقبای آمریکایی از جمله Anthropic، گوگل و OpenAI رقابت بسیار نزدیکی داشته باشد. آنطور که DeepSeek اعلام کرده است مدل V4 نسبت به نسخه پیشین خود بهبود قابل توجهی پیدا کرده است.
یک سال قبل بود که DeepSeek با مدل هوش مصنوعی R1 توانست توجهات بسیاری را به خود جلب کند و در حالی که انتظار نمیرفت با صرف هزینهای ناچیز رقیبی جدی برای مدلهای توسعه یافته در آمریکا منتشر کند. اکنون این شرکت توانسته است مدل هوش مصنوعی جدیدی با عنوان V4 را آماده انتشار کند که ماههاست خبرها و گزارشهای فراوانی از نحوه قدرت و عملکرد آن به گوش میرسد. با توجه به اینکه این مدل هوش مصنوعی نیز به صورت متن باز طراحی شده است انتشار آن از اهمیت زیادی برخوردار است.
براساس گزارش رویترز، دیپسیک امروز ضمن انتشار مدل هوش مصنوعی V4 خود اعلام کرد که آن بهبود قابل توجهی نسبت به مدلهای قبلی پیدا کرده است و به صورت ویژه در زمینه کدنویسی عملکرد بسیار خوبی از خود نشان میدهد. این مدل هوش مصنوعی در دو نسخه منتشر شده است که DeepSeek-V4-Pro و DeepSeek-V4-Flash نام دارند. مانند مدلهای قبلی این شرکت این دو مدل نیز به صورت متنباز طراحی شدهاند و توسعهدهندگان میتوانند به صورت رایگان از آن برای بهبود عملکرد محصولات مختلف خود استفاده کنند یا آن را به دلخواه تغییر دهند.
هوش مصنوعی DeepSeek V4 بالاتر از بسیاری از رقیبان
دیپسیک در اطلاعیهای اعلام کرده است که DeepSeek-V4-Pro تمام مدلهای رقیب منبع باز را در زمینه ریاضیات و کدنویسی شکست میدهد، و در زمینه دانش عمومی جهان تنها پس از Google Gemini 3.1-Pro، که یک مدل بسته است، قرار میگیرد. به گفته این شرکت عملکرد نسخه Pro از این مدل تنها «تا حد کمی کمتر» از GPT-5.4 و Gemini 3.1-Pro است «که نشاندهنده یک مسیر توسعهای است که تقریباً 3 تا 6 ماه از مدلهای پیشرفته مرزی عقبتر است». آنطور که دیپسیک اعلام کرده مدل Flash قابلیتهای استدلالی مشابه نسخه Pro دارد، در حالی که زمان پاسخ سریعتر و هزینه مصرف «بسیار مقرون به صرفهای» را ارائه میدهد.
ارتقای عملکرد مدل هوش مصنوعی V4 در کدنویسی قابلیتی بسیار مهم محسوب میشود؛ چرا که آن به هسته مرکزی عاملهای هوش مصنوعی (AI agents) تبدیل شده و به موفقیت ابزارهایی مانند ChatGPT Codex و Claude Code کمک بسیاری کرده است. این انتشار همچنین نقطه عطفی برای صنعت تراشه چین محسوب میشود؛ زیرا دیپسیک به طور مشخص با فناوریهای داخلی هواوی سازگاری دارد.
استفاده از تراشههای هواوی در آموزش مدل V4 صحت دارد؟
دیپسیک هزینههای آموزش مدل V4 یا سختافزاری که روی آن آموزش دیده را افشا نکرده است. مقامات آمریکایی این شرکت را به استفاده از تراشههای انویدیا که صادرات آنها به چین ممنوع است متهم کردهاند. شرکت آنتروپیک نیز ادعا میکند که دیپسیک از هوش مصنوعی Claude برای آموزش و بهبود محصولات خود سوء استفاده کرده است. برخی از منابع خبری اعلام کردهاند که دیپسیک برای توسعه و آموزش این مدل از پردازندههای هواوی در سری Ascend استفاده کرده است و دیگر به تراشههای انویدیا متکی نیست. این در حالی است که بیشتر مدلهای پیشرو از تراشههای انویدیا بهره میگیرند.
دیپسیک در زمان انتشار مدل R1 اعلام کرد که توانسته است با کسری از هزینه آموزش مدلهای آمریکایی آن را آماده انتشار کند. احتمالاً در مورد مدل V4 نیز همین رویه دنبال شده است. تاکنون برخی از تحلیلگران حوزه فناوری روایت دیپسیک از کار با چنین منابع اندکی را به چالش کشیدهاند و استدلال کردهاند که این استارتاپ به احتمال زیاد به بودجه بیشتر و تراشههای پیشرفتهتری نسبت به آنچه اعلام شده دسترسی داشته است.













نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت