هنوز چند روزی از معرفی هوش مصنوعی جنجالی DeepSeek نگذشته که علی بابا به تازگی از یک مدل هوش مصنوعی با نام Qwen 2.5 رونمایی کرده که بر اساس ادعای این شرکت از مدل DeepSeek-V3 بسیار بهتر عمل میکند. در ادامه به بررسی عملکرد هوش مصنوعی جدید علی بابا خواهیم پرداخت.
بر اساس اعلام علی بابا، مدل جدید Qwen2.5-Max در بنچمارکهایی مانند Arena-Hard و LiveCodeBench و GPQA-Diamond خیلی بهتر از DeepSeek V3 عمل میکند. عملکرد مدل جدید علی بابا در بنچمارکهای دیگر تقریباً برابر با دیپ سیک است.
عملکرد فوق العاده هوش مصنوعی Qwen2.5-Max
بر اساس گزارش neowin ظاهراً عملکرد مدل Qwen 2.5 از GPT-4o و Llama-3.1-405B در بخشهای مختلف بسیار بهتر است. کاربران میتوانند در Alibaba Cloud به این مدل هوش مصنوعی دسترسی داشته باشند. همچنین میتوان با این مدل قدرتمند هوش مصنوعی، عکس و ویدیو نیز تولید کرد.
Qwen2.5-Max را میتوان یک مدل MoE در مقیاس بزرگ دانست که روی بیش از 20 تریلیون توکن و با روشهای تنظیم دقیق نظارتشده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) آموزش دیده است.
مدلهای MoE بدون نیاز به سرورهای قدرتمند آموزش دیده تا هزینه زیرساختها را 40 تا 60 درصد کاهش دهند. چینیها نشان دادند که میتوان با بهینهسازی معماری هوش مصنوعی مدلهایی کمهزینه و کارآمد توسعه داد.
در همین رابطه بخوانید:
- دیپ سیک چیست؟ چطور از هوش مصنوعی DeepSeek استفاده کنیم؟
- انفجار دوم DeepSeek در صنعت هوش مصنوعی: مدل تصویرساز Janus-Pro منتشر شد
عملکرد این مدل در مقوله تولید کد با امتیاز 38.7 درصد در بنچمارک LiveCodeBench و استدلال با امتیاز 89.4 درصد در Arena-Hard نشان از برتری مدلهای هوش مصنوعی جدید بهینه با هزینه کمتر بوده تا بتوانند مدلهای بزرگ مانند Chat GPT را به چالش بکشند.
کاربران میتوانند از همین حالا به سایت qwenlm رفته و مدل هوش مصنوعی Qwen2.5-Max را امتحان کنند. اکنون باید دید که آیا مدل جدید علیبابا میتواند در رقابت با دیپسیک و مدلهای آمریکایی عملکرد قابلقبولی داشته باشد یا خیر.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت