علی بابا به تازگی از مدرنترین و بزرگترین مدل هوش مصنوعی خود با نام Qwen3-Max رونمایی کرده است. این مدل با بیش از یک تریلیون پارامتر به عنوان رقیب GPT5 یکی از قدرتمندترین سیستمهای هوش مصنوعی در جهان محسوب میشود و اکنون از طریق Qwen Chat در دسترس است.
مدل هوش مصنوعی Qwen3-Max با بیش از یک تریلیون پارامتر یکی از بزرگترین مدلهای ساخته شده تاکنون است. دادههای آموزشی آن شامل حدود 36 تریلیون توکن میشود و فرآیند آموزش آن شامل چهار مرحله پیشرفته است.
معماری جدید به این مدل اجازه میدهد که با وجود ابعاد عظیم، عملکردی بهینه و مقیاسپذیر داشته باشد. Qwen3-Max دو نسخه اصلی دارد. نسخه Instruct که برای مکالمه، کدنویسی و استدلال طراحی شده و نسخه Thinking نیز برای وظایف ایجنتی با قابلیت استدلال عمیق، اجرای کد، مرور وب و دسترسی به ابزارهای خارجی ساخته شده است.
فتح بنچمارکها توسط هوش مصنوعی Qwen3-Max
ایجنت Qwen3-Max قادر است به طور خودکار و مستقل اهداف تعیینشده توسط کاربر را پیگیری کرده و با کمترین دخالت انسانی، تصمیمگیری کند و اقدامات پیچیده را انجام دهد. بنچمارک Tau2-Bench نشان میدهد که این مدل با امتیاز 74.8 از رقبای قدرتمند مانند Claude Opus 4 و DeepSeek V3.1 پیشی گرفته است.
نسخه Instruct این مدل در بنچمارک SWE-Bench Verified امتیاز 69.6 کسب کرده که نشاندهنده توانایی مدل در تولید و اصلاح کدهای پیچیده است. این عملکرد، Qwen3-Max را به گزینهای مناسب برای تیمهای برنامهنویسی تبدیل میکند.
نسخه Thinking این مدل در بنچمارکهای ریاضی چالشبرانگیز مانند AIME25 و HMMT توانسته به امتیاز نزدیک به 100 درصد دست یابد. این نتایج نشان میدهد که ترکیب استدلال با ابزارهای جانبی به بهبود قابل توجه عملکرد مدل در مسائل پیچیده کمک میکند.
کاربران میتوانند از طریق Qwen Chat به عنوان رابط کاربری از مدل Qwen3-Max بهره ببرند. همچنین Model Studio کنترل کامل روی حالتهای Instruct و Thinking را فراهم میکند.
در همین رابطه بخوانید:
- رونمایی علی بابا از هوش مصنوعی Qwen-Image Edit؛ رقیب مجانی فتوشاپ از راه رسید
به صورت خلاصه مدل Qwen3-Max با بیش از یک تریلیون پارامتر تواناییهای خارقالعادهای در کدنویسی، حل مسائل ریاضی و اجرای ایجنتها دارد. این مدل نه تنها رقیبی جدی برای GPT-5 به حساب میآید، بلکه با ترکیب معماری MoE و آموزش گسترده روی دادههای 36 تریلیون توکنی، قابلیتهای خارقالعاده در پروژههای کدنویسی پیچیده دارد.
علیبابا همچنین برنامه دارد نسخههای تخصصیتر و سنگینتر Qwen3-Max-Thinking را توسعه دهد. این شرکت طی سه سال آینده بیش از 53 میلیارد دلار در زیرساختهای مرتبط با هوش مصنوعی سرمایهگذاری خواهد کرد تا جایگاه خود را در صدر فناوریهای هوش مصنوعی تثبیت کند.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت