علی بابا یک مدل جدید به خانواده هوش مصنوعی Qwen اضافه کرده است. این ابزار تازه که برای ویرایش تصویر استفاده میشود با نام Qwen-Image Edit معرفی شده و یک مدل متنباز است که تنها با چند دستور ساده متنی میتواند ویرایشهایی انجام دهد که پیشتر نیازمند نرمافزارهای حرفهای مثل فتوشاپ بود.
این مدل بر پایه Qwen-Image ساخته شده است. مدلی که بهخاطر توانایی بالایش در رندر متون پیچیده به زبانهای چینی و انگلیسی شناخته میشود. Qwen-Image Edit با بهرهگیری از معماری Dual Encoding قادر است همزمان معنای کلی تصویر را درک کند و جزئیات بصری آن را حفظ نماید.
همین ترکیب باعث دقت بالای آن در دو نوع ویرایش متفاوت شده است. ویرایش معنایی که مفهوم کلی صحنه را تغییر میدهد در حالی که هویت اشیاء اصلی باقی میماند. در این رابطه میتوان به تبدیل نمای منهتن به یک شهر لگویی یا بازسازی تصاویر در سبک انیمههای استودیو جیبلی اشاره کرد.
قابلیتهای هیجانانگیز Qwen-Image Edit
همچنین ویرایش ظاهری که تغییرات موضعی و دقیق بدون دستزدن به کل تصویر را انجام میدهد. برای نمونه میتوان به حذف یک تار مو از پرتره، افزودن تابلوی تبلیغاتی همراه با انعکاس آن در آب یا تغییر رنگ یک کاراکتر در متن اشاره کرد.
یکی از ویژگیهای شاخص این مدل، ویرایش متن در تصاویر است. کاربران میتوانند متنهای موجود در عکس را تغییر دهند یا متن جدیدی اضافه کنند و در عین حال فونت و سبک اصلی کاملاً حفظ شود. این قابلیت برای ویرایش پوسترها یا آثار خوشنویسی بسیار ارزشمند است.
Qwen-Image Edit تحت مجوز Apache 2.0 و بهصورت متنباز منتشر شده است. بنابراین توسعهدهندگان و شرکتها میتوانند آن را رایگان دانلود کرده و روی سختافزار خود اجرا کنند. همچنین این مدل از طریق Qwen Chat، پلتفرم Hugging Face و API ابری علیبابا (با هزینه 0.045 دلار برای هر تصویر) نیز در دسترس است.
در همین رابطه بخوانید:
- DeepSeek را فراموش کنید؛ هوش مصنوعی Qwen2.5-Max علی بابا با امکانات پیشرفتهتر از راه رسید!
- معرفی و مقایسه 27 چت بات هوش مصنوعی برتر سال 2025
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت