هوش مصنوعی Veo 3.1 گوگل رونمایی شد؛ عکس بدهید ویدیوی صدادار تحویل بگیرید [تماشا کنید]

توضیحات: جواد نیک‌قلم; دسته: اخبار فناوری; 24 مهر 1404 12:00

گوگل از مدل جدید هوش مصنوعی خود با نام Veo 3.1 رونمایی کرده است. نسخه‌ای که بر پایه‌ Veo 3 ساخته شده و اکنون توانایی تولید ویدیوهای واقعی صدادار و قابل ویرایش‌ را دارد. جزئیات بیشتر به همراه ویدیویی از عملکرد این هوش مصنوعی را در شهر سخت افزار بخوانید.

به‌گفته‌ گوگل مدل Veo 3.1 عملکرد بهتری در تبدیل تصویر به ویدیو دارد و اکنون خروجی‌های صوتی و تصویری آن به شکل چشمگیری بهبود یافته‌اند. این نسخه به کاربران امکان می‌دهد تا اشیای جدیدی را به ویدیو اضافه کرده و آن‌ها را با سبک کلی ویدیو هماهنگ کنند.

مدل هوش مصنوعی Veo 3.1

همچنین در آینده نزدیک امکان حذف اشیاء از ویدیوها در ابزار Flow نیز فراهم می‌شود. تمامی قابلیت‌های Veo 3 مانند افزودن تصویر مرجع برای هدایت کاراکتر، تولید ویدیو از روی فریم ابتدایی و انتهایی و همچنین گسترش ویدیو براساس فریم‌های آخر در نسخه 3.1 با صدا همراه شده‌اند تا ویدیوها طبیعی‌ و زنده به‌نظر بیایند.

techcrunch گزارش داده که مدل هوش مصنوعی Veo 3.1 علاوه‌ بر بهبود در درک دستورهای متنی، حالا موتور اصلی ویرایشگر ویدیوی Flow محسوب می‌شود و از طریق اپلیکیشن Gemini و همچنین رابط‌های برنامه‌نویسی Gemini و Vertex در دسترس کاربران قرار گرفته است.

گوگل اعلام کرده از زمان عرضه‌ Flow در اردیبهشت ماه کاربران بیش از ۲۷۵ میلیون ویدیو با استفاده از این ابزار ساخته‌اند. براساس نمونه‌های منتشرشده هرچند کیفیت خروجی Veo 3.1 هنوز در برخی موارد حالت مصنوعی دارد و از واقع‌گرایی مدل Sora 2 شرکت OpenAI فاصله گرفته اما تصمیم گوگل برای تمرکز بر ابزارهای حرفه‌ای و خلاقانه، گامی مثبت در مسیر تکامل تولید ویدیوهای هوش مصنوعی به‌شمار می‌رود.

تگ ها