گوگل از مدل جدید هوش مصنوعی خود با نام Veo 3.1 رونمایی کرده است. نسخهای که بر پایه Veo 3 ساخته شده و اکنون توانایی تولید ویدیوهای واقعی صدادار و قابل ویرایش را دارد. جزئیات بیشتر به همراه ویدیویی از عملکرد این هوش مصنوعی را در شهر سخت افزار بخوانید.
بهگفته گوگل مدل Veo 3.1 عملکرد بهتری در تبدیل تصویر به ویدیو دارد و اکنون خروجیهای صوتی و تصویری آن به شکل چشمگیری بهبود یافتهاند. این نسخه به کاربران امکان میدهد تا اشیای جدیدی را به ویدیو اضافه کرده و آنها را با سبک کلی ویدیو هماهنگ کنند.
همچنین در آینده نزدیک امکان حذف اشیاء از ویدیوها در ابزار Flow نیز فراهم میشود. تمامی قابلیتهای Veo 3 مانند افزودن تصویر مرجع برای هدایت کاراکتر، تولید ویدیو از روی فریم ابتدایی و انتهایی و همچنین گسترش ویدیو براساس فریمهای آخر در نسخه 3.1 با صدا همراه شدهاند تا ویدیوها طبیعی و زنده بهنظر بیایند.
techcrunch گزارش داده که مدل هوش مصنوعی Veo 3.1 علاوه بر بهبود در درک دستورهای متنی، حالا موتور اصلی ویرایشگر ویدیوی Flow محسوب میشود و از طریق اپلیکیشن Gemini و همچنین رابطهای برنامهنویسی Gemini و Vertex در دسترس کاربران قرار گرفته است.
گوگل اعلام کرده از زمان عرضه Flow در اردیبهشت ماه کاربران بیش از ۲۷۵ میلیون ویدیو با استفاده از این ابزار ساختهاند. براساس نمونههای منتشرشده هرچند کیفیت خروجی Veo 3.1 هنوز در برخی موارد حالت مصنوعی دارد و از واقعگرایی مدل Sora 2 شرکت OpenAI فاصله گرفته اما تصمیم گوگل برای تمرکز بر ابزارهای حرفهای و خلاقانه، گامی مثبت در مسیر تکامل تولید ویدیوهای هوش مصنوعی بهشمار میرود.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت