گوگل امروز اعلام کرد که قابلیت جدیدی را به هوش مصنوعی Veo 3 اضافه کرده است که آن را قادر میکند با استفاده از یک تصویر ایستا و ثابت ویدیوهای جذاب درست کنند. این مدل هوش مصنوعی که از طریق Gemini در دسترس قرار دارد با استفاده از این قابلیت میتواند با تنها چند کلیک ویدیوهایی 8 ثانیهای تولید کند و حتی کار تولید صدا و صداگذاری آنها را هم صورت دهد.
مدل هوش مصنوعی Veo 3 در ماههای اخیر یکی از بازوهای قدرتمند Gemini بوده است و در حوزه تولید ویدیو و صدا قابلیتهای جذابی را در دسترس کاربران قرار داده است. گوگل به تازگی قابلیت جدید و جذابی را به این مدل و Gemini اضافه کرده که به کاربران اجازه میدهد عکسهای خود را به ویدیو تبدیل کنند. Veo 3 برای تولید این ویدیوهای 8 ثانیهای تنها به یک تصویر مرجع نیاز دارد و قادر است با استفاده از هوش مصنوعی صداهایی را هم تولید و بر روی ویدیو قرار دهد. این صداها میتوانند در پسزمینه، محیط و حتی به صورت گفتار بر روی ویدیو حضور پیدا کنند.
براساس گزارش Gsmarena، مدل هوش مصنوعی Veo 3 در نسخه جدید خود قادر است پس از دریافت تنها یک عکس و توضیحات متنی از سوی کاربران، به آن جان ببخشد و به صورت ویدیویی متحرک درآورد. ویدیویی که گوگل به عنوان نمونه از عملکرد این مدل منتشر کرده است تصویری ثابت از یک جعبه را نشان میدهد که پس از بازشدن درب، اتفاقاتی متفاوت برای آن رخ میدهد. این ویدیو به خوبی نشان میدهد که Gemini در تولید این ویدیوها هیچگونه محدودیتی ندارد و قادر است حتی عجیبترین تصاویر را تولید کند.
به گفته گوگل، این بروزرسانی Gemini اکنون در برخی از نواحی برای مشترکین نسخههای AI Ultra و Pro از آن در دسترس قرار گرفته است. این قابلیت از امروز در نسخه وب این پلتفرم هوش مصنوعی منتشر شده است و در هفته جاری در دستگاههای موبایلی هم ارائه خواهد شد. کاربران برای استفاده از این قابلیت باید در نوار ابزار Gemini بر روی گزینه Tools کلیک کنند و سپس گزینه Video را انتخاب کنند. با این کار امکان بارگذاری یک عکس ممکن میشود.
در گام بعد باید توسط کاربران توضیح متنی از چگونگی حرکت دلخواه تصویر اعلام شود. همچنین در این بخش میتوان توضیحاتی برای دیالوگ، افکتهای صوتی و صداهای محیطی نیز اضافه کرد. گوگل اعلام کرده است که این صداها به صورت کامل با تصویر همگامسازی میشوند. ویدیوهای نهایی تولید شده توسط Gemini به صورت فایل MP4 با وضوح 720p و فرمت افقی در ابعاد 16:9 قابل دریافت خواهند بود.
در همین رابطه بخوانید:
- Veo و Imagen 3 رونمایی شدند؛ ابزارهای خاص هوش مصنوعی گوگل برای تولید ویدیو و عکس
- هوش مصنوعی Kling 2.1 معرفی شد؛ رقیب چینی گوگل در ساخت ویدیو با قیمت کمتر [تماشا کنید]
- ساخت ویدیو با هوش مصنوعی رایگان شد؛ Sora به Bing مایکروسافت آمد
بنا به گفته گوگل این قابلیت میتواند برای جاندهی به اشیا و اجسام موجود در محیط اطراف، نقاشیها و طراحیهای صورت گرفته بر روی کاغذ و یا متحرک کردن مناظر طبیعی مورد استفاده قرار بگیرد. همه ویدیوهای تولید شده توسط این ابزار شامل یک واترمارک مرئی است تا نشان دهد آن با استفاده از هوش مصنوعی تولید شده است. گوگل همچنین برای این ویدیوها یک واترمارک دیجیتال نامرئی یا SynthID در نظر گرفته است.
گوگل اعلام کرده است که تاکنون با استفاده از مدل هوش مصنوعی Veo 3، بیش از 40 میلیون ویدیو مختلف تولید شده است. اضافه شدن این قابلیت جذاب میتواند تعداد این ویدیوهای تولید شده را به میزان قابل توجهی افزایش دهد. پیش از این گوگل در ماه مارس در ابزار فیلمسازی مولد خود با عنوان Flow، قابلیت و ویژگی مشابهی را در دسترس قرار داده بود اما اکنون به لطف این قابلیت جدید مدل Veo 3 میتوان ویدیوها را بدون بازکردن اپلیکیشنی دیگر و تنها با استفاده از Gemini ایجاد کرد. همچنین امروز قرار است ابزار Flow در بیش از 75 کشور دیگر نیز منتشر شود.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت