گوگل امروز اعلام کرد که قابلیت جدیدی را به هوش مصنوعی Veo 3 اضافه کرده است که آن را قادر می‌کند با استفاده از یک تصویر ایستا و ثابت ویدیوهای جذاب درست کنند. این مدل هوش مصنوعی که از طریق Gemini در دسترس قرار دارد با استفاده از این قابلیت می‌تواند با تنها چند کلیک‌ ویدیوهایی 8 ثانیه‌ای تولید کند و حتی کار تولید صدا و صداگذاری آن‌ها را هم صورت دهد.

مدل هوش مصنوعی Veo 3 در ماه‌های اخیر یکی از بازوهای قدرتمند Gemini بوده است و در حوزه تولید ویدیو و صدا قابلیت‌های جذابی را در دسترس کاربران قرار داده است. گوگل به ‌تازگی قابلیت جدید و جذابی را به این مدل و Gemini اضافه کرده که به کاربران اجازه می‌دهد عکس‌های خود را به ویدیو تبدیل کنند. Veo 3 برای تولید این ویدیوهای 8 ثانیه‌ای تنها به یک تصویر مرجع نیاز دارد و قادر است با استفاده از هوش مصنوعی صداهایی را هم تولید و بر روی ویدیو قرار دهد. این صداها می‌توانند در پس‌زمینه، محیط و حتی به صورت گفتار بر روی ویدیو حضور پیدا کنند.

براساس گزارش Gsmarena، مدل هوش مصنوعی Veo 3 در نسخه جدید خود قادر است پس از دریافت تنها یک عکس و توضیحات متنی از سوی کاربران، به آن جان ببخشد و به صورت ویدیویی متحرک درآورد. ویدیویی که گوگل به عنوان نمونه از عملکرد این مدل منتشر کرده است تصویری ثابت از یک جعبه را نشان می‌دهد که پس از بازشدن درب، اتفاقاتی متفاوت برای آن رخ می‌دهد. این ویدیو به خوبی نشان می‌دهد که Gemini در تولید این ویدیوها هیچگونه محدودیتی ندارد و قادر است حتی عجیب‌ترین تصاویر را تولید کند.

به گفته گوگل، این بروزرسانی Gemini اکنون در برخی از نواحی برای مشترکین نسخه‌های AI Ultra و Pro از آن در دسترس قرار گرفته است. این قابلیت از امروز در نسخه وب این پلتفرم هوش مصنوعی منتشر شده است و در هفته جاری در دستگاه‌های موبایلی هم ارائه خواهد شد. کاربران برای استفاده از این قابلیت باید در نوار ابزار Gemini بر روی گزینه Tools کلیک کنند و سپس گزینه Video را انتخاب کنند. با این کار امکان بارگذاری یک عکس ممکن می‌شود.

نحوه تبدیل عکس به ویدیو در Gemini

در گام بعد باید توسط کاربران توضیح متنی از چگونگی حرکت دلخواه تصویر اعلام شود. همچنین در این بخش می‌توان توضیحاتی برای دیالوگ، افکت‌های صوتی و صداهای محیطی نیز اضافه کرد. گوگل اعلام کرده است که این صداها به صورت کامل با تصویر همگام‌سازی می‌شوند. ویدیوهای نهایی تولید شده توسط Gemini به‌ صورت فایل MP4 با وضوح 720p و فرمت افقی در ابعاد 16:9 قابل دریافت خواهند بود.

در همین رابطه بخوانید:

- Veo و Imagen 3 رونمایی شدند؛ ابزارهای خاص هوش مصنوعی گوگل برای تولید ویدیو و عکس
هوش مصنوعی Kling 2.1 معرفی شد؛ رقیب چینی گوگل در ساخت ویدیو با قیمت کمتر [تماشا کنید]
ساخت ویدیو با هوش مصنوعی رایگان شد؛ Sora به Bing مایکروسافت آمد

بنا به گفته گوگل این قابلیت‌ می‌تواند برای جان‌دهی به اشیا و اجسام موجود در محیط اطراف، نقاشی‌ها و طراحی‌های صورت گرفته بر روی کاغذ و یا متحرک کردن مناظر طبیعی مورد استفاده قرار بگیرد. همه ویدیوهای تولید شده توسط این ابزار شامل یک واترمارک مرئی است تا نشان دهد آن با استفاده از هوش مصنوعی تولید شده است. گوگل همچنین برای این ویدیوها یک واترمارک دیجیتال نامرئی یا SynthID در نظر گرفته است.

گوگل اعلام کرده است که تاکنون با استفاده از مدل هوش مصنوعی Veo 3، بیش از 40 میلیون ویدیو مختلف تولید شده است. اضافه شدن این قابلیت جذاب می‌تواند تعداد این ویدیوهای تولید شده را به میزان قابل توجهی افزایش دهد. پیش از این گوگل در ماه مارس در ابزار فیلم‌سازی مولد خود با عنوان Flow، قابلیت و ویژگی‌ مشابهی را در دسترس قرار داده بود اما اکنون به لطف این قابلیت جدید مدل Veo 3 می‌توان ویدیوها را بدون بازکردن اپلیکیشنی دیگر و تنها با استفاده از Gemini ایجاد کرد. همچنین امروز قرار است ابزار Flow در بیش از 75 کشور دیگر نیز منتشر شود.

نظر خود را اضافه کنید.

ارسال نظر بدون عضویت در سایت

0
نظر شما پس از تایید مدیر منتشر خواهد شد.
  • هیچ نظری یافت نشد

ورود به شهرسخت‌افزار

ثبت نام در شهر سخت افزار
ورود به شهر سخت افزار

ثبت نام در شهر سخت افزار

نام و نام خانوادگی(*)
لطفا نام خود را وارد کنید

ایمیل(*)
لطفا ایمیل خود را به درستی وارد کنید

رمز عبور(*)
لطفا رمز عبور خود را وارد کنید

شماره موبایل
Invalid Input

جزو کدام دسته از اشخاص هستید؟(*)

لطفا یکی از موارد را انتخاب کنید