شرکت OpenAI امروز از مدل هوش مصنوعی قدرتمندی با عنوان Sora رونمایی کرد که قادر است با دریافت یک متن کوتاه از کاربران و با توجه به آن یک ویدیوی پیچیده با حضور شخصیتهای گوناگون و همچنین حرکات مختلف دوربین و کاراکترها تولید کند. Sora به گونهای طراحی شده است تا ویدیوهای واقعی یا Photorealistic تولید کند و در کسری از زمان آن را در دسترس کاربران قرار دهد.
مدل هوش مصنوعی Sora که امروز برای نخستین بار از سوی شرکت OpenAI معرفی شد میتواند خیلی سریع توصیفات ارائه شده توسط کاربران را به یک ویدیوی کوتاه تبدیل کند. بنا به گفته توسعه دهنده این مدل هوش مصنوعی، جزییات نمایش داده شده در ویدیوهای تولید شده به صورت واقعی خواهد بود و Sora این قابلیت را دارد که در نمایش شخصیتها و صحنهها از بافتها و تصاویر واقعی استفاده کند. آنطور که OpenAI اعلام کرده است در حال حاضر تنها میتوان با استفاده از این مدل ویدیوهای کوتاه و یک دقیقهای تولید کرد.
براساس گزارش Theverge، مدل هوش مصنوعی Sora قادر است در تولید ویدیوهای موردنیاز کاربران از المانها و صحنههای پیچیده و با جزییات فراوان استفاده کند. این مدل همچنین قادر است در زمانی کوتاه انبوهی از کاراکترها را تولید و برای ساخت این ویدیوها به کار بگیرد. در این ویدیوها از جزییات واقعی برای صحنه، لوکیشن و کاراکترها استفاده خواهد شد. OpenAI اعلام کرده است که مدل هوش مصنوعی Sora از جهان واقعی دید کامل دارد و از فیزیک اشیا و شخصیتها آگاه است.
از میان دیگر قابلیتهای مهم و جالب مدل هوش مصنوعی Sora میتوان به امکان تولید ویدیو با استفاده از یک عکس و همچنین ایجاد فریمهای واسط یا میانی یک ویدیو اشاره کرد. Sora همچنین میتواند با دریافت یک ویدیو از کاربران آن را طولانیتر کرده و چند صحنه به آن اضافه کند. به منظور نمایش قابلیتهای این مدل هوش مصنوعی، OpenAI چند ویدیوی کوتاه و همچنین چند تصویر از خروجی Sora منتشر کرده است. اگرچه در این ویدیوها میتوان ردپای هوش مصنوعی را مشاهده کرد اما بازهم باید گفت خروجی بدست آمده بسیار عالی و جذاب است. OpenAI در سایت رسمی خود اعلام کرده است که Sora ممکن است هنوز در پردازش فیزیک صحنههای پیچیده کمی مشکل داشته باشد.
طبق گزارشهای موجود مدل هوش مصنوعی Sora هم اکنون در مرحله تست و ارزیابی است و گروهی از متخصصین مشغول بررسی قابلیتها و خطرات آن به منظور تولید ویدیوهای نامناسب هستند. OpenAI همچنین هم اکنون در حال ارزیابی ابزارهایی است که بتواند توسط آن ویدیوهای تولید شده توسط Sora را شناسایی کند. Sora به گونهای طراحی شده است که با نحوه استفاده کاربران از مدل هوش مصنوعی DALL-E 3 تداخل نداشته باشد و حیات آن را به خطر نیاندازد.
در همین رابطه بخوانید:
- هوش مصنوعی Stable Video Diffusion عرضه شد؛ عکس بدهید ویدیو بگیرید (+لینک ثبت نام)
- گوگل هوش مصنوعی Lumiere را معرفی کرد؛ ساخت ویدئو تنها با چند کلمه [تماشا کنید]
- این ویدیوی شگفتانگیز را ابزار هوش مصنوعی Motion Brush ساخته است [تماشا کنید]
مدل Sora هنوز در دسترس عموم کاربران قرار نگرفته است اما Sam Altman مدیر اجرایی OpenAI امروز در توییتر اعلام کرد که کاربران میتوانند متن موردنظر خود را به حساب رسمی او ارسال کنند تا پس از تبدیل به ویدیو در دسترس آن ها قرار بگیرد. بسیاری از کارشناسان معتقد هستند که Sora میتواند به طراحان، هنرمندان و فیلمسازان کمک فراوانی کند و همچنین نحوه ایجاد و تبدیل متن به ویدیو در فضای وب را برای همیشه تغییر دهد.
مدل هوش مصنوعی Sora پس از انتشار رقبای جدی و قابل توجهی خواهد داشت. گوگل هم اکنون به منظور تبدیل متن به ویدیو مدل هوش مصنوعی Lumiere را در اختیار دارد که به نظر میرسد جدیترین رقیب Sora است. Lumiere قابلیتهایی مشابه با مدل Sora را ارائه میدهد. شرکتهایی نظیر Runway و Pika نیز به تازگی مدلهای هوش مصنوعی تازهای را در این مورد طراحی و منتشر کردهاند که خروجی آنها قابل توجه به نظر میرسد.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت