استارتآپ Runway از یک مدل هوش مصنوعی جدید به نام GWM-1 رونمایی کرده که میتواند تنها با یک توصیف متنی، جهانی زنده، پویا و قابل کاوش توسط کاربر ایجاد کند. این مدل با پیشبینی لحظه به لحظه فریم و همچنین درک درست از قوانین فیزیک و نور، میتواند جهانهای مجازی نزدیک به واقعیت را ارائه دهد.
Runway در رقابتی که برای ساخت مدلهای جهانی یا ساخت جهان (World Models) هر روز داغتر میشود، یک گام بزرگ برداشته و از اولین سیستم خود با نام GWM-1 رونمایی کرده است؛ هم زمان با این معرفی، مدل ویدئویی پرچمدار خود یعنی Gen 4.5 را هم به شکل قابلتوجهی ارتقا داده است.
این عرضه دوگانه نشان میدهد Runway قصد دارد از مرحله تحقیقاتی عبور کند و به یکی از بازیگران اصلی ابزارهای آماده استفاده در دنیای واقعی تبدیل شود.
هدف این سیستمها ساخت یک شبیهسازی درونی از نحوه کار جهان واقعی است؛ به شکلی که هوش مصنوعی بتواند فکر کند، برنامهریزی انجام دهد و تصمیم بگیرد، بدون اینکه همه سناریوها را قبلاً در دادههای آموزشی دیده باشد.
Runway میگوید رویکرد آن بر پیشبینی فریم به فریم تمرکز دارد؛ روشی که به مدل درک بهتری از فیزیک، حرکت اجسام و پیوستگی محیط میدهد.
Runway در حوزه هوش مصنوعی غوغا میکند
به گزارش indianexpress، پیشرفت Runway در حوزه ویدئو، از زمان معرفی اولیه Gen 4.5 در اوایل این ماه به شدت زیر نظر بوده است؛ مدلی که در جدول Video Arena عملکردی بهتر از Google و OpenAI ثبت کرد.
حالا Runway، مدل GWM-1 را «عمومیتر» از گزینههایی مثل Genie-3 گوگل توصیف میکند و آن را پایهای برای آموزش ایجنتها در حوزههایی مثل رباتیک، علوم زیستی و دیگر کاربردهای عملی میداند.
در همین رابطه بخوانید:
- بهترین سایت های هوش مصنوعی برای انجام هر کاری!
هم زمان با این معرفی، Runway از سه نسخه تخصصی سیستم جدید خود رونمایی کرد: GWM-Worlds، GWM-Robotics و GWM-Avatars. هرکدام فعلاً به صورت مستقل کار میکنند، اما هدف نهایی شرکت، ادغام آنها در یک مدل واحد و جامع است.
GWM-Worlds به کاربران اجازه میدهد تنها با یک دستور متنی یا تصویر مرجع، فضاهای تعاملی بسازند؛ فضاهایی که هندسه، نورپردازی و قوانین فیزیک را درک میکنند. این شبیهسازیها فعلاً با کیفیت 720p و نرخ 24 فریم اجرا میشوند و برای نمونههای اولیه بازیسازی یا آموزش ایجنتهای دیجیتال در شرایط دنیای واقعی مناسب هستند.
GWM-Robotics روی تولید دادههای آموزشی مصنوعی برای رباتها تمرکز دارد. با شبیهسازی شرایطی مثل تغییرات آب و هوا، موانع غیرمنتظره و محیطهای ناپایدار، توسعه دهندگان میتوانند نقاط ضعف رباتها در درک دستورها یا نقض استانداردهای ایمنی را شناسایی کنند. Runway اعلام کرده هم اکنون با چند شرکت رباتیک و سازمان بزرگ در حال گفتگو است و قصد دارد دسترسی به این سیستم را از طریق یک SDK فراهم کند.
در مقابل، GWM-Avatars روی ساخت انسانهای دیجیتال واقعی تمرکز دارد؛ بازاری شلوغ که استارتاپهایی مثل D-ID، Synthesia و Soul Machines و حتی خود Google در آن فعال هستند. Runway میخواهد از این آواتارها در کاربردهایی مثل ارتباطات، آموزش و شبیهسازی رفتار انسانی استفاده کند.
در کنار معرفی World Modelها، Runway یک ارتقای بزرگ هم برای مدل ویدئویی Gen 4.5 ارائه داده است. نسخه جدید حالا از صدا بهصورت بومی پشتیبانی میکند، امکان تولید ویدئوهای بلند با شخصیتهای ثابت را دارد و از روایت چند صحنهای پشتیبانی میکند. کاربران میتوانند ویدئوهایی تا یک دقیقه بسازند که شامل دیالوگ، صدای محیط و جابهجاییهای پیچیده دوربین است.
این قابلیتها Gen 4.5 را به راهکارهای یکپارچه تولید ویدئو که رقبایی مثل Kling ارائه میدهند نزدیکتر میکند، به خصوص در زمینه تولید ویدئوی مجهز به صدا. نسخه ارتقایافته اکنون در دسترس تمام کاربران پلنهای پولی Runway قرار گرفته است.












نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت