این هوش مصنوعی یک جهان زنده و قابل کاوش می‌سازد [تماشا کنید]

توضیحات: بهادر قلندرپور; دسته: اخبار فناوری; 23 آذر 1404 17:00

استارت‌آپ Runway از یک مدل هوش مصنوعی جدید به نام GWM-1 رونمایی کرده که می‌تواند تنها با یک توصیف متنی، جهانی زنده، پویا و قابل کاوش توسط کاربر ایجاد کند. این مدل با پیش‌بینی لحظه به لحظه فریم و همچنین درک درست از قوانین فیزیک و نور، می‌تواند جهان‌های مجازی نزدیک به واقعیت را ارائه دهد.

Runway در رقابتی که برای ساخت مدل‌های جهانی یا ساخت جهان (World Models) هر روز داغ‌تر می‌شود، یک گام بزرگ برداشته و از اولین سیستم خود با نام GWM-1 رونمایی کرده است؛ هم زمان با این معرفی، مدل ویدئویی پرچمدار خود یعنی Gen 4.5 را هم به شکل قابل‌توجهی ارتقا داده است.

این عرضه دوگانه نشان می‌دهد Runway قصد دارد از مرحله تحقیقاتی عبور کند و به یکی از بازیگران اصلی ابزارهای آماده استفاده در دنیای واقعی تبدیل شود.

هدف این سیستم‌ها ساخت یک شبیه‌سازی درونی از نحوه کار جهان واقعی است؛ به شکلی که هوش مصنوعی بتواند فکر کند، برنامه‌ریزی انجام دهد و تصمیم بگیرد، بدون اینکه همه سناریوها را قبلاً در داده‌های آموزشی دیده باشد.

Runway می‌گوید رویکرد آن بر پیش‌بینی فریم به فریم تمرکز دارد؛ روشی که به مدل درک بهتری از فیزیک، حرکت اجسام و پیوستگی محیط می‌دهد.

Runway در حوزه هوش مصنوعی غوغا می‌کند

به گزارش indianexpress، پیشرفت Runway در حوزه ویدئو، از زمان معرفی اولیه Gen 4.5 در اوایل این ماه به شدت زیر نظر بوده است؛ مدلی که در جدول Video Arena عملکردی بهتر از Google و OpenAI ثبت کرد.

حالا Runway، مدل GWM-1 را «عمومی‌تر» از گزینه‌هایی مثل Genie-3 گوگل توصیف می‌کند و آن را پایه‌ای برای آموزش ایجنت‌ها در حوزه‌هایی مثل رباتیک، علوم زیستی و دیگر کاربردهای عملی می‌داند.

در همین رابطه بخوانید:

- بهترین سایت های هوش مصنوعی برای انجام هر کاری!

هم زمان با این معرفی، Runway از سه نسخه تخصصی سیستم جدید خود رونمایی کرد: GWM-Worlds، GWM-Robotics و GWM-Avatars. هرکدام فعلاً به صورت مستقل کار می‌کنند، اما هدف نهایی شرکت، ادغام آنها در یک مدل واحد و جامع است.

GWM-Worlds به کاربران اجازه می‌دهد تنها با یک دستور متنی یا تصویر مرجع، فضاهای تعاملی بسازند؛ فضاهایی که هندسه، نورپردازی و قوانین فیزیک را درک می‌کنند. این شبیه‌سازی‌ها فعلاً با کیفیت 720p و نرخ 24 فریم اجرا می‌شوند و برای نمونه‌های اولیه بازی‌سازی یا آموزش ایجنت‌های دیجیتال در شرایط دنیای واقعی مناسب هستند.

GWM-Robotics روی تولید داده‌های آموزشی مصنوعی برای ربات‌ها تمرکز دارد. با شبیه‌سازی شرایطی مثل تغییرات آب و هوا، موانع غیرمنتظره و محیط‌های ناپایدار، توسعه دهندگان می‌توانند نقاط ضعف ربات‌ها در درک دستورها یا نقض استانداردهای ایمنی را شناسایی کنند. Runway اعلام کرده هم اکنون با چند شرکت رباتیک و سازمان بزرگ در حال گفتگو است و قصد دارد دسترسی به این سیستم را از طریق یک SDK فراهم کند.

در مقابل، GWM-Avatars روی ساخت انسان‌های دیجیتال واقعی تمرکز دارد؛ بازاری شلوغ که استارتاپ‌هایی مثل D-ID، Synthesia و Soul Machines و حتی خود Google در آن فعال هستند. Runway می‌خواهد از این آواتارها در کاربردهایی مثل ارتباطات، آموزش و شبیه‌سازی رفتار انسانی استفاده کند.

در کنار معرفی World Modelها، Runway یک ارتقای بزرگ هم برای مدل ویدئویی Gen 4.5 ارائه داده است. نسخه جدید حالا از صدا به‌صورت بومی پشتیبانی می‌کند، امکان تولید ویدئوهای بلند با شخصیت‌های ثابت را دارد و از روایت چند صحنه‌ای پشتیبانی می‌کند. کاربران می‌توانند ویدئوهایی تا یک دقیقه بسازند که شامل دیالوگ، صدای محیط و جابه‌جایی‌های پیچیده دوربین است.

این قابلیت‌ها Gen 4.5 را به راهکارهای یکپارچه تولید ویدئو که رقبایی مثل Kling ارائه می‌دهند نزدیک‌تر می‌کند، به خصوص در زمینه تولید ویدئوی مجهز به صدا. نسخه ارتقایافته اکنون در دسترس تمام کاربران پلن‌های پولی Runway قرار گرفته است.

تگ ها