در حالت عادی برای ساخت یک جسم سهبعدی باید از نرمافزارهای خاصی همچون Maya و Autodesk 3ds Max استفاده کرد که نیازمند دانش بسیار زیاد در حوزه گرافیک و نرمافزار هستند. اما با فناوری جدید گوگل که از هوش مصنوعی استفاده میکند، اکنون میتوان تنها با استفاده از یک عکس و ارائه توضیحات در رابطه با شی موجود در آن، ویدئو کوتاه سهبعدی جسم مورد نظر خود را دریافت کنید.
همزمان با پیشرفت فناوری، محققان راههای تازهای برای استفاده از قابلیتهای بیپایان هوش مصنوعی (AI) و تکنولوژی یادگیری ماشینی پیدا میکنند. اما به زبان ساده هوش مصنوعی چیست؟
اغلب مردم هنوز هم با شنیدن واژه هوش مصنوعی تصور می کنند که منظور همان رباتهای بیاحساسی هستند که برای انجام راحت تر کارها طراحی شدهاند و قرار است در آینده نه چندان دور جای انسانها را بگیرند. مسئول این نوع تفکر به احتمال زیاد فیلمهای علمی و تخیلی هستند اما واقعیت با آنچه که تصور می شود تفاوت دارد.
هوش مصنوعی یا Artificial intelligence، در واقع فناوری پیشرفتهای است که به نحوی قابلیت فکر کردن دارد. البته این قابلیت تفکر با چیزی که ما به عنوان تفکر انسانی میشناسیم بسیار متفاوت است، هرچند که سعی دارد از آن تقلید کند.
محققان شرکت گوگل اوایل هفته جاری براساس این فناوری یک چهارچوب جدید با قابلیت ساخت ویدئوهای کوتاه تنها براساس یک عکس یا تصویر خبر دادهاند. این چهارچوب که ترانسفرمر (Transframer) نام دارد، میتواند در آینده راهحلهای رندر تصاویر را بهبود بخشیده و به توسعهدهندگان این امکان را بدهد که تنها با عکسبرداری از محیط، براساس قابلیتهای یادگیری ماشینی دنیای مجازی با جزئیات بالا ایجاد کنند.
جالب است بدانیک که تا حدودی نام و ایده این فناوری جدید از مدل دیگری به نام ترانسفورمر (Transformer) اقتباس شده است، که ابتدا در سال ۲۰۱۷ معرفی شد. تراسنفورمر یک معماری جدید شبکه عصبی با قابلیت تولید متن با استفاده از مدلسازی و مقایسه سایر کلمات موجود در یک جمله است. به عبارت دیگر این فناوری از کلمات موجود در یک متن استفاده کرده و میتواند متنهای قابل فهم و منطقی ایجاد کند.
از آن زمان به بعد این مدل در چهارچوبهای یادگیری عمیق (Deep Learning) استاندارد مانند TensorFlow و PyTorch گنجانده شده است.
همانطور که ترانسفورمر از متن استفاده کرده و خروجیهای جدیدی را ایجاد میکند، فناوری جدید ترانسفرمر گوگل هم میتواند از یک تصویر که توضیحات کاملی در رابطه با آن داده شده، یک ویدئو کوتاه ایجاد کند. نکته اصلی در این فناوری آن است که هیچ داده هندسی در ورودی تصویر اصلی ارائه نشده، اما Transframer میتواند یک پرسپکتیو یا چشمانداز دقیق ایجاد کند.
فناوری جدید Transframer از پلتفرم هوش مصنوعی DeepMind گوگل بهره میبرد. در واقع این فناوری با تجزیه و تحلیل تصویر و توضیحات ارائه شده از یک تصویر میتواند تصاویر مشابه ایجاد کرده و با کنار هم قرار دادن آنها یک ویدئو سهبعدی از جسم مورد نظر ارائه دهد.
Transframer گوگل که توانایی ارائه ویدئویی دقیق و معقول براساس مجموعهای بسیار محدود از دادههای ورودی را دارد، یک گام بزرگ در پیشرفت تکنولوژی ویدئویی محسوب شود.
پیشرفتهای کسب شده در این حوزه میتواند بر صنایع مبتنی بر آثار ویدئویی از جمله صنعت تولید بازیهای رایانهای به طور بالقوه تاثیرگذار باشد. در حال حاضر برای ساخت محیط واقعگرایانه درون بازیها از تکنیکهای مختلف رندر مانند سایهزنی، نقشهبرداری بافت، عمق میدان، ردیابی پرتو نور و غیره استفاده میکنند، اما فناوریهای جدیدی مانند Transframer با استفاده از هوش مصنوعی و یادگیری ماشین میتوانند مسیر کاملاً جدیدی برای ساخت محیطهای درون بازیها در اختیار توسعهدهندگان قرار دهند، مسیری که میتواند زمان، منابع و تلاشهای لازم برای ساخت این محیطها و دستیابی به محصول نهایی را شدیداً کاهش دهد.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت