در حالت عادی برای ساخت یک جسم سه‌بعدی باید از نرم‌افزارهای خاصی همچون Maya و Autodesk 3ds Max استفاده کرد که نیازمند دانش بسیار زیاد در حوزه گرافیک و نرم‌افزار هستند. اما با فناوری جدید گوگل که از هوش مصنوعی استفاده می‌کند، اکنون می‌توان تنها با استفاده از یک عکس و ارائه توضیحات در رابطه با شی موجود در آن، ویدئو کوتاه سه‌بعدی جسم مورد نظر خود را دریافت کنید.

همزمان با پیشرفت فناوری، محققان راه‌های تازه‌ای برای استفاده از قابلیت‌های بی‌پایان هوش مصنوعی (AI) و تکنولوژی یادگیری ماشینی پیدا می‌کنند. اما به زبان ساده هوش مصنوعی چیست؟

اغلب مردم هنوز هم با شنیدن واژه هوش مصنوعی تصور می کنند که منظور همان ربات‌های بی‌احساسی هستند که برای انجام راحت تر کارها طراحی شده‌اند و قرار است در آینده نه چندان دور جای انسان‌ها را بگیرند. مسئول این نوع تفکر به احتمال زیاد فیلم‌های علمی و تخیلی هستند اما واقعیت با آنچه که تصور می شود تفاوت دارد.

هوش مصنوعی یا Artificial intelligence، در واقع فناوری پیشرفته‌ای است که به نحوی قابلیت فکر کردن دارد. البته این قابلیت تفکر با چیزی که ما به عنوان تفکر انسانی می‌شناسیم بسیار متفاوت است، هرچند که سعی دارد از آن تقلید کند.

محققان شرکت گوگل اوایل هفته جاری براساس این فناوری یک چهارچوب جدید با قابلیت ساخت ویدئوهای کوتاه تنها براساس یک عکس یا تصویر خبر داده‌اند. این چهارچوب که ترانسفرمر (Transframer) نام دارد، می‌تواند در آینده راه‌حل‌های رندر تصاویر را بهبود بخشیده و به توسعه‌دهندگان این امکان را بدهد که تنها با عکس‌برداری از محیط، براساس قابلیت‌های یادگیری ماشینی دنیای مجازی با جزئیات بالا ایجاد کنند.

3d.gif

جالب است بدانیک که تا حدودی نام و ایده این فناوری جدید از مدل دیگری به نام ترانسفورمر (Transformer) اقتباس شده است، که ابتدا در سال ۲۰۱۷ معرفی شد. تراسنفورمر یک معماری جدید شبکه عصبی با قابلیت تولید متن با استفاده از مدل‌سازی و مقایسه سایر کلمات موجود در یک جمله است. به عبارت دیگر این فناوری از کلمات موجود در یک متن استفاده کرده و می‌تواند متن‌های قابل فهم و منطقی ایجاد کند.

از آن زمان به بعد این مدل در چهارچوب‌های یادگیری عمیق (Deep Learning) استاندارد مانند TensorFlow و PyTorch گنجانده شده است.

همانطور که ترانسفورمر از متن استفاده کرده و خروجی‌های جدیدی را ایجاد می‌کند، فناوری جدید ترانسفرمر گوگل هم می‌تواند از یک تصویر که توضیحات کاملی در رابطه با آن داده شده، یک ویدئو کوتاه ایجاد کند. نکته اصلی در این فناوری آن است که هیچ داده هندسی در ورودی تصویر اصلی ارائه نشده، اما Transframer می‌تواند یک پرسپکتیو یا چشم‌انداز دقیق ایجاد کند.

فناوری جدید Transframer از پلتفرم هوش مصنوعی DeepMind گوگل بهره می‌برد. در واقع این فناوری با تجزیه و تحلیل تصویر و توضیحات ارائه شده از یک تصویر می‌تواند تصاویر مشابه ایجاد کرده و با کنار هم قرار دادن آن‌ها یک ویدئو سه‌بعدی از جسم مورد نظر ارائه دهد.

Transframer گوگل که توانایی ارائه ویدئویی دقیق و معقول براساس مجموعه‌ای بسیار محدود از داده‌های ورودی را دارد، یک گام بزرگ در پیشرفت تکنولوژی ویدئویی محسوب شود.

پیشرفت‌های کسب شده در این حوزه می‌تواند بر صنایع مبتنی بر آثار ویدئویی از جمله صنعت تولید بازی‌های رایانه‌ای به طور بالقوه تاثیرگذار باشد. در حال حاضر برای ساخت محیط واقع‌گرایانه درون بازی‌ها از تکنیک‌های مختلف رندر مانند سایه‌زنی، نقشه‌برداری بافت، عمق میدان، ردیابی پرتو نور و غیره استفاده می‌کنند، اما فناوری‌های جدیدی مانند Transframer با استفاده از هوش مصنوعی و یادگیری ماشین می‌توانند مسیر کاملاً جدیدی برای ساخت محیط‌های درون بازی‌ها در اختیار توسعه‌دهندگان قرار دهند، مسیری که می‌تواند زمان، منابع و تلاش‌های لازم برای ساخت این محیط‌ها و دستیابی به محصول نهایی را شدیداً کاهش دهد.

نظر خود را اضافه کنید.

ارسال نظر بدون عضویت در سایت

0
نظر شما پس از تایید مدیر منتشر خواهد شد.
  • هیچ نظری یافت نشد

ورود به شهرسخت‌افزار

ثبت نام در شهر سخت افزار
ورود به شهر سخت افزار

ثبت نام در شهر سخت افزار

نام و نام خانوادگی(*)
لطفا نام خود را وارد کنید

ایمیل(*)
لطفا ایمیل خود را به درستی وارد کنید

رمز عبور(*)
لطفا رمز عبور خود را وارد کنید

شماره موبایل
Invalid Input

جزو کدام دسته از اشخاص هستید؟(*)

لطفا یکی از موارد را انتخاب کنید