یک شرکت بریتانیایی به نام DeepMind که زیرمجموعه آلفابت و کمپانی خواهر گوگل محسوب می‌شود اخیراً از سیستم هوش مصنوعی جدیدی رونمایی کرده است که می‌تواند پس از دیدن یک عکس ساده دو بعدی، صحنه‌های سه بعدی از آن در زوایای مختلف را ترسیم کند.

محققان حوزه هوش مصنوعی در سال‌های اخیر همواره تلاش کرده‌اند برای به حد‌اعلی رساندن این تکنولوژی آن را طوری آموزش دهند که به جای صرفاً دیدن محیط اطراف به صورت ترکیبی از پیکسل‌ها، آن را همانند انسان‌ مشاهده کرده و یادگیری کنند. انسان‌ها وقتی به محیط اطراف نگاه می‌کنند در مغزشان ترکیبی از چیزهایی که واقعا چشم می‌بیند و تصورات ذهنی را پردازش می‌کنند. مثلا اگر ما یک ماشین را از روبرو ببینیم می‌توانیم تصور کنیم که این خودرو قسمت‌های دیگر و زوایای دیگری نیز دارد حتی اگر در حال حاضر چشم ما آن زوایا را مشاهده نکند و با مشاهده خودرو از چندین زاویه می‌توانیم حجم کلی و سه بعدی آن را تصور کنیم.

یکی از آسان‌ترین روش‌ها برای خنداندن یک نوزاد پوشاندن صورت با دست‌ها و سپس کنار بردن آن‌ها یا اصطلاحاً بازی "دالی موشه" است. سیستم یادگیری مغز انسان با انجام موارد مشابهی همچون این بازی یاد می‌گیرد که حتی اگر دست ها صورت را پوشانده باشند همچنان چهره شخص در پشت دست‌ها وجود دارد. کاری که محققین DeepMind با هوش مصنوعی خود کرده‌اند مشابه این فرآیند یادگیری مغز انسان در کودکی است. این هوش مصنوعی جدید می‌تواند حدس بزند که اشیا زوایای دید دیگری داشته و آن زوایای مختلف چه شکلی هستند حتی اگر آن صحنه را ندیده باشد.

راهکار این شرکت برای آموزش هوش مصنوعی خود CQN ( شبکه‌ی جستجوی مولد یا Generative Query Netwrok) نام دارد که یک شبکه‌ی عصبی برای آموزش تصورکردن صحنه‌های مختلف یک سوژه از زوایای متفاوت به هوش مصنوعی است. به صورت خلاصه، ابتدا به این هوش مصنوعی تصاویر دو بعدی و تخت از یک صحنه نمایش داده می‌شود و سپس سیستم سعی می‌کند تا زوایای دیگر آن عکس و صحنه‌های سه بعدی را تولید کند. نکته‌ی بسیار مهم در این هوش مصنوعی جدید شرکت DeepMind این است که این کار را بدون هیچگونه داده ورودی علامت‌گذاری شده توسط انسان و دانسته‌های قبلی انجام می‌دهد. این سیستم تنها با مشاهده چند عکس ساده از یک محیط می‌تواند حدس بزند که صحنه‌ی سه بعدی آن چگونه است.

مثلا می‌توانید از یک مکعب عکس بگیرید و از هوش مصنوعی بخواهید آن عکس را از یک زاویه متفاوت به شما نشان بدهد که شامل تغییر نورپردازی، سایه‌های سوژه و همچنین جهت خطوطی که تصویر مکعب را تشکیل می‌دهد خواهد بود. با استفاده از GQN، هوش مصنوعی می‌تواند این تصاویر را بدون دیدن مکعب از زوایای دیگر و سایه‌ها و نورپردازی آن تولید کند.

در حال حاضر محققین این شرکت در حال کار بر روی توسعه‌ی آن و دستیابی به توانایی ادراک صحنه‌ها بدون سرپرستی انسان هستند. این هوش مصنوعی تاکنون با تصاویری از دنیای واقعی مورد آزمایش قرار نگرفته‌است و قدم بعدی ایجاد امکان رندرینگ صحنه‌های سه بعدی واقعی از تصاویر عکاسی شده خواهد بود.

احتمالاً در آینده‌ای نزدیک هوش مصنوعی شرکت DeepMind بر پایه‌ی GQN بتواند صحنه‌های دلخواه سه بعدی نزدیک به واقعیت از زوایای مختلف را تنها با نمایش یک عکس به آن ایجاد کند.

نظر خود را اضافه کنید.

ارسال نظر بدون عضویت در سایت

0
  • هیچ نظری یافت نشد

ورود به شهرسخت‌افزار

ثبت نام در شهر سخت افزار
ورود به شهر سخت افزار

ثبت نام در شهر سخت افزار

نام و نام خانوادگی(*)
لطفا نام خود را وارد کنید

ایمیل(*)
لطفا ایمیل خود را به درستی وارد کنید

رمز عبور(*)
لطفا رمز عبور خود را وارد کنید

شماره موبایل
Invalid Input

جزو کدام دسته از اشخاص هستید؟(*)

لطفا یکی از موارد را انتخاب کنید