شرکت nVIDIA حاصل تلاش بیش از 120 محقق خود را طی چهار مقالهی پذیرش شده در کنفرانس NIPS که هم اکنون در حال برگزاریست، به نمایش گذاشت. این مقالات در زمینه قابلیت یادگیری کامپیوترها، درک تصویری آنها، اتومبیلهای بدون نیاز به راننده، روباتیک و معماری کامپیوترهاست.
کنفرانس NIPS نوعی کنفرانس و ورکشاپ در حوزهی هوش مصنوعیست که بیش از 30 سال قدمت دارد و هر ساله در ماه دسامبر برگزار میشود و محققان آخرین دستاوردهای خود در زمینه شبکههای عصبی مصنوعی (ANN) و Machine Learning را به نمایش و اشتراک میگذارند.
محققان هوش مصنوعی nVIDIA در زمینههای مختلفی کار میکنند؛ از برنامه ریزی سیستمها و پردازشهای تحت GPU گرفته تا رباتیک و درک تصویری سیستمهای کامپیوتری (Computer Vision). این تحقیقات در نهایت منجر به ساخت ابزار و تولید تکنولوژی برای پیشرفت در زندگی، مانند وارد کردن هوش مصنوعی در حوزهی اتومبیلهای بدون راننده و سلامتی میشود.
یکی از چهار مقاله nVIDIA که در زمینه ادراک تصویری کامپیوترهاست با نام Learning Affinity via Spatial Propagation Networks توسط محققی به نام Sifei Liu ارائه شده که به صورت مختصر به تشریح آن میپردازیم.
کامپیوتر برای درک یک تصویر در ابتدا باید هریک از پیکسلهای تصویر را بشناسد. به عنوان مثال بداند کدام پیکسل بخشی از چرخ یا بدنه دوچرخه است و یا کدامیک مربوط به درخت پشت آن است که دوچرخه به آن تکیه کرده. به این مرحله تقسیم بندی تصویر (Image Segmentation) گفته میشود و سیستم برای داشتن دقت و کارایی در این زمینه با نوعی چالش مواجه است.
شبکههای Deep Learning از بسط قوانین فیزیک برای درک بهتر یک تصویر و یافتن رابطهی بین پیکسلهای مجاور استفاده میکنند که به کمک آن میتوانند تفاوت چرخ، پره و فضای خالی بین پرهها را تشخیص دهدند. به این توانایی، Spitial Affinity گفته میشود که غیر از تشخیص بخشهای مختلف یک تصویر توانایی یادگیری برای تشخیص سایر ویژگیهای یک تصویر مانند رنگ، جنس و... را نیز دارد.
شبکهی Spatial Propagation در یاد گیریهای خود به طور کامل از تحلیل دادههای دریافتی از تصویر استفاده میکند و آن را با هیچ طرح از قبل کشیده شدهای مقایسه نمیکند. این توانایی سیستم را قادر میسازد هر نوع آموزشی را فراگیرد و به تحلیل هر نوع تصویری که نیاز به شناسایی در سطح پیکسل داشته باشد بپردازد. مات کردن تصویر (در فوتوشاپ)، رنگی کردن تصویر و یا تشخیص اجزای صورت، نمونههایی از این تواناییست.
این مقاله در سایر بخشها، شامل زیرساختهای این طرح و محاسباتیست که آن را پیاده سازی میکند و نشان میدهد نسبت به ایدههای گذشته خود، به مراتب سریعتر است. این شبکه با پیاده سازی بر اساس برنامه نویسی موازی CUDA و قدرت پردازشی GPU ها، تا 100 برابر طرحهای گذشته میتواند سریعتر باشد.
مقاله دیگری از nVIDIA که جزء موضوعات رو به رشد در کنفرانس NIPS امسال است مربوط به یادگیری از طریق کشف الگوریتمهای پنهان و مدل سازی مفهوم فراگیری شده، میشود. این مقاله با نام Unsupervised Image-to-Image Translation Networks در راس سایر مقالات بوده و توسط Ming-Yu Liu، محقق nVIDIA ارائه شده است.
تا امروز از قابلیت Deep Learning بیشتر بر اساس Supervised Learning برای آموزش سیستمها استفاده شده تا بتوانند مانند انسانها قابلیت تشخیص تصاویر را داشته باشند. در این نوع آموزش، سیستم به کمک الگوهایی که از پیش به آن معرفی میشود مفاهیم را فرا میگیرد. به عنوان نمونه در آموزش Supervised سیستم به راحتی میتواند یک سگ جرمن شپرد را از کرگی تشخیص دهد در صورتی که نژاد این دو سگ از پیش برای آموزش در اختیار آن قرار داده شده باشد.
برای ارتقاع توانایی تشخیص و افزودن قابلیت تصور در کامپیوترها، مانند دیدن یک عکس در زمستان و تصور کردن آن در تابستان محققان از سیستم Unsupervised Learning استفاده کرده اند. نمونه ای از مدل سازی انجام شده توسط این سیستم را در تصویر زیر مشاهده میکنید که در آن تصویر هوای زمستانی و آفتابی به عنوان ورودی به شبکه داده شده و سیستم با تصور تابستان و هوای بارانی، تصاویر سمت راست را تولید کرده است.
محققان nVIDIA برای تولید از یک جفت GAN (مجموعهای از الگوریتمهای هوش مصنوعی) استفاده کرده اند که از فضای مشترکی برای تصور استفاده میکنند. برای تصویر برفی، یکی از GANها درختها، آسمان ابری، برفهای روی زمین و هر چیز دیگری را یاد میگیرد. GAN دوم هم برای یادگیری مفهوم تابستان آموزش میبیند. به کمک Unsupervised Learning و با توجه به استفاده از فضای تصور مشترک بین GANها، آنها پارامترهای خود را با هم به اشتراک میگذارند و از تصویر زمستان، تابستان آن محیط را تصور میکنند.
استفاده از GANها در سیستم آموزش Unsupervised Learning چیز جدیدی نیست اما nVIDIA با استفاده از الگوریتمهای خاصی توانایی تولید سایههای عمیق، زیر شاخ و برگ انبوه درختان در آسمان ابری-آفتابی را دارد که سرآمد هر نوع الگوریتمیست که تا کنون وجود داشته و به واقعیت کاملاً نزدیک است.
پتانسیلهای نهفته در این سیستم بسیار گسترده است و به دلیل کاهش نیاز به دادههای ابتدایی برای آموزش کامپیوتر و به تبع آن کاهش زمان یادگیری، محققان را قادر میسازد آنها را در زمینههای مختلفی مانند خودروهای بدون راننده استفاده کنند که در آن با یکبار تصویربرداری و آموزش به سیستم، انواع شرایط آب و هوایی مانند آفتابی، ابری، برفی، بارانی و تاریکی شب را خود سیستم بر اساس آموزش اولیه فرا میگیرد.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت