محققان nVIDIA، دستاوردهای مهم خود در زمینه Deep Learning را به نمایش می‌گذارند

توضیحات: شایان اوصیا; دسته: اخبار علمی و تکنولوژی; 13 آذر 1396 13:55

شرکت nVIDIA حاصل تلاش بیش از 120 محقق خود را طی چهار مقاله‌ی پذیرش شده در کنفرانس NIPS که هم اکنون در حال برگزاریست، به نمایش گذاشت. این مقالات در زمینه قابلیت یادگیری کامپیوترها، درک تصویری آنها، اتومبیل‌های بدون نیاز به راننده، روباتیک و معماری کامپیوترهاست.

کنفرانس NIPS نوعی کنفرانس و ورکشاپ در حوزه‌ی هوش مصنوعیست که بیش از 30 سال قدمت دارد و هر ساله در ماه دسامبر برگزار می‌شود و محققان آخرین دستاوردهای خود در زمینه شبکه‌های عصبی مصنوعی (ANN) و Machine Learning را به نمایش و اشتراک می‌گذارند.

محققان هوش مصنوعی nVIDIA در زمینه‌های مختلفی کار می‌کنند؛ از برنامه ریزی سیستم‌ها و پردازش‌های تحت GPU گرفته تا رباتیک و درک تصویری سیستم‌های کامپیوتری (Computer Vision). این تحقیقات در نهایت منجر به ساخت ابزار و تولید تکنولوژی برای پیشرفت در زندگی، مانند وارد کردن هوش مصنوعی در حوزه‌ی اتومبیل‌های بدون راننده و سلامتی می‌شود.

یکی از چهار مقاله nVIDIA که در زمینه ادراک تصویری کامپیوترهاست با نام Learning Affinity via Spatial Propagation Networks توسط محققی به نام Sifei Liu ارائه شده که به صورت مختصر به تشریح آن می‌پردازیم.

کامپیوتر برای درک یک تصویر در ابتدا باید هریک از پیکسل‌های تصویر را بشناسد. به عنوان مثال بداند کدام پیکسل بخشی از چرخ یا بدنه دوچرخه است و یا کدامیک مربوط به درخت پشت آن است که دوچرخه به آن تکیه کرده. به این مرحله تقسیم بندی تصویر (Image Segmentation) گفته می‌شود و سیستم برای داشتن دقت و کارایی در این زمینه با نوعی چالش مواجه است.

شبکه‌های Deep Learning از بسط قوانین فیزیک برای درک بهتر یک تصویر و یافتن رابطه‌ی بین پیکسل‌های مجاور استفاده می‌کنند که به کمک آن می‌توانند تفاوت چرخ، پره و فضای خالی بین پره‌ها را تشخیص دهدند. به این توانایی، Spitial Affinity گفته می‌شود که غیر از تشخیص بخش‌های مختلف یک تصویر توانایی یادگیری برای تشخیص سایر ویژگی‌های یک تصویر مانند رنگ، جنس و... را نیز دارد.

شبکه‌ی Spatial Propagation در یاد گیری‌های خود به طور کامل از تحلیل داده‌های دریافتی از تصویر استفاده می‌کند و آن را با هیچ طرح‌ از قبل کشیده شده‌ای مقایسه نمی‌کند. این توانایی سیستم را قادر می‌سازد هر نوع آموزشی را فراگیرد و به تحلیل هر نوع تصویری که نیاز به شناسایی در سطح پیکسل داشته باشد بپردازد. مات کردن تصویر (در فوتوشاپ)، رنگی کردن تصویر و یا تشخیص اجزای صورت، نمونه‌هایی از این تواناییست.

این مقاله در سایر بخش‌ها، شامل زیرساخت‌های این طرح و محاسباتیست که آن را پیاده سازی می‌کند و نشان می‌دهد نسبت به ایده‌های گذشته خود، به مراتب سریعتر است. این شبکه با پیاده سازی بر اساس برنامه نویسی موازی CUDA و قدرت پردازشی GPU ها، تا 100 برابر طرح‌های گذشته می‌تواند سریعتر باشد.

مقاله دیگری از nVIDIA که جزء موضوعات رو به رشد در کنفرانس NIPS امسال است مربوط به یادگیری از طریق کشف الگوریتم‌های پنهان و مدل سازی مفهوم فراگیری شده، می‌شود. این مقاله با نام Unsupervised Image-to-Image Translation Networks در راس سایر مقالات بوده و توسط Ming-Yu Liu، محقق nVIDIA ارائه شده است.

تا امروز از قابلیت Deep Learning بیشتر بر اساس Supervised Learning برای آموزش سیستم‌ها استفاده شده تا بتوانند مانند انسان‌ها قابلیت تشخیص تصاویر را داشته باشند. در این نوع آموزش، سیستم به کمک الگوهایی که از پیش به آن معرفی می‌شود مفاهیم را فرا می‌گیرد. به عنوان نمونه در آموزش Supervised سیستم به راحتی می‌تواند یک سگ جرمن شپرد را از کرگی تشخیص دهد در صورتی که نژاد این دو سگ از پیش برای آموزش در اختیار آن قرار داده شده باشد.

برای ارتقاع توانایی تشخیص و افزودن قابلیت تصور در کامپیوترها، مانند دیدن یک عکس در زمستان و تصور کردن آن در تابستان محققان از سیستم Unsupervised Learning استفاده کرده اند. نمونه ای از مدل‌ سازی انجام شده توسط این سیستم را در تصویر زیر مشاهده می‌کنید که در آن تصویر هوای زمستانی و آفتابی به عنوان ورودی به شبکه داده شده و سیستم با تصور تابستان و هوای بارانی، تصاویر سمت راست را تولید کرده است.

محققان nVIDIA برای تولید از یک جفت GAN (مجموعه‌ای از الگوریتم‌های هوش مصنوعی) استفاده کرده اند که از فضای مشترکی برای تصور استفاده می‌کنند. برای تصویر برفی، یکی از GANها درخت‌ها، آسمان ابری، برف‌های روی زمین و هر چیز دیگری را یاد می‌گیرد. GAN دوم هم برای یادگیری مفهوم تابستان آموزش می‌بیند. به کمک Unsupervised Learning و با توجه به استفاده از فضای تصور مشترک بین GANها، آنها پارامترهای خود را با هم به اشتراک می‌گذارند و از تصویر زمستان، تابستان آن محیط را تصور می‌کنند.

استفاده از GANها در سیستم آموزش Unsupervised Learning چیز جدیدی نیست اما nVIDIA با استفاده از الگوریتم‌های خاصی توانایی تولید سایه‌های عمیق، زیر شاخ و برگ انبوه درختان در آسمان ابری-آفتابی را دارد که سرآمد هر نوع الگوریتمیست که تا کنون وجود داشته و به واقعیت کاملاً نزدیک است.

پتانسیل‌های نهفته در این سیستم بسیار گسترده است و به دلیل کاهش نیاز به داده‌های ابتدایی برای آموزش کامپیوتر و به تبع آن کاهش زمان یادگیری، محققان را قادر می‌سازد آنها را در زمینه‌های مختلفی مانند خودروهای بدون راننده استفاده کنند که در آن با یکبار تصویربرداری و آموزش به سیستم، انواع شرایط آب و هوایی مانند آفتابی، ابری، برفی، بارانی و تاریکی شب را خود سیستم بر اساس آموزش اولیه فرا می‌گیرد.

مطالب مرتبط پیشنهادی

نظر خود را اضافه کنید.

ارسال نظر بدون عضویت در سایت

نظرات (3)

مهمان - ali

و اون یکی شرکت هم میاد آخرین دست آوردهای خوشد رو در ساخت آفتابه به نمیاش میذاره.

فقط نگاه کنید که این انویدیا تو سه سال چطوری ده برابر رشد کرده و همه تحلیلگرها از این رشد موشکی تعجب کردن. از این به بعد هم رشدش صعودی تر هم میشه ، بعد اون شرکت آفتابه ساز له میشه.

حدود 6 سال قبل

0 دوست دارم پاسخ
مهمان - ali

و اون یکی شرکت هم میاد آخرین دست آوردهای خوشد رو در ساخت آفتابه به نمیاش میذاره.

فقط نگاه کنید که این انویدیا تو سه سال چطوری ده برابر رشد کرده و همه تحلیلگرها از این رشد موشکی تعجب کردن. از این به بعد هم رشدش صعودی تر هم میشه ، بعد اون شرکت آفتابه ساز له میشه.

حدود 6 سال قبل

0 دوست دارم پاسخ
Mohammad KH

حالا هی انویدیا رو با ای ام دی مقایسه کنید:yes

حدود 6 سال قبل

0 دوست دارم پاسخ