این روزها تولید کنندگان گوشی های هوشمند مدعی‌اند که همه ویژگی ها و قابلیت های موجود در محصولات آن ها به فناوری هوش مصنوعی و شناسایی اجسام مجهز شده است؛ از دوربین ها گرفته تا مدیریت حافظه های رم و تقریباً همه چیز از هوش مصنوعی و تشخیص اشیا با یادگیری عمیق استفاده می کنند تا عملکرد و قابلیت های بهتری فراهم آورند. در این حال سوالی که پیش می‌آید این است که بالاخره این قابلیت‌ها چه فواید حقیقی دارند و کدام یک از سیستم‌های تشخیص اشیا با یادگیری عمیق قدرتمند‌تر است؟ برای بررسی دقیق سه مورد از پیشرفته‌ترین و مورد انتظارترین گزینه‌های موجود در دسترس، با شهر سخت‌افزار همراه باشید.

فهرست مطالب این مقاله:

- فناوری هوش مصنوعی (AI) و تشخیص اشیا با یادگیری عمیق
- هوش مصنوعی و شناسایی اجسام در زندگی روزمره
- تشخیص اشیا در پردازش تصویر
- شناسایی غذاها توسط هوش مصنوعی و شناسایی اجسام
- شناسایی حیوانات توسط الگوریتم های تشخیص اشیا
- هوش مصنوعی در تشخیص اشیا خاص و محصولات
- توانایی هوش مصنوعی در خواندن متن
- نتیجه بررسی سه نرم‌افزار مبتنی بر هوش مصنوعی
- جمع‌بندی

فناوری هوش مصنوعی (AI) و تشخیص اشیا با یادگیری عمیق

هوش مصنوعی دانش و مهندسی ساخت ماشین‌هایی است که توانایی تقلید از هوش انسان و ارائه رفتار هوشمندانه‌ را دارد. امروزه این فناوری دیگر به ساخت ربات‌های پیشرفته و الگوریتم‌های پیچیده تشخیص چهره ختم نمی‌شود، بلکه هوش مصنوعی در تشخیص اشیا با یادگیری عمیق راه یافته و در صنایع مختلف صنعتی، پزشکی، نظامی، سیستم های امنیتی و غیره کاربرد دارد.

هوش مصنوعی و امکان تشخیص اشیا در پایتون

به عنوان مثال می‌توان به فناوری هوش مصنوعی و شناسایی اجسام در خودروهای پیشرفته نسل جدید اشاره کرد. استفاده هوش مصنوعی در تشخیص اشیا باعث شده تا این خودروها توانایی اشیا اطراف خود را داشته و از هرگونه برخورد با آن‌ها جلوگیری شود.

یا می‌توان به سیستم‌های هوش مصنوعی و شناسایی اجسام جدید اشاره کرد که به نابینایان در شناسایی اشیا اطراف‌شان و تشخیص هویت افراد کمک می‌کند.

الگوریتم های تشخیص اشیا با استفاده از فناوری هوش مصنوعی
هوش مصنوعی در تشخیص اشیا به ما کمک می‌کند

البته استفاده از الگوریتم های تشخیص اشیا با یادگیری عمیق چالش های زیادی پیش رو دارد، از جمله وجود اشیا مختلف در یک تصویر یا قاب، تغییر و تحرک پس زمینه، زوایای دید مختلف، شرایط عکاسی متفاوت از یک شی و غیره، که همه به سخت‌تر شدن فرایند توسعه این فناوری هوشمند کمک می‌کنند.

در همین رابطه بخوانید:

- تفاوت رنگ بندی هاردهای شرکت وسترن دیجیتال در چیست؟

هوش مصنوعی و شناسایی اجسام در زندگی روزمره

با این حال، این مشکلات باعث نشده که هوش مصنوعی و شناسایی اجسام مانند هر فناوری دیگری به زندگی روزمره ما وارد نشود. در حال حاضر شرکت‌های تولیدکننده گوشی هوشمند مدعی هستند که محصولات آن‌ها به دلیل داشتن هوش مصنوعی در تشخیص اشیا مختلف بسیار کاربردی بوده و می‌توانند به کاربران برای یافتن یک محصول در فروشگاه‌های آنلاین یا شناسایی کلمات در زبان‌های دیگر کمک کنند.

استفاده از فناوری هوش مصنوعی و شناسایی اجسام در زندگی روزمره
امکان تشخیص اشیا با یادگیری عمیق و یافتن نمونه‌های مشابه در اینترنت

کاربرد هوش مصنوعی و شناسایی اجسام به این دو مورد ختم نمی‌شود، با این حال موارد ذکر شده از پرمصرف‌ترین کاربردهای هوش مصنوعی در گوشی‌های جدید به شمار می‌آیند.

امکان مشاهده اکثر فرآیندهای صورت گرفته توسط این قابلیت ها وجود ندارد؛ اما قابلیت هوش مصنوعی در تشخیص اشیا با استفاده از دوربین، می تواند نمود جالبی از هوش مصنوعی و فناوری های مبتنی بر آن باشد.

در همین رابطه بخوانید:

- معایب عینک واقعیت مجازی؛ آیا هدست VR واقعاً خطرناک است؟

تشخیص اشیا در پردازش تصویر

گوگل و تعدادی از شرکت های تولید کننده گوشی های هوشمند، اخیراً قابلیت جدیدی را به دستگاه های خود اضافه کرده اند که کاربران می توانند با استفاده از آن  به شناسایی و کسب اطلاعات از اشیای اطراف خود بپردازند.

اساس کار این سیستم‌های تشخیص اشیا با یادگیری عمیق استفاده از بینایی ماشین است که برخلاف تصور، ساز و کار عملکردی ساده‌ای دارد و برای استفاده از آنها تنها کافی است که دوربین گوشی خود را روشن کرده و آن را به سمت شی مورد نظر بگیرید.

به صورت کلی فناوری تشخیص و شناسایی اشیا در گوشی‌های هوشمند از سیستم  پیچیده ای استفاده نمی کنند و تنها عکس ثبت شده توسط کاربران را با یک پایگاه داده متشکل از عکس های برچسب گذاری شده و دسته بندی شده مقایسه کرده و بهترین نتیجه را به نمایش می گذارند.

تصاویر موجود در این پایگاه های داده معمولاً توسط انسان ها جمع‌آوری و برچسب  گذاری شده اند. بدون شک، حجم چنین پایگاه داده ای بسیار بیشتر از آن است که بتوان آن را بر روی گوشی های هوشمند ذخیره کرد. با توجه به این موضوع، برای استفاده از این سرویس ها باید به ارتباط اینترنت دسترسی داشت.

الگوریتم های تشخیص اشیا توسط هوش مصنوعی گوشی

اگرچه این قابلیت ها از راهکار ساده ای برای شناسایی تصاویر استفاده می کنند، اما نتایج حاصل از عملکرد آن ها بسیار عالی است. در حال حاضر، گوگل با قابلیت Lens، سامسونگ با قابلیت Bixby Vision و هواوی با قابلیت HiVision مهم ترین شرکت های فعال در این حوزه هستند.

نکته قابل توجه این است که هرکدام از این شرکت ها به منظور شناسایی اشیا حاضر در تصویر از پایگاه های داده متفاوتی استفاده می کنند. گوگل یک پایگاه داده اختصاصی برای خود ایجاد کرده است. سامسونگ از پایگاه داده سایت Pinterest به منظور شناسایی اشیا استفاده می کند و هواوی نیز در این زمینه با مایکروسافت شراکتی را آغاز کرده و از پایگاه داده آن کمک می گیرد.

در همین رابطه بخوانید:

- واقعیت افزوده، واقعیت مجازی و واقعیت ترکیبی: نگاهی به مفاهیم

هرکدام از قابلیت های طراحی شده توسط این سه شرکت دارای ویژگی ها و امکانات مختلفی هستند؛ اما قصد داریم در این مطلب به بررسی دو ویژگی مشترک و اساسی از آن ها، یعنی شناسایی انواع مختلفی از اشیا و همچنین ترجمه متون بپردازیم. در زیر چالش های مختلفی برای بررسی عملکرد هرکدام از این قابلیت ها طراحی شده است.

در تمامی این بررسی ها، نتایج بدست آمده از برنامه گوگل لنز در سمت چپ، برنامه Bixby Vision در وسط و برنامه HiVision نیز در سمت راست تصاویر نشان داده شده است.

چالش اول: شناسایی غذاها توسط هوش مصنوعی و شناسایی اجسام

یک میوه گرد

شاید هر برنامه ای بتواند یک موز را از دیگر اشیا و میوه ها تشخیص دهد؛ اما مطمئناً شناسایی یک میوه با شکل رایج، مثلاً گرد از دیگر اشیا و میوه ها کار ساده ای نیست. به عنوان اولین ماموریت، الگوریتم های تشخیص اشیا یاد شده را به منظور شناسایی یک آلو مورد بررسی قرار می دهیم. نتایج این بررسی را می توانید در تصویر زیر مشاهده کنید.

کاربرد هوش مصنوعی در تشخیص اجسام گرد و میوه ها

همانطور که مشخص است گوگل لنز به خوبی توانسته این میوه را شناسایی کرده و با جستجوی همزمان، تصاویر دیگری را هم از آن به نمایش بگذارد. در سمت دیگر، Bixby Vision در تمامی تلاش  ها ناموفق عمل کرده و همانطور که تصویر بالا نشان می دهد حتی این میوه را به عنوان نوعی سنگ قیمتی تشخیص داده و در دیگر تلاش ها حتی نتیجه ای تحت عنوان توپ کریکت و تربچه نیز از این برنامه بدست آمده است. بررسی های بیشتر نشان می دهد که برنامه Bixby Vision حتی با تکرار پیاپی تلاش ها نیز قادر به شناسایی این میوه نبوده و نتوانسته از هوش مصنوعی در تشخیص اشیا به موفقیت برسد.

در همین رابطه بخوانید:

- گلچین بهترین هدست‌های واقعیت مجازی

اما باید بهترین نتیجه در این آزمایش را به برنامه HiVision نسبت دهیم. همانطور که مشخص است این برنامه توانسته علاوه بر شناسایی درست این میوه، اطلاعاتی از میزان انرژی به ازای مقداری مشخص و حتی میزان چربی و پروتئین حاضر در آن را هم به نمایش بگذارد. البته باید گفت که این نتایج با استفاده از حالت شناسایی غذا (Food Mode) بدست آمده است که توسط شرکت ها و سازمان های گوناگونی پشتیبانی می شود. در حالت عادی و بدون استفاده از این مد، برنامه HiVision، نمی تواند این آلو را به درستی شناسایی کند.

یک صبحانه فرانسوی

به نظر می رسد شناسایی یک کروسان (Croissant) برای هرسه این برنامه ها کاری ساده است؛ چرا که همه آن ها دارای یک شکل و رنگ خاص هستند. نتایج این بررسی را می توانید در تصویر زیر مشاهده کنید.

کاربرد هوش مصنوعی در تشخیص اجسام و غذاها

تصویر بالا نشان می دهد که تا حدود زیادی هرسه این برنامه ها در شناسایی این غذا موفق بوده اند. هرچند که به نظر می رسد Bixby Vision همچنان کمی در مورد نتیجه بررسی خود نامطمئن است. این برنامه به صورت مرتب نتیجه بدست آمده را تغییر می دهد، اما بازهم می تواند در لحظاتی خاص، عبارت Croissant را در مرکز تصویر به نمایش بگذارد. گوگل لنز نیز مطابق انتظار درست عمل کرده و توانسته است تصاویر مشابه ای را هم به نمایش بگذارد.

در همین رابطه بخوانید:

- اینترنت چیست؟ حقایق ترسناک و مخفی اینترنت را بدانید!

کروسان استفاده شده در این بررسی از نوع شکلاتی نبوده است؛ اما برنامه HiVision، بر آن اصرار دارد که این صبحانه دارای مغز شکلاتی است. البته نباید این نکته را فراموش کنیم که این برنامه هواوی، قدرت مناسبی در اندازه گیری اطلاعات تغذیه ای غذاها دارد.

بمب کالری

این آزمایش یک چالش اساسی برای هرکدام از برنامه های بالا محسوب می شود؛ چرا که معمولاً شکلات های مختلف دارای ظاهر و بافت یکسانی هستند و شناسایی آن ها از یکدیگر کار ساده ای نیست. به همین دلیل تصمیم گرفتیم که با برش شکلات، این سه برنامه را به چالش سخت تری دعوت کنیم. البته باید گفت عملکرد این برنامه ها بازهم مناسب بوده است.

کاربرد هوش مصنوعی در تشخیص خوراکی

در اصل باید گفت که تنها برنامه لنز گوگل نتوانسته است از این آزمایش سربلند بیرون بیاید. به نظر می رسد گوگل تاکنون زمان زیادی را برای برچسب گذاری تصاویر دسرها صرف نکرده است؛ چرا که هنوز قادر به تشخیص و شناسایی شکلات های «Snickers» نیست و آن ها را با نوعی شکلات چند لایه اشتباه می گیرد. در سمت مقابل Bixby Vision و HiVision به خوبی توانسته اند این نوع از شکلات را شناسایی کرده و اطلاعاتی را از حقایق تغذیه ای آن ها به نمایش بگذارند.

چالش دوم: شناسایی حیوانات توسط الگوریتم های تشخیص اشیا

پرنده را شناسایی کن

تصویر استفاده شده در این بررسی، از یک پرنده واقعی به ثبت نرسیده؛ اما به نظر می رسد به خوبی قادر است الگوریتم های هوش مصنوعی و شناسایی اجسام در برنامه های بالا را فریب دهد. نتیجه ثبت تصویر از یک لک‌لک مصنوعی که به صورت دکور مورد استفاده قرار گرفته است را می توانید در زیر مشاهده کنید.

فناوری تشخیص و شناسایی اشیا توسط هوش مصنوعی و یادگیری ماشین

تصویر بالا نشان می دهد که عملکرد دو برنامه گوگل لنز و HiVision برای شناسایی این پرنده بسیار عالی است و آن ها به خوبی توانسته اند گونه این پرنده را هم به درستی حدس بزنند. در سمت مقابل نتایج حاصل از برنامه Bixby Vision بازهم عجیب به نظر می رسد؛ چرا که آن تنها توانسته تشخیص دهد که این تصویر مربوط به یک پرنده است. البته اگر به تصاویر پیشنهادی این برنامه دقت کنیم متوجه می شویم که شناسایی گونه این پرنده به درستی صورت گرفته است.

نژاد این سگ چیست؟

این آزمایش یک چالش جدی برای برنامه های فعال در حوزه تشخیص اشیا با یادگیری عمیق محسوب می شود؛ چرا که معمولاً سگ های در نژاد مختلف شباهت زیادی به یکدیگر دارند و تشخیص آن ها کار سختی برای آن‌ها محسوب می شود. به منظور پیچیده کردن این چالش، سگ را از نژادی انتخاب کرده ایم که به دیگر نژادها شبیه است و نزد مردم جهان نیز چندان شناخته شده نیست. نتایج این بررسی و عملکرد هوش مصنوعی در تشخیص اشیا و حیوانات را می توانید در تصویر زیر مشاهده کنید.

تشخیص اشیا و حیوانات با یادگیری عمیق

نتایج بدست آمده از این بررسی شگفت انگیز و فراتر از انتظار به نظر می رسد. در حالی که انتظار نمی رفت هیچکدام از این برنامه ها بتوانند نژاد این سگ را به درستی حدس بزنند، گوگل لنز بازهم موفق عمل کرده است. Karakachan که در نقاطی از دنیا با عنوان Bulgarian Shepherd نیز شناخته می شود نژاد دقیق این سگ است و همانطور که در تصویر بالا مشخص است، گوگل لنز توانسته به واسطه فناوری هوش مصنوعی و شناسایی اجسام آن را به درستی شناسایی کند.

در همین رابطه بخوانید:

- اینترنت اشیا در خدمت تلویزیون‌های سامسونگ

اگرچه عمده سگ ها دارای رنگ سیاه و سفید هستند، اما هرسه این برنامه ها به خوبی توانسته اند گونه این حیوان که دارای رنگ  پوست خاصی است را به درستی شناسایی کنند. با توجه به اینکه این بررسی را به عنوان یک چالش اساسی طراحی کرده ایم، بازهم باید گفت که نتایج بدست آمده از دو برنامه HiVision و Bixby Vision نیز قابل قبول است؛ هرچند که اطلاعات نمایش داده شده توسط آن ها چندان دقیق نیست.

این عروسک چه حیوانی است؟

چالش سخت دیگری که می توان این سه برنامه را به آن دعوت کرد، شناسایی عروسکی است که با استفاده از شکل یک حیوان خاص طراحی شده است. تصاویر زیر از عروسکی شبیه به گوسفند به ثبت رسیده است. با توجه به اینکه این عروسک تناسب عجیبی از اعضای بدن گوسفند را به نمایش می گذارد، شناسایی آن با استفاده از فناوری هوش مصنوعی و شناسایی اجسام کار ساده ای نیست. همین موضوع سبب شده است تعدادی از این برنامه ها در شناسایی این حیوان با مشکل روبرو شوند.

کاربرد هوش مصنوعی در تشخیص اجسام

همانطور که در تصویر بالا هم دیده می شود، گوگل لنز توانسته است حیوانی که این عروسک با الهام از آن طراحی شده است را به خوبی شناسایی کند. نکته قابل توجه این است که این برنامه حتی در تلاش های مجدد و با استفاده از تصاویر دیگر نیز در تشخیص این حیوان موفق عمل می کند.

در سمت مقابل دو برنامه HiVision و Bixby Vision در شناسایی و تشخیص اشیا با یادگیری عمیق، تنها به واژه «Toy» یا اسباب بازی اشاره دارند. با توجه به اینکه این عروسک بیش از اینکه به یک گوسفند واقعی شبیه باشد، یک اسباب بازی محسوب می شود، نمی توان به عملکرد این دو برنامه خرده گرفت.

باید توجه داشت که برنامه Bixby Vision همچنان در شناسایی این شی نیز با مشکلاتی روبرو است و به عنوان تصاویر پیشنهادی، عکس هایی از دسرهای خامه ای به نمایش می‌‌گذارد. هرچند که نتایج بدست آمده از این برنامه چندان راضی کننده نیست؛ اما حداقل سرگرم کننده است.

چالش سوم: هوش مصنوعی در تشخیص اشیا خاص و محصولات

بخش اعظمی از تبلیغات و بازاریابی برای این سه برنامه، در حوزه شناسایی محصولات و دستگاه های موجود در بازار صورت می گیرد. شرکت های پشتیبان از این برنامه ها ادعا دارند که آن ها می توانند تنها توسط یک عکس، دستگاه یا محصول موردنظر را شناسایی و اطلاعات دقیقی را از آن به نمایش بگذارند. حتی بخشی از این برنامه ها می توانند لینک های مناسب برای خرید آن محصول را هم در اختیار کاربران خود قرار دهند.

با توجه به این موضوع، مناسب است که بخشی از بررسی های خود از این برنامه ها را به قابلیت شناسایی دستگاه ها و محصولات مختلف، معطوف کنیم.

شی سفید مرموز

اگرچه این روزها اغلب افراد می توانند هدفون های ایرپادز اپل و جعبه آن را شناسایی کنند، اما شکل آن به گونه ای است که به راحتی می تواند الگوریتم های هوش مصنوعی و شناسایی اجسام را فریب دهد. این موضوع سبب شده است که شناسایی آن توسط این برنامه ها در هاله ای از ابهام باشد. در ابن بخش قصد داریم تصویر جعبه یک ایرپاد را به این سه برنامه معرفی کنیم تا ببینیم کدام یک از آن ها قدرت شناسایی آن را دارند. نتایج بدست آمده از این بررسی در تصویر زیر قابل مشاهده است.

قدرت و دقت هوش مصنوعی در تشخیص اشیا

می توان گفت نتایج بدست آمده از هرسه برنامه قابل قبول است؛ اما بدون شک برنده این رقابت گوگل لنز است که علاوه بر شناسایی درست ایرپاد های اپل، اطلاعات مختصری از آن را هم به نمایش درآورده است.

در همین رابطه بخوانید:

- نگاهی جامع به تکنولوژی وای فای (شبکه Wi-Fi)

Bixby Vision در ابتدا تصور کرد که این تصویر مربوط به یک قالب صابون است؛ اما در ادامه توانست این محصول را به درستی شناسایی کند. برنامه HiVision نیز در این بررسی تنها توانست نسخه های مشابه و غیراصلی از این هدفون های اپل را شناسایی کند که نتیجه کاملی محسوب نمی شود.

به نظر می رسد گوناگونی تصاویر موجود از محفظه شارژ ایرپادهای اپل سبب شده است که این سه برنامه حداقل بتوانند به واسطه هوش مصنوعی در تشخیص اشیا، تصاویر مشابه‌ای را از آن  یافته و به نمایش درآورند.

لرد سیاه کوچولو

این چالش را باید از یک جهت ساده و از جهتی دیگر سخت بدانیم. ساده از این جهت که Darth Vader (از شخصیت‌های اصلی فیلم‌های جنگ ستارگان) یکی از شناخته شده ترین شخصیت ها در حوزه فرهنگ و هنر محسوب می شود و سخت از این نظر که می توان هزاران محصول که با استفاده از کلاه‌خود آن طراحی شده اند را معرفی کرد. با توجه به این موضوع، بررسی نتایج حاصل از این چالش می تواند جالب باشد.

الگوریتم های تشخیص اشیا در یادگیری عمیق

همانطور که مشخص است هیچکدام از این سه برنامه نتوانسته اند حتی با استفاده از هوش مصنوعی و شناسایی اجسام، این شخصیت را به درستی شناسایی کنند؛ اما تصاویر مشابه‌ای را از آن به نمایش گذاشته اند.

یک قاب فریم زیبا

شناسایی برند و شرکت تولید کننده یک عینک زیبا، می تواند یکی از قابلیت های جذاب برنامه های شناسایی اشیا باشد؛ اما با توجه به اینکه اکثر عینک ها دارای ظاهری یکسان و مشابه هستند، شناسایی آن ها از یکدیگر می تواند کاری سخت و غیرممکن برای آن‌ها باشد. به این منظور از عینکی استفاده می کنیم که ظاهری خاص دارد و توسط یک برند معروف تولید شده است.

کاربرد هوش مصنوعی در تشخیص اشیا و لوازم

باید گفت در این چالش دو برنامه گوگل لنز و HiVision بهترین نتیجه را به نمایش گذاشته اند. هردوی این برنامه ها به صورت مشخص به برند Dolce & Gabbana، که سازنده این عینک است اشاره کرده  و تصاویر دیگری از آن را هم از فضای وب جمع آوری و در معرض دید کاربران قرار داده اند. در سمت مقابل، نتایج بدست آمده از برنامه Bixby Vision، شامل چند عکس مشابه می شود؛ اما نشانه هایی از برند سازنده آن به چشم نمی خورد.

چالش چهارم: کاربرد هوش مصنوعی در تشخیص اجسام و خواندن متن

به احتمال فراوان شما هم با ما هم عقیده اید که ترجمه آنی و در لحظه متون، می‌تواند مهم ترین قابلیت نرم‌افزارهای مرتبط با حوزه هوش مصنوعی و شناسایی اجسام محسوب شود. در قابلیتی مشترک، این سه برنامه قادر هستند با دریافت یک متن در زبان خارجی، خیلی سریع آن را ترجمه کرده و به نمایش درآورند. مطمئناً  استفاده از این قابلیت برای کسانی که قصد دارند به کشورهای دیگر سفر کنند، بسیار مفید است.

اما کدام یک از سه برنامه بالا در این بخش دارای قدرت و توانایی بیشتری است؟ با طراحی چالش های زیر قصد داریم به این سوال پاسخ داده و توانایی هوش مصنوعی در تشخیص اشیا و متن را بسنجیم.

یک علامت اخطار به زبان آلمانی

ممکن است هنگامی که در کشور آلمان در حال قدم زدن در یک پارک هستید یک علامت اخطار را مشاهده کنید که قصد دارد مطلب مهمی را بیان کند. شما زبان آلمانی بلد نیستید و همچنین به دنبال آن هستید که در هنگام حضور در این کشور به مشکلی برنخورید. به این منظور می توانید گوشی خود را از جیب خارج کرده و به هوش مصنوعی و قابلیت تشخیص اشیا با یادگیری عمیق اجازه دهید که این علامت اخطار را برای شما ترجمه کند. نتیجه حاصل می تواند یکی از موارد زیر باشد که به ترتیب مربوط به برنامه های گوگل لنز، Bixby Vision و HiVision هستند.

ترجمه متن توسط هوش مصنوعی

ترجمه متن توسط هوش مصنوعی

ترجمه متن توسط هوش مصنوعی

می توان گفت همه این برنامه ها قادر هستند با استفاده از هوش مصنوعی در تشخیص اشیا و متن یک ترجمه مناسب در مورد این متن اخطار را به کاربران منتقل کنند؛ اما ترجمه صورت گرفته توسط برنامه هواوی از دیگر ترجمه ها کمی متفاوت است. برنامه HiVision، به دلایلی کلمه «Lead» را هم به ترجمه خود اضافه می کند. عبارت «All dogs must be walked on a leash! Excluding guide dogs» را می توان به عنوان ترجمه دقیق این متن معرفی کرد.

یک علامت اخطار به زبان ژاپنی

به منظور بررسی قدرت ترجمه این سه برنامه، این بار قصد داریم یک علامت اخطار که به زبان ژاپنی نوشته شده است را در اختیار آن ها قرار دهیم. نتایج عملکرد این سه برنامه را می‌توانید در زیر مشاهده کنید. این نتایج به ترتیب مربوط به برنامه های گوگل لنز، Bixby Vision و HiVision می شود.

ترجمه متن توسط هوش مصنوعی

ترجمه متن توسط هوش مصنوعی

ترجمه متن توسط هوش مصنوعی

بار دیگر به نظر می رسد که عملکرد این برنامه ها در بخش ترجمه مشابه و خوب است. هرسه این برنامه ها بازهم متنی یکسان و مشابه را به نمایش می گذارند و نشان می دهند که پارک کردن خودرو در این منطقه به علت فعالیت ایستگاه آتش نشانی ممنوع است.

متنی به زبان فرانسه

به نظر می رسد وقت آن رسیده است که چالش سخت تری را برای این برنامه های هوش مصنوعی و شناسایی اجسام طراحی کنیم. باید دید عملکرد آن ها هنگامی که با یک متن ناشناخته طولانی روبرو می شوند چگونه خواهد بود. این برنامه ها در وهله اول باید زبان متن را تشخیص داده و سپس به ترجمه آن اقدام کنند. نتیجه بدست آمده از برنامه گوگل لنز در سمت چپ، برنامه Bixby Vision در وسط و برنامه HiVision نیز در سمت راست تصویر زیر نشان داده شده است.

ترجمه متن توسط هوش مصنوعی و یادگیری ماشینی

همانطور که مشخص است هردو برنامه گوگل لنز و HiVision، توانسته اند این متن فرانسوی را به خوبی به زبان انگلیسی ترجمه کنند. با توجه به این ترجمه های صورت گرفته، می‌توان پی برد که این متن به داستان زیبای کلاغ و روباه مربوط است. به نظر می رسد گوگل در بخش توانایی هوش مصنوعی در تشخیص اشیا سرمایه‌گذاری بیشتری کرده است؛ چرا که متن ترجمه شده از سوی آن تا حدودی بهتر به نظر می رسد. متن ترجمه شده توسط برنامه هواوی نیز دچار کمی گنگی است.

متن خروجی از برنامه Bixby Vision کاملاً عجیب به نظر می رسد و در بسیاری از بخش ها ترجمه ناموفق صورت گرفته است. نکته عجیب این است که در پایین متن ترجمه شده عبارت «ترجمه شده توسط گوگل» دیده می شود؛ به این معنی که هوش مصنوعی و شناسایی اجسام سامسونگ برای ترجمه این متن از موتور گوگل کمک گرفته است. تحت این شرایط باید انتظار داشته باشیم که متن ترجمه شده توسط گوگل لنز و Bixby Vision شبیه یکدیگر باشد، اما همانطور که در بالا مشخص است تفاوت های زیادی به چشم می خورد.

به منظور بررسی بهتر، می توان متون ترجمه شده توسط این برنامه ها را با متن اصلی مقایسه کرد که مسلماً خود شما می‌توانید بهترین قضاوت را داشته باشید.

نتیجه بررسی سه نرم‌افزار مبتنی بر هوش مصنوعی و شناسایی اجسام

پس از بررسی های صورت گرفته، اکنون نوبت به آن رسیده است که در مورد قدرت و کارایی هرکدام از این برنامه ها تشخیص اشیا با یادگیری عمیق صحبت کنیم.

باید گفت که گوگل لنز در حال حاضر برترین برنامه هوش مصنوعی در تشخیص اشیا است. هنگامی که این برنامه یک شی خاص را شناسایی می کند، یک دکمه ظاهر می شود که کاربران با لمس آن می توانند به اطلاعات بیشتری از آن شی دسترسی پیدا کنند.

این برنامه گاهی از اوقات به صورت پیوسته به اسکن کردن محیط می پردازد و شیئی که درست در مقابل کاربران قرار دارد را انتخاب نمی کند. البته این قابلیت می تواند در گاهی از اوقات به کاربران در تشخیص اشیا کمک کند؛ چرا که ثبت تصویر از زاویه های گوناگون، سبب می شود که گوگل لنز بتواند با دقت بیشتری نسبت به شناسایی آن ها اقدام کند. در کل باید گفت که در حال حاضر، گوگل لنز قدرتمندترین و بهترین برنامه موجود در حوزه شناسایی اشیا و ترجمه متون است.

تشخیص اشیا با یادگیری عمیق

برنامه Bixby Vision که محصولی از سامسونگ است، عملکرد ناپایداری دارد. اگرچه این برنامه گاهی از اوقات قادر به شناسایی اشیا مختلف است و می تواند با دقت مناسبی متن های کوچک (نظیر علامت های اخطار) را ترجمه کند، اما باید گفت در اکثر مواقع با مشکلاتی روبرو است. از سوی دیگر این برنامه به منظور نمایش نتایج دقیق، به زمان زیادی نیاز دارد. البته این موضوع تنها به علت اینکه ما از پاسخ درست سوالات آگاهی داشتیم مشخص شده است.

با توجه به این اطلاعات باید گفت اگر به منظور شناسایی یک شی، تنها از برنامه Bixby Vision استفاده می کنید، شانس عامل مهمی در دسترسی به پاسخ درست است. نتایج نمایش داده شده توسط این برنامه در عرض یک ثانیه بارها تغییر می کند و نکته قابل توجه این است که این نتایج در اکثر مواقع ربطی به هم ندارند و در انواع مختلفی از اشیا دسته بندی می شوند. شاید بهتر باشد که این برنامه به جای تعویض پی  در پی نتایج، یک نتیجه خاص را انتخاب کرده و در همه حال آن را به نمایش بگذارد.

برنامه HiVision از شرکت هواوی نیز در تست های ما عملکرد بسیار خوبی را از خود نشان داده است و می توان آن را در بسیاری از مواقع به عنوان یک برنامه قدرتمند و مفید معرفی کرد. به ویژه عملکرد این برنامه در شناسایی غذاها بسیار عالی به نظر می رسد؛ چرا که قادر است علاوه بر شناسایی دقیق، اطلاعات مناسبی را هم از حقایق تغذیه ای آن ها به نمایش بگذارد.

استفاده از هوش مصنوعی و یادیگری ماشین در شناسایی حیوانات

مهم ترین ایراد این برنامه را باید در بخش شناخت شیِ هدف، معرفی کنیم. به عنوان مثال اگر شی موردنظر خود را روی یک میز قرار دهید، این برنامه در هنگام شناسایی آن، به میز نیز اشاره می کند. حتی در گاهی از اوقات شاهد آن هستیم که این برنامه به اشتباه نسبت به شناسایی کفپوش محیط که در پس زمینه تصاویر وجود دارد نیز اقدام می کند.

به نظر می رسد هواوی باید در رابط کاربری این برنامه نیز تغییرات زیادی صورت دهد. این کار سبب می شود که ظاهر این برنامه نیز زیباتر به نظر برسد. کادرهای شفاف و مستطیلی شکلی که این برنامه به منظور نمایش اطلاعات استفاده می کند کمی قدیمی به نظر می رسد و سبب شده است ظاهر کل برنامه نیز نازیبا باشد.

نکته خوب و قابل توجه در مورد این برنامه ها این است که هرچه از زمان تولید آن ها بگذرد و کاربران بیشتری از آن ها استفاده کنند، عملکرد کلی آن ها نیز بهتر می شود. اگر در حال حاضر نتایج مناسبی را از این برنامه ها شاهد هستیم، باید در سال های آینده انتظار عملکرد بهتری را از آن ها داشته باشیم. ممکن است روزی برسد که برای دسترسی به نام، شماره تلفن یا ایمیل افراد تنها کافی باشد دوربین خود را روشن کرده و به سمت صورت آن ها بگیرید. تکرار چالش های بالا ظرف یکی دو سال آینده و مقایسه نتایج بدست آمده نیز می تواند ایده جذابی باشد.

جمع‌بندی

تشخیص اشیا در تصاویر مختلف یکی از زمینه‌های تحقیقاتی مهم در حوزه‌ی بینایی کامپیوتر و هوش مصنوعی به شمار می‌آید که طی چند سال گذشته پیشرفت‌های چشم‌گیر داشته و توانسته به گوشی‌های موبایل عرضه شده در بازار نیز راه یابد.

فناوری هوش مصنوعی و شناسایی اجسام در زندگی روزمره

از مهمترین مزایایی که الگوریتم‌های تشخیص اشیا با یادگیری عمیق (Deep Learning) به ارمغان می‌آورند، می‌توان به دقت تشخیص قابل‌قیاس و حتی بهتر از انسان، قابلیت ضد مداخله و استخراج و کلاس‌بندی هزاران مشخصه از چهره افراد و وسایل اشاره کرد.

کاربرد هوش مصنوعی در تشخیص اشیا همچنان در مراحل تحقیق و توسعه به سر می‌برد و در آینده نه چندان دور، پیشرفت‌های حاصل شده در این حوزه بدون شک می‌تواند به تسهیل زندگی و رفع بسیاری از مشکل مردم کمک کنند.

نظر خود را اضافه کنید.

ارسال نظر بدون عضویت در سایت

0

نظرات (3)

  • مهمان - amirali

    سلام من خیلی وقته دارم از گوگل لنز استفاده میکنم ولی از هفته ی پیش میرم توش میگه شما افلاین هستید در صورتی که اینتزنت هم روشنه حتی از ف-ی-ل-ت-ر-ش-ک-ن هم استفاده کردم ولی بازهم نوشت شما افلاین هستید دلیلش چی میتونه باشه؟ ممنون میشم جواب بدید

  • مهمان - علی

    چون شرکت بنز ، ماشین می سازه ، پس شرکت های دیگه ، ماشین نسازن.
    مگه میشه؟
    هر کشوری دوست داره رو پای خودش بایسته و از محصولات خودش استفاده کنه.
    علتش هم اینه که میخوان وابسته نباشن و شغل ایجاد کنن.
    خواهشا یه مقدار وسیعتر به قضایا نگاه کنید.

  • مهمان - سجاد

    تو این موارد گوگل قطعا بهترین نتیجه رو داره و اصلا طراحی‌و پیاده سازی این قابلیت ها توسط شرکت های سامسونگ و هواوی کاملا اشتباهه
    البته این دو شرکت انگار مجبورن هر چیزی یه محصول بدن
    مثل سیستم عامل هواوی و سامسونگ بیکسی و ....

ورود به شهرسخت‌افزار

ثبت نام در شهر سخت افزار
ورود به شهر سخت افزار

ثبت نام در شهر سخت افزار

نام و نام خانوادگی(*)
لطفا نام خود را وارد کنید

ایمیل(*)
لطفا ایمیل خود را به درستی وارد کنید

رمز عبور(*)
لطفا رمز عبور خود را وارد کنید

شماره موبایل
Invalid Input

جزو کدام دسته از اشخاص هستید؟(*)

لطفا یکی از موارد را انتخاب کنید