اجازه دهيد منطقي را كه در اول به آن اشاره شد، دوباره بيان كنم:
دو تصوير زماني مشابه اند كه اندازه ي آن ها (پهنا و ارتفاع) با هم برابر بوده و رنگ تمامي پيكسل هاي آن دو نظير به نظير با هم برابر باشد.
آيا از ديد اين منطق دو تصوير مشابه كه يكي نسبت به ديگري دوران داده شده، با هم مطابقت مي كنند؟
آيا اين منطق دو تصوير يكسان را كه يكي از آن ها داراي درخشندگي كم تري است، مشابه هم مي داند؟
آيا منطق اشاره شده براي مقايسه ي تصاوير داراي نويز كاربرد دارد؟
بياييد پا را اندكي فراتر بگذاريم و بگوييم آيا در رايانه هاي جاسوسي كه عكس يه فرد خلافكار را با تعداد زيادي از تصوير اشخاص در حجم گسترده اي از داده ها مانند فيلم هاي امنيتي ايستگاه هاي مترو مقايسه مي كنند، از چنين الگوريتمي مي توان استفاده كرد؟
پاسخ اين پرسش و ساير پرسش هاي مشابه خير است.
اين منطق براي مقايسه ي تصاويري كه در وضعيت ايده آل نيستند، نيازمند بازنگري است. در منطق منعطف تر براي يافتن تصاوير مشابه ما بايد الگو هايي را بين دو تصوير بيابيم كه بيش ترين شباهت را با يكديگر دارند. طبيعتا" اين منطق همواره به پاسخ صحيح نمي رسد.
در چنين روشي بايد نويز تصاوير را با الگوريتم هاي مختلف كاهش داد. در مقايسه ي پيكسل ها، كد رنگ دو پيكسل الزما" نبايد دقيقا" مشابه باشد بلكه نزديك بودن كد رنگ ها نيز كفايت مي كند. محدوده ي اين نزديك بودن نيز بسته به نوع كاربرد متفاوت است.
پي مي بريم كه با اعمال چندين پردازش تصوير مختلف، با فرآيند طولاني تري رو به رو هستيم. به همين دليل در برخي موارد مي توان حوزه هايي از تصاوير مختلف (نه كل بخش هاي يك تصوير) را به صورت تصادفي براي مقايسه انتخاب كرد.
فرض كنيم دو تصوير را براي مقايسه در اختيار چندين نفر قرار دهيم. مسلما" نبايد انتظار داشت كه پاسخ تمام اين افراد يكي باشد. جالب آن است كه پاسخ انسان ها فازي است. مثلا" يكي از اين افراد مي گويد " دو تصوير تقريبا" با هم مشابه اند " يا " دو عكس مشابهت چنداني با هم ندارد ". يعني پاسخ انسان مي تواند صفر (عدم تطابق)، يك (تطابق كامل) و هر مقدار بين صفر و يك باشد. در واقع پاسخ انسان بر خلاف ماشين دقيق نيست.
با پيدايش منطق فازي (Fuzzy Logic) اين امكان فراهم شد كه رايانه نيز مانند انسان تصميم گيري كند. در يك سيستم فازي متغير هاي دقيق (Crisp Variable) تبديل به ست هاي فازي مي شوند و قوانين فازي روي اين ست ها اعمال مي شود و درنهايت طي فرآيند Defuzzification، پاسخ هاي فازي مجددا" به پاسخ دقيق كه براي ماشين قابل فهم است تبديل مي شوند. بدين شكل مي توان قوانين فازي را كه اساس تصميم گيري يك سيستم هوشمند است، روي داده هاي قابل فهم براي يك ماشين اعمال كرد.
يك روش جالب براي مقايسه ي تصاوير استفاده از شبكه ي عصبي است. ما بايد شبكه ي عصبي مصنوعي (ANN) خود را ابتدا با چند تصوير نمونه آموزش دهيم. فرضا" عكس هاي مختلف از يك شخص را به همراه عكس هاي اشخاص ديگر وارد شبكه كنيم و به شبكه بگوييم كه اين ها تصاوير شخص X هستند و آن ها تصاوير شخص X نيستند. طي اين فرآيند شبكه ي عصبي خواهد چهره ي شخص X را فرا مي گيرد. آن گاه بسته به كيفيت يادگيري شبكه مي تواند در مورد هر تصويري اظهار نظر كند و بگويد هر تصوير چقدر با تصوير شخص مورد نظر شباهت دارد. اين شبكه ي عصبي مي تواند فازي فكر كند زيرا قادر است كه شباهت دو تصوير را با عددي بين صفر و يك بيان نمايد.
ما با در نظر گرفتن يك Threshold مي توانيم شباهت تصاوير را تعيين كنيم. به عنوان مثال با در نظر گرفتن مقدار 0.7 براي threshold، دو تصوير زماني مشابه هم هستند كه شبكه ي عصبي مذكور شباهت دو تصوير را بالاي 0.7 تشخيص دهد. اگر شبكه مقداري كم تر را از 0.7 را در خروجي نمايش دهد آن گاه دو تصوير متفاوت اند. انتخاب threshold بستگي به كاربرد دارد.
و اين مقدمه اي بود بر كاربرد هوش مصنوعي (AI) در مقايسه ي تصاوير.






پاسخ با نقل قول
Bookmarks