ثبت رکورد جدید دقت برای سیستم تشخیص گفتار مایکروسافت؛ فهم گفتار با دقت انسانی ممکن شد

توضیحات: حسن کریمی; دسته: اخبار علمی و تکنولوژی; 31 مرداد 1396 12:37

مایکروسافت اعلام کرده سیستم تشخیص گفتار این شرکت به میزان خطای ۵.۱ درصد رسیده است که کم‌ترین مقدار به ثبت رسیده تا به این زمان است. این رقم در مقایسه با نرخ خطای ۵.۹ درصد قرار می گیرد که سال گذشته توسط گروهی از محققان متمرکز روی پروژه هوش مصنوعی مایکروسافت به ثبت رسیده بود.

سیستم تشخیص گفتار مایکروسافت در حالی توانسته نرخ خطای ۵.۱ درصد را ثبت کند که این رقم معادل با نرخ خطای ثبت شده توسط مترجم‌های حرفه‌ای انسانی است که از امکان گوش دادن چندین و چند باره گفتار بهره‌مند هستند.

مطالعات جدید مایکروسافت توسط گروهی از محققان در مرکز تحقیقاتی هوش مصنوعی این شرکت انجام شده است. مطالعات و تحقیقاتی که با هدف رسیدن به دقتی معادل با آنچه در مترجم‌های انسانی شاهد هستیم آغاز شده است. روی هم رفته، محققان در این تحقیقات موفق شدند با بهبود مدل‌های زبانی و صداسازی طبیعی، میزان خطار را در مقایسه با آنچه در سال گذشته به ثبت رسیده بود کاهش دهند.

نکته قابل توجه اینکه محققان موفق شدند با پیاده‌سازی سازوکارهای مناسب، سیستم تشخیص گفتار را به نحوی بازطراحی کنند که امکان استفاده از کل مکالمه را داشته باشد. به این ترتیب، فهم کلمات و جملات به صورت ترکیبی و در تعامل با مجموعه کاملی از محتویات متنی انجام شده و این سیستم حتی موفق شد کلمات یا اصطلاحاتی را که در ادامه ادا خواهند شد پیش‌بینی کند. این راهکار، مشابه با روندی است که در مکالمه‌های افراد با یکدیگر شاهد هستیم.

سیستم تشخیص گفتار مایکروسافت در حال حاضر در سرویس‌هایی نظیر کورتانا، Presentation Translator و سرویس‌های Microsoft Cognitive استفاده می‌شود.