مایکروسافت اعلام کرده سیستم تشخیص گفتار این شرکت به میزان خطای ۵.۱ درصد رسیده است که کمترین مقدار به ثبت رسیده تا به این زمان است. این رقم در مقایسه با نرخ خطای ۵.۹ درصد قرار می گیرد که سال گذشته توسط گروهی از محققان متمرکز روی پروژه هوش مصنوعی مایکروسافت به ثبت رسیده بود.
سیستم تشخیص گفتار مایکروسافت در حالی توانسته نرخ خطای ۵.۱ درصد را ثبت کند که این رقم معادل با نرخ خطای ثبت شده توسط مترجمهای حرفهای انسانی است که از امکان گوش دادن چندین و چند باره گفتار بهرهمند هستند.
مطالعات جدید مایکروسافت توسط گروهی از محققان در مرکز تحقیقاتی هوش مصنوعی این شرکت انجام شده است. مطالعات و تحقیقاتی که با هدف رسیدن به دقتی معادل با آنچه در مترجمهای انسانی شاهد هستیم آغاز شده است. روی هم رفته، محققان در این تحقیقات موفق شدند با بهبود مدلهای زبانی و صداسازی طبیعی، میزان خطار را در مقایسه با آنچه در سال گذشته به ثبت رسیده بود کاهش دهند.
نکته قابل توجه اینکه محققان موفق شدند با پیادهسازی سازوکارهای مناسب، سیستم تشخیص گفتار را به نحوی بازطراحی کنند که امکان استفاده از کل مکالمه را داشته باشد. به این ترتیب، فهم کلمات و جملات به صورت ترکیبی و در تعامل با مجموعه کاملی از محتویات متنی انجام شده و این سیستم حتی موفق شد کلمات یا اصطلاحاتی را که در ادامه ادا خواهند شد پیشبینی کند. این راهکار، مشابه با روندی است که در مکالمههای افراد با یکدیگر شاهد هستیم.
سیستم تشخیص گفتار مایکروسافت در حال حاضر در سرویسهایی نظیر کورتانا، Presentation Translator و سرویسهای Microsoft Cognitive استفاده میشود.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت