شرکت OpenAI امروز از مدل هوش مصنوعی جدیدی با عنوان Voice Engine رونمایی کرد که قادر است با عملکردی خارق العاده صدای کاربران خود را تقلید کند. Voice Engine برای اینکه بتواند با موفقیت صدای مصنوعی کاربران را ایجاد کند تنها به یک نمونه 15 ثانیهای از صدای واقعی آنها نیاز دارد. پس از دریافت این صدای نمونه، این مدل هوش مصنوعی قادر است متون بلند را با همان لحن و تن صدا بخواند.
Voice Engine پلتفرم و مدل هوش مصنوعی جدید شرکت OpenAI است که میتواند در زمینه تبدیل متن به صدا انقلاب جدیدی ایجاد کند. شرکت سازنده این مدل اعلام کرده است که از سال 2022 مشغول کار بر روی آن بوده و قرار است از آن در قابلیت Read Aloud در چتبات هوش مصنوعی ChatGPT استفاده کند. خبر خوب این است که این مدل میتواند با حفظ لحن کاربران، برای خواندن متون مختلف به دیگر زبانها نیز مورد استفاده قرار بگیرد.
براساس گزارش Theverge، مدل هوش مصنوعی Voice Engine قادر است با دریافت یک نمونه 15 ثانیهای از صدای کاربران، لحن و تن صدای آنها را شبیهسازی کند و سپس با استفاده از آن متون مختلف را بخواند. هنوز زمان مشخصی برای انتشار عمومی این مدل هوش مصنوعی اعلام نشده اما OpenAI عنوان کرده است که دسترسی تعداد محدودی از شرکتهای آموزشی نظیر Age of Learning، پلتفرم قصه گوی HeyGen، دو شرکت سلامت محور Dimagi و Lifespan و همچنین شرکت Livox که در حوزه ارتباطات مبتنی بر هوش مصنوعی فعالیت دارد را به آن ممکن کرده است. گفته میشود Spotify نیز هم اکنون از این فناوری برای تولید بخشی از پادکستهای خود به دیگر زبانها استفاده میکند.
نمونه صداهای منتشر شده از سوی شرکت Age of Learning نشان میدهد که Voice Engine عملکرد بسیار خوبی دارد و قادر است با دریافت صدای 15 ثانیهای به عنوان نمونه با استفاده از آن صداهای مشابه دیگری تولید کند. به عنوان مثال با ارائه این نمونه 15 ثانیهای، از این مدل هوش مصنوعی درخواست شده است متون مختلفی را در حوزه عمومی، شیمی و طبیعت بخواند. همانطور که مشخص است این موتور هوش مصنوعی به خوبی قادر است لحن صدای موجود در نمونه را در تبدیل متون به صوت حفظ کند.
مطمئناً یکی از مشکلات بزرگ OpenAI در هنگام انتشار عمومی این مدل هوش مصنوعی، امکان استفاده نادرست گروهی از کاربران از آن است. OpenAI اعلام کرده است که پیش از انتشار این مدل باید از عملکرد مناسب و نحوه استفاده درست از آن اطمینان حاصل کرد؛ چرا که میداند این فناوری میتواند خطرناک باشد. OpenAI اعلام کرده است با شرکای خود بر سر قوانینی مشترک در هنگام استفاده از این مدل هوش مصنوعی به توافق رسیده است.
در همین رابطه بخوانید:
- حیرت توسعه دهندگان از تقلید این رفتار انسانی توسط ChatGPT
- در ادامه حاشیه تقلید صدای جو بایدن: استفاده از هوش مصنوعی در تماسهای تلفنی ممنوع اعلام شد
- اکنون هوش مصنوعی میتواند دستخط شما را جعل کند!
طبق این قوانین، نباید از هوش مصنوعی Voice Engine برای جعل هویت افراد و سازمانها بدون رضایت آنها استفاده کرد. شرکتهایی که به این مدل هوش مصنوعی دسترسی دارند همچنین باید پیش از استفاده از آن موافقت صریح گوینده اصلی صدا را جلب کرده باشند. همچنین کاربران نیز باید پیش از شنیدن صداهای تولید شده توسط این مدل از اینکه آنها با استفاده از هوش مصنوعی ایجاد شدهاند آگاهی لازم را کسب کنند. OpenAI همچنین قصد دارد از فناوریهای Watermark برای شناسایی و ردیابی منبع صداهای تولید شده توسط Voice Engine استفاده کند.
مدل هوش مصنوعی Voice Engine در حالی از سوی OpenAI معرفی شده است که چندی پیش تقلید صدای جو بایدن ریاست جمهوری آمریکا برای برقراری تماس تلفنی با انبوهی از مردم آمریکا و درخواست از آنها برای حضور پیدا نکردن پای صندوقهای رای جنجال زیادی به راه انداخت. بررسیها نشان داد که برای تقلید صدای بایدن از هوش مصنوعی استفاده شده است. این موضوع سبب شد که کمیسیون ارتباطات فدرال آمریکا (FCC)، تماسهای تلفنی مبتنی بر هوش مصنوعی و رباتها را در این کشور ممنوع اعلام کند. باید دید پاسخ این کمیسیون به این مدل هوش مصنوعی چه خواهد بود.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت