گوگل به تازگی یک قابلیت آزمایشی را معرفی کرده که به کاربران اجازه میدهد پس از جستجو، خلاصهای صوتی و گفتگومحور را از زبان دو مجری هوش مصنوعی را بشنوند. این فناوری با ترکیب الگوریتمهای پردازش زبان طبیعی، یادگیری عمیق و تولید گفتار پیشرفته، امکان دسترسی سریعتر و تعاملیتر به اطلاعات تخصصی را موتور جستجو و Gemini فراهم میکند و میتواند گامی مهم در تحول تجربه جستجوی موبایلی باشد.
نوآوری جذاب گوگل در تجربه جستجوی صوتی
تصور کنید وقتی درباره یک موضوع تخصصی جستجو میکنید، گوگل نه تنها صفحهای از نتایج متنی ارائه دهد، بلکه یک پادکست تولید شده توسط هوش مصنوعی را به صورت آنی در اختیار شما قرار دهد؛ تجربهای که مرزهای تعامل با موتورهای جستجو را به کلی دگرگون میکند.
بنابر گزارش TheVerge، این نوآوری تازه گوگل، نمونهای برجسته از کاربرد فناوریهای پیشرفته پردازش زبان طبیعی (NLP) و تولید محتوای صوتی خودکار (Text-to-Speech) است که در قالب یک آزمایش محدود بهنام «خلاصههای صوتی» (Audio Overviews) عرضه شده است.
چگونگی عملکرد قابلیت «خلاصههای صوتی» در جستجو
گوگل در جدیدترین فاز توسعه موتور جستجوی خود، یک قابلیت آزمایشی را رونمایی کرده که در آن، الگوریتمهای پیشرفته یادگیری عمیق و مدلهای زبانی تبدیلی (Transformer) مبتنی بر معماریهای مشابه GPT، در لایههای زیرین پردازش، متن جستجو شده را تحلیل کرده و در قالب یک بحث پادکستی AI-محور، به صورت بلادرنگ و با دو صدای مصنوعی «مجری» تولید میکند.
این صداها با استفاده از تکنولوژیهای سنتز گفتار پیشرفته (TTS) که در آن ویژگیهایی همچون لحن، آهنگ و تأکید طبیعی صدا شبیهسازی میشود، تجربهای بسیار انسانیتر را خلق میکنند.
این فناوری در واقع یکی از زیرمجموعههایی است که پیش از این با ارائه قابلیت NotebookLM گوگل دیده بودیم که در آن نتایج یک پژوهش بر پایه جستجو و تحلیل هوش مصنوعی را در همین صورت و با پادکستی که حاصل گفتگوی دو مجری هوش مصنوعی است، ارائه میداد.
پردازش معنایی و تولید محتوا توسط هوش مصنوعی
از منظر فنی، وقتی کاربر عبارتی مانند «هدفونهای حذف نویز چگونه کار میکنند؟» را جستجو میکند، این سیستم ابتدا با پردازش معنایی (Semantic Parsing) سوال و استخراج موجودیتها و مفاهیم کلیدی، به پایگاههای داده دانش (Knowledge Graph) و مستندات فنی مرتبط در فضای وب متصل میشود.
سپس، با استفاده از تکنیکهای ترکیب اطلاعات (Information Synthesis) و مدلهای تولید متن هوشمند (Text Generation Models)، خلاصهای جامع و دقیق از پاسخها آماده میشود. در ادامه کار، این خلاصه توسط یک سیستم تولید گفتار مبتنی بر شبکههای عصبی عمیق (Deep Neural Networks) تبدیل به پادکستی با دو مجری مصنوعی میگردد که در آن گفتگو به صورت دوطرفه و با رعایت اصول دیالوگهای انسانی صورت میپذیرد.
رابط کاربری و امکانات پخش صوتی
عملکرد این ابزار در قالب یک پلیر صوتی تعبیه شده در صفحه نتایج جستجو قابل استفاده است که کاربر میتواند پخش، توقف، بیصدا کردن و تنظیم سرعت صدا را به دلخواه خود انجام دهد. به علاوه، گوگل شفافیت علمی را با ارائه لینک مستقیم به منابع اصلی استفاده شده در تولید محتوا حفظ کرده است، که در زیر نوار پخش صوتی نمایش داده میشوند و امکان بررسی صحت و عمق اطلاعات فراهم میآورند.
زبانهای فعلی نتایج جستجوی پادکستی
در حال حاضر، این قابلیت پیشرفته فقط به زبان انگلیسی و برای کاربران داخل ایالات متحده در دسترس است، اما گوگل به تدریج دامنه کاربرد آن را گسترش داده و خلاصههای صوتی را در دیگر محصولات هوش مصنوعی خود مانند NotebookLM و پروژه Gemini نیز به کار گرفته است.
همانطور که میدانید، در این دو ابزار، امکان تولید محتواهای صوتی پویا بر اساس یادداشتهای کاربر، تحلیلهای عمیق پژوهشی Gemini و اسناد متنی موجود در گوگل داکس فراهم شده که بیانگر استراتژی یکپارچهسازی هوش مصنوعی در اکوسیستم نرمافزاری گوگل است.
آیا واقعاً نتایج جستجو به صورت پادکست کاربردی است؟
برای کاربرانی که ترجیح میدهند اطلاعات را به صورت شنیداری دریافت کنند یا در شرایطی هستند که امکان مطالعه مستقیم وجود ندارد، مانند هنگام رانندگی یا انجام کارهای دیگر، این قابلیت میتواند تجربهای ارزشمند و بهینه باشد.
از سوی دیگر، کاربران حرفهای و پژوهشگران ممکن است همچنان ترجیح دهند به صورت متنی و با امکان اسکن سریع و جستجوی دقیق در منابع، به اطلاعات دسترسی داشته باشند. با این حال، گوگل با ارائه لینکهای منابع در کنار پادکست، توازنی میان ارائه محتوای صوتی قابل درک آسان و امکان بررسی جزئیات فنی برقرار کرده که نشاندهنده تلاش برای پاسخ به نیازهای متنوع کاربران است.
در نهایت باید گفت که این قابلیت و نوآوری گوگل میتواند مکملی موثر برای روشهای سنتی جستجو باشد، نه جایگزینی کامل.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت