به تازگی گروهی از مهندسان موفق شدهاند با یک ایده جذاب، دسترسی به ChatGPT را برای رباتهای پیشرفته شرکت بوستون داینامیکس فراهم کنند. تصور کنید که وارد یک مکان تاریخی شدهاید و به جای راهنمای تور، یک ربات بوستون داینامیکس هر آنچه بخواهید را به شما گفته و هر اطلاعاتی نیاز باشد را در اختیارتان میگذارد. این همان ایدهای است که در این مطلب قرار است به آن بپردازیم.
این روزها ربات ها قصد دارند در همه وجوه زندگی ما وارد شوند و با معرفی مدل های زبانی بزرگ و چت بات های مولد مانند ChatGPT، از هر زمانی به تحقق بسیاری از اتفاقات فیلمهای علمی و تخیلی مانند I Robot و Ex-Machina نزدیکتر شدهایم.
در واقع میتوان اینطور گفت که هوش مصنوعی مولد در حال تغییر دادن شکل زندگی ما به حالتهای مختلف است؛ از کمک به دانش آموزان در حل مسائل پیچیده ریاضی گرفته تا نوشتن شعر، و حتی تولید تصاویر بر اساس تخیل و خواستههای ما. به همین دلیل است که میتوانیم آیندهای روشن را برای این فناوری در نظر بگیریم؛ فناوری که میتواند راهکارهای بسیار بیشتر و همچنین فرصت های استفاده نشده بیشماری را کشف و شرایط استفاده از آنها را فراهم کند.
بنابر گزارش ویندوز سنترال به نقل از شرکت Boston Dynamics که همگی آن را با رباتهای بسیار جذاب و منعطفش برای انجام امور متفاوت و شبیهسازی حیوانات مانند سگها میشناسیم، اخیراً در خبری اعلام کرده که با استفاده از قابلیتهای هوش مصنوعی مولد به موفقیتهای جدیدی دست یافته است. این شرکت با استفاده از ربات Spot خود که با ChatGPT و سایر مدل های هوش مصنوعی ادغام شده ، رباتی ایجاد کرد که به عنوان راهنمای تور گردشگری طراحی شده است!
طبق گفته تیم توسعه ربات، آنها با الهام از روشی از مایکروسافت، ChatGPT را با ایجاد ظاهری که گویی خط بعدی را در یک اسکریپت پایتون می نویسد، به نحوی ارتقا دادهاند تا بتواند به سوالات کاربری که در حال تعامل با ربات است به شکلی واقعگرایانه پاسخ دهد.
برای نمایش خروجی این طرح، بوستون داینامیکس طرحی برای ایجاد یک تور گردشگری ساده در محل کارخانه تولید رباتهای اسپات شکل داده که یک ربات اسپات در این محل به عنوان راهنمای بازدیدکنندگان، نقش آفرینی میکند.
این تیم همچنین اعلام نموده که LLM ادغام شده در ربات همچنین به Spot autonomy SDK، یک نقشه دقیق از سایت تور همراه با توضیحات یک خطی از هر مکان، و همچنین قابلیت پاسخگویی و پرسیدن سوال، مجهز شده که به بازدیدکنندگان اجازه میدهد در مورد هر کدام از اشیا و بخشهایی که در محل بازدید قرار دارد با ربات صحبت کنند.
همانطور که میدانید ChatGPT یک سرویس مبتنی بر متن است و به همین دلیل تیم توسعه بوستون داینامیکس از یک مبدل متن به گفتار واقعگرایانه توسعه یافته توسط ElevenLabs نیز استفاده کرده تا هم فرایند دریافت دستورات صوتی از بازدیدکنندگان و هم فرایند بازگشت آن به خوبی انجام شود.
جدا از این مورد گنجاندن دو دوربین دیگر در دو سمت سر ربات اسپات راهنمای تور این طرح نیز موجب شده تا درک اجسام و اشیای محیطی برای آن راحتتر شده و ربات بتواند با دانش بیشتری از شرایط محیطی خود به سوالات بازدیدکنندگان پاسخ دهد.
نکته جالب دیگر استفاده از یک سری الگوریتمهای جدید برای تغییر زبان بدن ربات جهت پاسخ دادن بهتر و نزدیکتر به حالت واقعی انسان بوده تا بازدیدکنندگان حس نزدیکی بیشتری با آن پیدا کنند. به لطف انتشار پک توسعه Spot 3.3، ربات قادر است بازوی خود را به سمت نزدیکترین فرد هدایت کند و در عین حال یک مفهوم خاص را توضیح دهد.
ظاهراً این ربات جذاب چندان هم بی نقص نیست و بوستون داینامیکس اعلام کرده که در برخی سوالات، پاسخهای اسپات داستان ما با اندکی توهم و عجیب روبرو بوده است. نکته دیگر وابستگی شدید به ChatGPT و اینترنت است؛ به نحوی که اگر در حین استفاده از ربات اینترنت با مشکل مواجه شود، پاسخهای ربات دچار مشکل خواهند شد.
به هر حال چنین رباتهایی نشان میدهند که کمکم در مسیری حرکت میکنیم که شاید تا 10 سال آینده بسیاری از اموری که نیاز به یک مجموعه دادههای مشخص برای ارائه خدمات دارند به مرور به رباتها سپرده شده و حتی در بسیاری موارد متوجه نشویم که ارائه دهنده یک سرویس به ما یک ربات است یا یک انسان!
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت