پس از مدتها انتظار شرکت گوگل بالاخره از هوش مصنوعی پیشرفته و شبه انسان Gemini خود رونمایی کرد. این هوش مصنوعی قرار است رقیب قدرتمند و شماره یک هوش مصنوعی GPT-4 شرکت OpenAI باشد. در ادامه با قابلیتهای این هوش مصنوعی که شاید باور آنها در حال حاضر برای ما اندکی دشوار باشد بیشتر آشنا خواهیم شد.
گوگل سرانجام آغاز بهکار رسمی پروژه Gemini خود از تیم هوش مصنوعی دیپ مایند را اعلام کرد؛ پروژهای که قرار است بیاید و عقبماندگی مشهود گوگل در مقابل رقبایی مانند OpenAI و مایکروسافت را در حوزه فناوری هوش مصنوعی جبران کرد. آنطور که گوگل مدعی شده، مدل هوش مصنوعی جدید این شرکت میتواند همچون یک انسان با شما مکالمه کرده و واکنش نشان دهد؛ اقدامی که میتواند بحث درباره مزایا و خطرات هوش مصنوعی برای آینده جهان را دوباره داغ کند.
گوگل مدتها است که به دنبال ایجاد یک سرویس هوش مصنوعی است که بتواند با چت جیپیتی OpenAI رقابت کند. سرویس چتبات ChatGPT یکی از دستاوردهای خیرهکننده هوش مصنوعی است که پس از معرفی عمومی در سال گذشته، نظر عموم مردم را به خود جلب کرد. این فناوری میتواند به سؤالهای افراد درباره موضوعات مختلف پاسخهای صحیح و دقیق داده و همچون یک دستیار کاربر را راهنمایی کند.
اما بهنظر میرسد امروز گوگل به آروزی دیرینهاش دست یافته و با انتشار نسخه جدید چتبات هوش مصنوعی Bard گام بلندی در زمینه پیشرفت این فناوری برداشته است. این سرویس که بهزبانهای مختلف برای مردم اغلب کشورهای جهان در دسترس قرار دارد، اکنون با فناوری هوش مصنوعی Gemini بهروز شده است؛ فناوری که گوگل حدود یک سال است روی آن کار میکند.
بهگفته پیچای، گوگل در ماههای آینده، سه نسخه متفاوت از این فناوری را در طیف گستردهای از محصولات و سرویسها ارائه خواهد کرد.
ساندرا پیچای، مدیرعامل گوگل در این ارتباط میگوید:
اکنون آغاز عصر Gemini است. اکنون زمان تحقق اهدافی است که هنگام شروع بهکار Google DeepMind در سر داشتیم.
درحقیقت، DeepMind آزمایشگاه هوش مصنوعی گوگل است که Gemini نیز در آن متولد شده و توسعه یافته است. بهگفته پیچای و دمیس هاسابیس، مدیران ارشد این شرکت، Gemini درمقایسهبا فناوری چتبات قبلی گوگل بسیار قدرتمندتر بوده و میتواند پاسخهای دقیقتری بدهد. همچنین، این فناوری توانایی بیشتری در تقلید از انسانها در شرایط خاص دارد.

دستیابی به فناوری هوش مصنوعیِ؛ آرزوی دیرینه گوگل
سال گذشته، زمانی که OpenAI با عرضه سرویس چت هوش مصنوعی ChatGPT چشم همه جهان را به خود خیره کرد، یکی از بزرگترین شرکتهای فناوری دنیا، یعنی گوگل، هیچ حرفی برای گفتن نداشت. این شرکت سالها بود که روی فناوری مشابهی کار میکرد، ولی مانند سایر غولهای دنیای فناوری همچون متا نتوانست سرویسی ارائه کند که قادر به تولید پاسخهای درست و بدون اطلاعات مضر یا غلط باشد.
اسفند سال گذشته، گوگل برای کاهش انتقادها ربات چت هوش مصنوعی خود بهنام Bard را منتشر و پس از یک ماه، دو آزمایشگاه هوش مصنوعی Google Brain و DeepMind را با هم ادغام کرد. در این اقدام، بیشاز 2000 پژوهشگر و مهندس کنار هم جمع شدند تا عقبماندگی گوگل را در دنیای هوش مصنوعی جبران کنند. این شرکت در اردیبهشتماه اعلام کرد که آزمایشگاه DeepMind گوگل بهسختی در حال تلاش برای توسعه جمنای است.
گوگل پس از پایهگذاری Brain lab در سال 2011، DeepMind را در 2014 با پرداخت 650 میلیوندلار به یک شرکت استارتآپی تصحاب کرد. این شرکت بیشاز یک دهه عملکرد کاملاً مستقلی از Brain lab و سایر بخشهای گوگل داشت و حتی در سال 2017 تا مرز جدایی پیش رفت. اما با تلاش گوگل برای جبران عقبماندگی خود از OpenAI، پیچای سرانجام دو مجموعه را ادغام کرد و مدیریت آن را به هاسامیس سپرد که متخصص علم عصبشناسی و بنیانگذار DeepMind است.
Gemini؛ شاهکار هوش مصنوعی گوگل با قابلیتهای مهم
بهگزارش theverge، گوگل برخی از نتایج آزمایشهای انجامشده با Gemini را به نمایش گذاشته که نشان میدهد قویترین نسخه Gemini از جدیدترین فناوری OpenAI، یعنی GPT-4، در بسیاری از موارد مهم عملکرد بهتری دارد. بهگفته پیچای، Gemini درمقایسه با فناوریهای قبلی گوگل در کدنویسی بهتر عمل کرده و در خلاصهنویسی اخبار و سایر متون نیز ماهرتر است.
فناوری هوش مصنوعی جدید گوگل که یک مدل زبان بزرگ محسوب میشود، توانایی یادگیری حجم عظیمی از اطلاعات را داشته که شامل مواردی مثل کتابهای دیجیتال، مقالههای ویکیپدیا و اخبار روز میشود. این مدل زبانی بزرگ قادر است پس از یادگیری، به تولید محتوا بپردازد که از جمله آنها میتوان به نوشتن مقالههای دانشگاهی، کدنویسی و حتی مکالمه با انسان در امور خاص اشاره کرد.
افزونبراین، Gemini توانایی تحلیل تصویر، فیلم و صوت به صورت بلادرنگ را نیز دارد. این مدل از سیستم multimodal استفاده کرده و میتواند پس از دریافت و تحلیل تصاویر یا صوتها، به آنها پاسخهای درست و منطقی دهد. برای مثال، اگر به آن یک مسئله ریاضی با خطوط، شکلهای هندسی و تصاویر دیگر بدهید، میتواند مثل یک دانشآموز دبیرستانی آن را حل کند.
بااینحال، قابلیتهای صوتی و تصویری Gemini فعلاً در دسترس کاربران نیست و سال آینده در Bard منتشر میشود.
انتشار تدریجی و هدفمند Gemini در سه نسخه متفاوت
گوگل سه نسخه متفاوت از Gemini را با مهارتهای مختلف تولید کرده است. نسخه Ultra با هدف انجام وظایف پیچیده طراحی شده و سال آینده معرفی خواهد شد. نسخه Pro که هوش مصنوعی میانرده گوگل محسوب میشود از امروز، چهارشنبه، ازطریق Bard در سرویسهای مختلف این شرکت بهکار خواهد رفت. نسخه Nano نیز که کوچکترین مدل هوش مصنوعی Gemini است از امروز در گوشی پیکسل 8 پرو برای کابردهایی مثل خلاصهکردن فایلهای صوتی یا دادن پاسخهای پیشنهادی در واتساپ بهکار میرود.
آینده Gemini
اگرچه گوگل توسعه Gemini را شاهکاری میداند که قادر بهانجام عملیاتهای مختلف حتی بهتر از GPT-4 است، درعینحال اذعان کرده که دادن پاسخهای غلط همچنان یکی از مشکلات اصلی این مدل است. بهگفته گوگل، این مسئله هنوز یکی از مشکلات حلنشده تحقیقاتی است که بر روی آن کار میشود.
بااینحال، میتوان انتظار داشت با گذشت زمان و انجام آزمایشهای مختلف و تحقیقات بیشتر این مشکل نیز بهتدریج کمرنگتر شده و مشکل دیگری جای آن را بگیرد؛ مشکلی که سالها است از مردم عادی گرفته تا متخصصان فناوری و هوش مصنوعی نگران آن بوده و دربارهاش بحث میکنند.
آیا توسعه هوش مصنوعی اخلاقی و انسانی است؟ آیا هوش مصنوعی میتواند آینده بشریت را بهخطر بیندازد؟ شاید فقط زمان بتواند پاسخ این سؤالات را آشکار کند. نظر شما چیست؟
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت