شرکت OpenAI از مدل هوش مصنوعی جدید GPT-4o برای چت بات مشهور ChatGPT رونمایی کرد. این مدل جدید دارای عملکرد سریعتر و تواناییهای ارتقایافته در زمینه پردازش متن و کار با صوت و تصویر است. در ادامه میتوانید با ویژگیهای جدید GPT-4o آشنا شوید.
خبر خوب اینکه مدل زبانی بزرگ GPT-4o مجانی است و در اختیار کلیه کاربران پولی و رایگان ChatGPT قرار میگیرد، با این حال دارندگان حساب پولی تا پنج برابر محدودیتهای کمتری نسبت به حساب رایگان خواهند داشت.
بهبود تواناییهای تشخیص گفتار در GPT-4o
آنطور که سم آلتمن، مدیرعامل OpenAI مدعی شد، GPT-4o ذاتاً یک مدل چند وجهی است که میتواند محتوا تولید کند یا دستورات را از طریق صدا، تصویر یا متن دریافت کند. برای نمونه میتوانید عکسها یا اسکرینشاتها را به ChatGPT نشان بدهید و از آن به عنوان ورودی استفاده کنید.
آلتمن افزود API این مدل جدید با نصف قیمت و دو برابر سرعت بیشتر نسبت به GPT-4-turbo در اختیار توسعهدهندگان قرار میگیرد.
یکی از ویژگیهای مهم مدل هوش مصنوعی GPT-4o، امکان پاسخ دادن بلادرنگ به سوالات و درخواستهای کاربر از طریق صدا است. OpenAI حتی مدعی شد این مدل جدید قادر به تشخیص لحن کاربر و ارائه پاسخ متناسب با آن است. هنگامی که چت بات به سوال یا درخواست کاربر پاسخ میدهد، به راحتی امکان پریدن وسط حرف GPT-4o نیز وجود دارد!
همچنین GPT-4o از نظر بینایی ماشین ارتقا یافته است و حالا توانایی بیشتری در پردازش تصاویر دارد. برای نمونه میتوان تصویری از یک کُد برنامه به آن ارائه کرد و درباره کدها پرسید یا برند تیشرتی که فرد موجود در تصویر پوشیده است را جویا شد.
همزمان OpenAI اعلام کرد نسخه دسکتاپ تازهای از چت بات ChatGPT با رابط کاربری جدید عرضه میکند.
OpenAI برای نشان دادن تواناییهای جدید مدل هوش مصنوعی خود، حل کردن یک معمای ریاضی از طریق مکالمه را به نمایش گذاشت که ChatGPT قادر به ارائه پاسخهای آنی بود. جالب تر اینکه ChatGPT به لحن طبیعی و غیر ماشینی صحبت میکرد یا میتوانست یک نمودار را ببیند و درباره آن صحبت کند.
خبر بد این است که GPT-4o ابتدا در اختیار کاربران حساب پولی قرار میگیرد، البته به طور محدود کاربران نسخه مجانی ChatGPT هم این آپدیت را دریافت میکنند.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت