وقتی هوش مصنوعی فقط پاسخ نمیدهد، بلکه میاندیشد، به نقطهای رسیدهایم که AI، یک دستیار واقعی شود. با معرفی مدلهای استدلالی o3 و o4-mini توسط OpenAI، حالا دیگر هوش مصنوعی نهتنها به سوالات علمی و ریاضی پاسخ میدهد، بلکه از تصاویر، وبگردی، کدنویسی و تحلیلهای چندمرحلهای برای رسیدن به جواب بهره میبرد. این یعنی آغاز عصری که در آن مدلها همانند انسانها تحلیل میکنند و تصمیم میگیرند.
شرکت OpenAI ساعتی پیش از راه اندازی مدلهای هوش مصنوعی متفاوت و جالب o3 و o4-mini خبر داد؛ مدلهای استدلال هوش مصنوعی جدید که برای مکث و کار کردن روی سؤالات قبل از پاسخ دادن طراحی شدهاند. در ادامه با معرفی این مدلهای عجیب و جالب توجه همراه ما باشید.
با ما همراه باشید تا با دنیای پیچیده و جذاب این مدلهای تازهنفس بیشتر آشنا شوید.
معرفی o3 و o4-mini: گام تازهای در استدلال هوش مصنوعی
بنابر گزارش ZDNet، همزمان با عرضه خانواده جدید GPT-4.1، شرکت OpenAI مدلهای پیشرفته دیگری را نیز معرفی کرد: o3 و o4-mini. مدل o3 که پیشنمایش آن در ماه دسامبر گذشته (دی ماه 1403) ارائه شده بود، پیشرفتهترین مدل استدلالی این شرکت تا امروز محسوب میشود. در مقابل، مدل o4-mini با تمرکز بر تعادل در عملکرد و منابع مصرفی طراحی شده است.
باید به این موضوع اشاره کنیم که OpenAI مدل o3 را پیشرفتهترین مدل استدلالی خود مینامد که از مدلهای قبلی شرکت در آزمونهای اندازهگیری تواناییهای ریاضی، کدنویسی، استدلال، علوم و درک بصری بهتر عمل میکند. در همین حال، o4-mini یک معامله رقابتی برای ایجاد توازن بین هزینه، سرعت و عملکرد ارائه میکند؛ سه عاملی که توسعهدهندگان معمولاً هنگام انتخاب یک مدل هوش مصنوعی برای تقویت برنامههای خود در نظر میگیرند.
مدلهای استدلالمحور AI؛ تفکر پیش از پاسخ
مدلهای استدلالمحور، برخلاف مدلهای با الگوی بررسی کلاسیک، بهگونهای آموزش دیدهاند که پیش از ارائه پاسخ، زمان بیشتری برای پردازش ورودی صرف کنند. نتیجه این رویکرد، پاسخهایی دقیقتر و باکیفیتتر است. o3 و o4-mini در حوزههایی همچون برنامهنویسی، ریاضیات و علوم، عملکردی قویتر از مدلهای قبلی از خود نشان دادهاند.
درک بصری؛ قابلیت تازهای در دنیای هوش مصنوعی
آنچه این مدلها را بیش از پیش متمایز میکند، توانایی آنها در «تفکر همراه با تصویر» است. بنابر ادعای مطرح شده توسط OpenAI، این الگو بدان معناست که مدلها تنها بیننده تصویر نیستند، بلکه اطلاعات بصری موجود را بهصورت فعال در فرآیند استدلال خود دخیل میکنند.
نکته با ارزش و بسیار حائز اهمیت این است که حتی تصاویری با کیفیت پایین یا تار نیز توسط این مدلها قابل تحلیل هستند.
ابزارهای هوشمند در خدمت استدلال خودکار
از دیگر نوآوریهای o3 و o4-mini میتوان به امکان بهرهبرداری «مستقل و خودکار» از مجموعه ابزارهای ChatGPT اشاره کرد. این ابزارها شامل مرور وب، اجرای کد پایتون، تحلیل تصویر و حتی تولید تصویر میشوند.
به گفته OpenAI، این ویژگی یک گام مهم بهسوی مدلهای عاملمحور (Agentic) است؛ مدلهایی که قادرند بهطور مستقل وظایفی را برای کاربر انجام دهند. شاید بتوان گفت که این مهمترین قابلیتی است که طی سال گذشته برای مدلهای هوش مصنوعی گسترده عرضه شده و موجب میشود بتوانیم ابزارهای هوش مصنوعی را تولید کنیم که با برنامهریزی، دستیارهای واقعی ما باشند.
جالب است بدانید که برای نمایش قدرت عملکردی این مدلها، OpenAI در یکی از نمونههای نمایشی خود، یک پوستر علمی به مدل o3 ارائه کرده تا تحلیلی فراتر از آنچه در تصویر آمده ارائه دهد. در پاسخ به این درخواست، مدل o3 بهصورت خودکار به جستجوی اینترنتی پرداخته و با بزرگنمایی اجزای تصویر، پاسخی دقیق و تحلیلی از آن را تولید کرده است. این قابلیت نشاندهنده هماهنگی چندابزاری و قدرت تحلیل تصویری o3 است که توانایی تفسیر را که پله جلوتر از مدلهای قبلی است را در جواب ارائه شده به کاربر در نظر گرفته است.
عملکرد بهبودیافته در آزمونهای مختلف
بر اساس ارزیابیهای OpenAI، مدلهای o3 و o4-mini نهتنها در اجرای دستورالعملها دقیقتر عمل میکنند، بلکه پاسخهایی قابل تأیید و کاربردیتر ارائه میدهند. حتی بدون بهرهگیری از ابزارهای کمکی، این مدلها در مقایسه با نسخههای قبلی عملکرد بهتری در آزمونهای معیار داشتهاند.
پیشنهاد تحقیق مرتبط به پژوهشگران برای آزمایشهای نوآورانه
بر اساس گزارشی از رسانه The Information، پیشبینی میشود که این مدلها قادر به ترکیب اطلاعات از حوزههای مختلف و ارائه پیشنهادهایی برای آزمایشهای نوآورانه باشند. به گفته منابعی که این مدلها را آزمودهاند، موضوعاتی پیشرفته در علوم کاربردی مانند شکافت هستهای یا شناسایی عوامل بیماریزا از جمله مسائلی هستند که در این تحلیلها پوشش داده میشوند. هرچند OpenAI هنوز واکنشی مستقیم به این گزارش نداشته است.
نحوه دسترسی به مدلهای جدید o3 و o4-mini
در حال حاضر، دسترسی به مدلهای o3، o4-mini و نسخه پیشرفتهتر o4-mini-high برای مشترکان ChatGPT در طرحهای Plus، Pro و Team فراهم شده است. این مدلها جایگزین نسخههای قبلی از جمله o1، o3-mini و o3-mini-high شدهاند.
البته توسعهدهندگان میتوانند از طریق APIهای دریافتی از OpenAI نیز به این مدلها دسترسی داشته باشند. انتظار میرود مدل o3-pro نیز طی هفتههای آینده برای مشترکان طرح Pro ارائه شود.
طبق سنت OpenAI احتمالاً دسترسی کاربران عادی به این مدلهای پیشرفته نیز فراهم خواهد شد؛ با این حال کاربران طرحهای رایگان OpenAI باید چند ماهی بیشتر را برای عرضه مدلهای o3 و o4-mini منتظر بمانند.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت