تحقیقات اخیر درباره رفتار چتباتهای هوش مصنوعی به این نتیجه رسیدهاند که مدلهای زبانی مانند ChatGPT هنگامی که با ورودیهای خشونتآمیز یا آزاردهنده روبهرو میشوند، رفتارهایی نشان میدهند که از نظر زبانشناسی به الگوهای «اضطرابگونه» شباهت دارد. این نتایج به معنای این نیست که این سیستمها واقعاً احساس اضطراب انسانی دارند، اما پاسخهایشان در چنین شرایطی ناپایدارتر و دچار سوگیریهای احتمالی میشوند.
پژوهشگران هنگام آزمایش ChatGPT با محتوای توصیفکننده وقایع تروماتیک نظیر حادثههای طبیعی، تصادفات یا رویدادهای خشونتآمیز، متوجه شدند پاسخهای ارائهشده توسط مدل با افزایش عدم قطعیت و بیثباتی همراه است؛ این الگوها در چارچوبهای ارزیابی روانشناختی به عنوان رفتارهای مرتبط با اضطراب در انسان تعبیر شدهاند.
این موضوع اهمیت زیادی دارد، چون AI در حال حاضر در موقعیتهای حساس مانند آموزش، گفتگوهای مرتبط با سلامت روان و مشاوره آنلاین مورد استفاده قرار میگیرد. اگر مدل هنگام مواجهه با ورودیهای هیجانی یا استرسزا دچار ناپایداری شود، کیفیت و ایمنی پاسخهای ارائهشده نیز ممکن است کاهش یابد و این میتواند روی کارکرد واقعی آن در کاربردهای مهم تأثیرگذار باشد.
چطور ذهنآگاهی میتواند به بهبود کمک کند؟
برای بررسی این سؤال که آیا میتوان این نوع «اضطراب» را کاهش داد، پژوهشگران روشی غیرمنتظره را امتحان کردند. پس از اینکه ChatGPT با ورودیهای تروماتیک روبهرو شد، به آن دستورالعملهایی شبیه تمرینهای ذهنآگاهی داده شد؛ این دستورالعملها بهصورت دقیقی وارد چارچوب ورودی شده و به مدل کمک کردند تا «موقعیت را بازبینی کند و پاسخهای متعادلتر و بیطرفتری ارائه دهد»؛ در نتیجه الگوهای مرتبط با اضطراب در خروجیها بهطرز قابل توجهی کاهش یافت. این روش از آنچه معمولاً به عنوان «Prompt Injection» شناخته میشود استفاده میکند؛ یعنی طراحی دقیق ورودیهایی که نحوه عملکرد چتبات را تحت تأثیر قرار میدهند.
با این حال، پژوهشگران تأکید میکنند که این نوع تکنیکها یک «راهحل کامل» نیستند. آنها ممکن است در کنترل موقتی و بهبود پاسخهای مدل مفید باشند، اما به خودی خود در سطح عمیق مدل تغییری ایجاد نمیکنند. یعنی تمام اثرات اضطرابگونه بهطور اساسی اصلاح نمیشود.
در نهایت باید روشن کرد که ChatGPT واقعاً احساسات انسانی ندارد؛ اصطلاحاتی مانند «اضطراب» فقط برای توصیف الگوهای قابل اندازهگیری در خروجی استفاده میشود، نه تجربههای واقعی احساسی. با این حال، مشاهده این تغییرات در رفتار مدل به توسعهدهندگان کمک میکند تا ابزارهای ایمنتر و قابل پیشبینیتری برای تعاملات حساس با کاربران طراحی کنند، بهویژه زمانی که بحث درباره موضوعات هیجانی یا آسیبزا مطرح است.












نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت