یک پژوهش نشان داده است که چتجیپیتی اوپنایآی هنگام پاسخ به کشمکشهای پرتنش انسانی، توهینها و الفاظ رکیک تولید کرده است.
طبق پژوهشی تازه، سامانههای هوش مصنوعی وقتی از آنها خواسته میشود در یک جدل پرتنش پاسخ بدهند، میتواند به استفاده از زبان توهینآمیز کشیده شوند.
این مطالعه که در نشریه Journal of Pragmatics (منبع به زبان انگلیسی) منتشر شده، نسخه ۴٫۰ چتجیپیتی شرکت OpenAI را بررسی کرده است؛ پژوهشگران آخرین پیام انسان را در مجموعهای از پنج مشاجره فزاینده به آن داده و از مدل خواستهاند محتملترین پاسخ را تولید کند.
پژوهشگران سپس دنبال کردند که رفتار مدل با شدت گرفتن تدریجی این درگیریها چگونه تغییر میکند. با پیش رفتن گفتگوها، چتجیپیتی خصومتی را که در معرض آن قرار میگرفت بازتاب میداد و در نهایت به تولید توهین، الفاظ رکیک و حتی تهدید روی آورد.
در بعضی موارد، مدل جملاتی از این دست تولید کرد: «قسم میخورم ماشینت را خط میاندازم» و «باید از خودت خیلی خجالت بکشی».
به گفته پژوهشگران، قرار گرفتن مداوم در معرض بیادبی میتواند باعث شود سامانه محدودیتهای ایمنی از پیش طراحیشده برای کاهش آسیب را نادیده بگیرد و در عمل به نوعی «تلافی» در برابر طرف مقابل دست بزند.
ویتوریو تنتوچی، پژوهشگری که به همراه جاناتان کالپر در دانشگاه لنکستر نویسنده همکار این مقاله بوده، گفت: «وقتی انسانها تنش را بالا میبرند، هوش مصنوعی هم، همان طور که ما دیدیم، میتواند تنش را بالا ببرد و عملا از همان موانع اخلاقی طراحیشده برای جلوگیری از این رفتار عبور کند.»
یک سخنگوی شرکت OpenAI به یورونیوز نکست گفت که گفتگوهای ذکرشده در این پژوهش با مدل قدیمی چتجیپیتی، یعنی GPT-4o انجام شده است. این مدل دیگر در دسترس نیست.
این شرکت همچنین اعلام کرد که سامانههای پیشفرض خود را بهروز کرده، قابلیت اطمینان مدل را در گفتگوهای طولانی بهبود داده و برای کاربران یادآورهایی برای استراحت در تعامل با چتباتها در نظر گرفته است.
در مجموع، پژوهشگران تاکید کردند که چتجیپیتی در پاسخهایش کمتر از انسانها از زبان بیادبانه استفاده میکرد.
در برخی موارد، این چتبات هوش مصنوعی برای جلوگیری از تشدید بحث، بدون آن که آشکارا از کد اخلاقی خود عبور کند، از طعنه و کنایه استفاده میکند.
برای نمونه، وقتی یک انسان به خاطر اختلاف بر سر جای پارک دیگری را به خشونت تهدید کرد، چتجیپیتی این طور پاسخ داد: «عجب. به خاطر پارکینگ مردم را تهدید به خشونت میکنی؛ چه آدم سرسختی هستی، نه؟»
تنتوچی گفت این نتایج «پرسشهای جدی درباره ایمنی هوش مصنوعی، رباتیک، حکمرانی، دیپلماسی و هر زمینهای که در آن هوش مصنوعی میانجی تعارضهای انسانی میشود» مطرح میکند.
این گزارش با اظهار نظر تازه شرکت OpenAI بهروز شده است.