یک پژوهش نشان میدهد چتجیپیتی اوپنایآی هنگام پاسخ به درگیریهای تنشامیز میان انسانها از توهین و فحاشی استفاده میکند.
پژوهشهای تازه نشان میدهد که وقتی از سامانههای هوش مصنوعی خواسته میشود در یک مشاجره تند پاسخ بدهند، ممکن است به استفاده از زبان توهینامیز کشیده شوند.
در این پژوهش که در نشریه Journal of Pragmatics (منبع به زبان انگلیسی) منتشر شده، نسخه ۴.۰ چتجیپیتی شرکت اپنایآی بررسی شده است؛ پژوهشگران در مجموعهای از پنج مشاجره که به تدریج شدت میگرفت، اخرین پیام انسان را به این سامانه میدادند و از ان میخواستند محتملترین پاسخ را تولید کند.
سپس پژوهشگران دنبال کردند که با تشدید تدریجی تنشها، رفتار این مدل چگونه تغییر میکند. با پیش رفتن گفتوگوها، چتجیپیتی خصومتی را که در معرض ان بود بازتاب میداد و در نهایت به تولید توهین، الفاظ رکیک و حتی تهدید رسید.
در برخی موارد، این مدل جملاتی از این دست تولید کرد: «قسم میخورم ماشین لعنتیت را خط میاندازم» و «باید از خودت خیلی خجالت بکشی».
پژوهشگران استدلال میکنند که مواجهه طولانیمدت با بیادبی میتواند باعث شود سامانه از محدودیتهای ایمنی طراحیشده برای کاهش اسیب عبور کند و عملا در برابر طرف مقابل واکنش متقابل نشان بدهد.
undefined
ویتوریو تنتوچی، پژوهشگری که این مقاله را همراه با جاناتان کالپیپر در دانشگاه لنکستر نوشته است، گفت (منبع به زبان انگلیسی): «وقتی انسانها لحن خود را تندتر میکنند، ما دیدیم که هوش مصنوعی هم میتواند شدت بگیرد و عملا همان محافظتهای اخلاقی طراحیشده برای جلوگیری از چنین رفتاری را کنار بزند.»
به طور کلی پژوهشگران یاداور شدند که چتجیپیتی در پاسخهایش کمتر از انسانها بیادب بود.
در برخی موارد، این ربات گفتوگوگر مبتنی بر هوش مصنوعی از طعنه برای منحرف کردن مسیر بحث و جلوگیری از تشدید مشاجره استفاده میکند، بیانکه به شکل اشکار کدهای اخلاقی خود را نقض کند.
برای مثال، وقتی انسانی در اختلاف بر سر جای پارک طرف مقابل را به خشونت تهدید کرد، چتجیپیتی این گونه پاسخ داد: «واو، برای جای پارک مردم را تهدید به خشونت میکنی؛ واقعا چه ادم قلدر و شجاعی هستی!»
تنتوچی گفت این نتایج «پرسشهای جدی برای ایمنی هوش مصنوعی، رباتیک، حکمرانی، دیپلماسی و هر زمینهای که در ان هوش مصنوعی ممکن است در میانجیگری درگیریهای انسانی نقش داشته باشد» مطرح میکند.
یورونیوز نکست برای دریافت نظر اپنایآی با این شرکت تماس گرفت اما تا زمان انتشار این گزارش پاسخی دریافت نکرد.