Newsletter خبرنامه Events مناسبت ها پادکست ها ویدیو Africanews
Loader
ما را پیدا کنید
آگهی

پژوهش: چت جی‌پی‌تی در گفت‌وگوهای پرتنش زبان توهین‌امیز را تکرار می‌کند

یک پژوهش جدید می‌گوید چت‌جی‌پی‌تی برای ادامه بحث‌ها به فحاشی، طعنه و زبان توهین‌آمیز روی آورده است.
یک پژوهش جدید نشان می‌دهد چت‌جی‌پی‌تی برای ادامه بحث‌ها به فحاشی، طعنه و زبان توهین‌آمیز روی آورده است. Copyright  Canva
Copyright Canva
نگارش از Anna Desmarais
تاریخ انتشار به روز شده در
همرسانی نظرها
همرسانی Close Button

یک پژوهش نشان داده است که چت‌جی‌پی‌تی اوپن‌ای‌آی هنگام پاسخ به کشمکش‌های پرتنش انسانی، توهین‌ها و الفاظ رکیک تولید کرده است.

طبق پژوهشی تازه، سامانه‌های هوش مصنوعی وقتی از آنها خواسته میشود در یک جدل پرتنش پاسخ بدهند، می‌تواند به استفاده از زبان توهین‌آمیز کشیده شوند.

آگهی
آگهی

این مطالعه که در نشریه Journal of Pragmatics (منبع به زبان انگلیسی) منتشر شده، نسخه ۴٫۰ چت‌جی‌پی‌تی شرکت OpenAI را بررسی کرده است؛ پژوهشگران آخرین پیام انسان را در مجموعه‌ای از پنج مشاجره فزاینده به آن داده و از مدل خواسته‌اند محتمل‌ترین پاسخ را تولید کند.

پژوهشگران سپس دنبال کردند که رفتار مدل با شدت گرفتن تدریجی این درگیری‌ها چگونه تغییر میکند. با پیش رفتن گفتگوها، چت‌جی‌پی‌تی خصومتی را که در معرض آن قرار میگرفت بازتاب میداد و در نهایت به تولید توهین، الفاظ رکیک و حتی تهدید روی آورد.

در بعضی موارد، مدل جملاتی از این دست تولید کرد: «قسم میخورم ماشینت را خط میاندازم» و «باید از خودت خیلی خجالت بکشی».

به گفته پژوهشگران، قرار گرفتن مداوم در معرض بی‌ادبی میتواند باعث شود سامانه محدودیت‌های ایمنی از پیش طراحی‌شده برای کاهش آسیب را نادیده بگیرد و در عمل به نوعی «تلافی» در برابر طرف مقابل دست بزند.

ویتوریو تنتوچی، پژوهشگری که به همراه جاناتان کالپر در دانشگاه لنکستر نویسنده همکار این مقاله بوده، گفت: «وقتی انسان‌ها تنش را بالا میبرند، هوش مصنوعی هم، همان طور که ما دیدیم، میتواند تنش را بالا ببرد و عملا از همان موانع اخلاقی طراحی‌شده برای جلوگیری از این رفتار عبور کند.»

یک سخنگوی شرکت OpenAI به یورونیوز نکست گفت که گفتگوهای ذکرشده در این پژوهش با مدل قدیمی چت‌جی‌پی‌تی، یعنی GPT-4o انجام شده است. این مدل دیگر در دسترس نیست.

این شرکت همچنین اعلام کرد که سامانه‌های پیش‌فرض خود را به‌روز کرده، قابلیت اطمینان مدل را در گفتگوهای طولانی بهبود داده و برای کاربران یادآورهایی برای استراحت در تعامل با چت‌بات‌ها در نظر گرفته است.

در مجموع، پژوهشگران تاکید کردند که چت‌جی‌پی‌تی در پاسخ‌هایش کمتر از انسان‌ها از زبان بی‌ادبانه استفاده میکرد.

در برخی موارد، این چت‌بات هوش مصنوعی برای جلوگیری از تشدید بحث، بدون آن که آشکارا از کد اخلاقی خود عبور کند، از طعنه و کنایه استفاده میکند.

برای نمونه، وقتی یک انسان به خاطر اختلاف بر سر جای پارک دیگری را به خشونت تهدید کرد، چت‌جی‌پی‌تی این طور پاسخ داد: «عجب. به خاطر پارکینگ مردم را تهدید به خشونت میکنی؛ چه آدم سرسختی هستی، نه؟»

تنتوچی گفت این نتایج «پرسش‌های جدی درباره ایمنی هوش مصنوعی، رباتیک، حکمرانی، دیپلماسی و هر زمینه‌ای که در آن هوش مصنوعی میانجی تعارض‌های انسانی میشود» مطرح میکند.

این گزارش با اظهار نظر تازه شرکت OpenAI به‌روز شده است.

رفتن به میانبرهای دسترسی
همرسانی نظرها

مطالب مرتبط

اعتراض کارکنان سامسونگ و تهدید به اعتصاب برای سهم از سود در اوج رونق هوش مصنوعی

ایس، ربات هوش مصنوعی که بازیکنان حرفه‌ای تنیس روی میز را شکست می‌دهد

نشست ترامپ و شی: تراشه ها کنار، جنگ هوش مصنوعی در دستور کار چین