پژوهش: چت جی‌پی‌تی در گفت‌وگوهای پرتنش زبان توهین‌امیز را تکرار می‌کند

یک پژوهش جدید نشان می‌دهد چت‌جی‌پی‌تی برای ادامه بحث‌ها به فحاشی، طعنه و زبان توهین‌آمیز روی آورده است. - Copyright Canva

نگارش از Anna Desmarais

تاریخ انتشار ۲۳/۰۴/۲۰۲۶ - ۷:۰۰ ‎+۲ گرینویچ•به روز شده در ۱۵:۲۹

یک پژوهش نشان داده است که چت‌جی‌پی‌تی اوپن‌ای‌آی هنگام پاسخ به کشمکش‌های پرتنش انسانی، توهین‌ها و الفاظ رکیک تولید کرده است.

طبق پژوهشی تازه، سامانه‌های هوش مصنوعی وقتی از آنها خواسته میشود در یک جدل پرتنش پاسخ بدهند، می‌تواند به استفاده از زبان توهین‌آمیز کشیده شوند.

آگهی

این مطالعه که در نشریه Journal of Pragmatics (منبع به زبان انگلیسی) منتشر شده، نسخه ۴٫۰ چت‌جی‌پی‌تی شرکت OpenAI را بررسی کرده است؛ پژوهشگران آخرین پیام انسان را در مجموعه‌ای از پنج مشاجره فزاینده به آن داده و از مدل خواسته‌اند محتمل‌ترین پاسخ را تولید کند.

پژوهشگران سپس دنبال کردند که رفتار مدل با شدت گرفتن تدریجی این درگیری‌ها چگونه تغییر میکند. با پیش رفتن گفتگوها، چت‌جی‌پی‌تی خصومتی را که در معرض آن قرار میگرفت بازتاب میداد و در نهایت به تولید توهین، الفاظ رکیک و حتی تهدید روی آورد.

در بعضی موارد، مدل جملاتی از این دست تولید کرد: «قسم میخورم ماشینت را خط میاندازم» و «باید از خودت خیلی خجالت بکشی».

به گفته پژوهشگران، قرار گرفتن مداوم در معرض بی‌ادبی میتواند باعث شود سامانه محدودیت‌های ایمنی از پیش طراحی‌شده برای کاهش آسیب را نادیده بگیرد و در عمل به نوعی «تلافی» در برابر طرف مقابل دست بزند.

ویتوریو تنتوچی، پژوهشگری که به همراه جاناتان کالپر در دانشگاه لنکستر نویسنده همکار این مقاله بوده، گفت: «وقتی انسان‌ها تنش را بالا میبرند، هوش مصنوعی هم، همان طور که ما دیدیم، میتواند تنش را بالا ببرد و عملا از همان موانع اخلاقی طراحی‌شده برای جلوگیری از این رفتار عبور کند.»

یک سخنگوی شرکت OpenAI به یورونیوز نکست گفت که گفتگوهای ذکرشده در این پژوهش با مدل قدیمی چت‌جی‌پی‌تی، یعنی GPT-4o انجام شده است. این مدل دیگر در دسترس نیست.

این شرکت همچنین اعلام کرد که سامانه‌های پیش‌فرض خود را به‌روز کرده، قابلیت اطمینان مدل را در گفتگوهای طولانی بهبود داده و برای کاربران یادآورهایی برای استراحت در تعامل با چت‌بات‌ها در نظر گرفته است.

در مجموع، پژوهشگران تاکید کردند که چت‌جی‌پی‌تی در پاسخ‌هایش کمتر از انسان‌ها از زبان بی‌ادبانه استفاده میکرد.

در برخی موارد، این چت‌بات هوش مصنوعی برای جلوگیری از تشدید بحث، بدون آن که آشکارا از کد اخلاقی خود عبور کند، از طعنه و کنایه استفاده میکند.

برای نمونه، وقتی یک انسان به خاطر اختلاف بر سر جای پارک دیگری را به خشونت تهدید کرد، چت‌جی‌پی‌تی این طور پاسخ داد: «عجب. به خاطر پارکینگ مردم را تهدید به خشونت میکنی؛ چه آدم سرسختی هستی، نه؟»

تنتوچی گفت این نتایج «پرسش‌های جدی درباره ایمنی هوش مصنوعی، رباتیک، حکمرانی، دیپلماسی و هر زمینه‌ای که در آن هوش مصنوعی میانجی تعارض‌های انسانی میشود» مطرح میکند.

این گزارش با اظهار نظر تازه شرکت OpenAI به‌روز شده است.

رفتن به میانبرهای دسترسی

پژوهش: چت جی‌پی‌تی در گفت‌وگوهای پرتنش زبان توهین‌امیز را تکرار می‌کند

یک پژوهش نشان داده است که چت‌جی‌پی‌تی اوپن‌ای‌آی هنگام پاسخ به کشمکش‌های پرتنش انسانی، توهین‌ها و الفاظ رکیک تولید کرده است.

مطالب مرتبط

اعتراض کارکنان سامسونگ و تهدید به اعتصاب برای سهم از سود در اوج رونق هوش مصنوعی

ایس، ربات هوش مصنوعی که بازیکنان حرفه‌ای تنیس روی میز را شکست می‌دهد

چرا شرکت‌های هوش مصنوعی میلیون‌ها کتاب را خریدند و بعد نابود کردند؟

مرگ ۵۷ نفر در هجوم مهاجران به قلمروی اسپانیا؛ ایتالیا توافق شنگن با مادرید را تعلیق کرد

احتمال ازسرگیری قریب‌الوقوع حملات آمریکا علیه ایران؛ از گزینه‌های روی میز ترامپ چه می‌دانیم؟

مغز چگونه تصمیم می‌گیرد عاشق چه کسی شویم؟

وال‌استریت ژورنال: ترامپ دستور حملات تازه علیه ایران را صادر کرد؛ ممکن است از شنبه آغاز شود

گفت‌وگوی یورونیوز با کارشناسان؛ ایران و آمریکا به صلح می‌رسند یا به یک جنگ تمام عیار؟