Newsletter خبرنامه Events مناسبت ها پادکست ها ویدیو Africanews
Loader
ما را پیدا کنید
آگهی

پژوهش: چت‌جی‌پی‌تی در بحث‌های تند زبان توهین‌آمیز را بازتاب می‌دهد

یک پژوهش جدید نشان میدهد چت جی پی تی برای ادامه بحثها به فحش، طعنه و زبان توهین آمیز روی آورده است.
بر اساس یک پژوهش جدید، چت‌جی‌پی‌تی برای ادامه بحث‌ها به فحاشی، طعنه و ادبیات توهین‌آمیز روی آورده است. Copyright  Canva
Copyright Canva
نگارش از Anna Desmarais
تاریخ انتشار
همرسانی نظرها
همرسانی Close Button

یک پژوهش نشان می‌دهد چت‌جی‌پی‌تی اوپن‌ای‌آی هنگام پاسخ به درگیریهای تنش‌امیز میان انسانها از توهین و فحاشی استفاده می‌کند.

پژوهش‌های تازه نشان می‌دهد که وقتی از سامانه‌های هوش مصنوعی خواسته می‌شود در یک مشاجره تند پاسخ بدهند، ممکن است به استفاده از زبان توهین‌امیز کشیده شوند.

آگهی
آگهی

در این پژوهش که در نشریه Journal of Pragmatics (منبع به زبان انگلیسی) منتشر شده، نسخه ۴.۰ چت‌جی‌پی‌تی شرکت اپن‌ای‌آی بررسی شده است؛ پژوهشگران در مجموعه‌ای از پنج مشاجره که به تدریج شدت می‌گرفت، اخرین پیام انسان را به این سامانه می‌دادند و از ان می‌خواستند محتمل‌ترین پاسخ را تولید کند.

سپس پژوهشگران دنبال کردند که با تشدید تدریجی تنش‌ها، رفتار این مدل چگونه تغییر می‌کند. با پیش رفتن گفت‌وگوها، چت‌جی‌پی‌تی خصومتی را که در معرض ان بود بازتاب می‌داد و در نهایت به تولید توهین، الفاظ رکیک و حتی تهدید رسید.

در برخی موارد، این مدل جملاتی از این دست تولید کرد: «قسم می‌خورم ماشین لعنتیت را خط می‌اندازم» و «باید از خودت خیلی خجالت بکشی».

پژوهشگران استدلال می‌کنند که مواجهه طولانی‌مدت با بی‌ادبی می‌تواند باعث شود سامانه از محدودیت‌های ایمنی طراحی‌شده برای کاهش اسیب عبور کند و عملا در برابر طرف مقابل واکنش متقابل نشان بدهد.

undefined

ویتوریو تنتوچی، پژوهشگری که این مقاله را همراه با جاناتان کالپیپر در دانشگاه لنکستر نوشته است، گفت (منبع به زبان انگلیسی): «وقتی انسان‌ها لحن خود را تندتر می‌کنند، ما دیدیم که هوش مصنوعی هم می‌تواند شدت بگیرد و عملا همان محافظت‌های اخلاقی طراحی‌شده برای جلوگیری از چنین رفتاری را کنار بزند.»

به طور کلی پژوهشگران یاداور شدند که چت‌جی‌پی‌تی در پاسخ‌هایش کمتر از انسان‌ها بی‌ادب بود.

در برخی موارد، این ربات گفت‌وگوگر مبتنی بر هوش مصنوعی از طعنه برای منحرف کردن مسیر بحث و جلوگیری از تشدید مشاجره استفاده می‌کند، بی‌انکه به شکل اشکار کدهای اخلاقی خود را نقض کند.

برای مثال، وقتی انسانی در اختلاف بر سر جای پارک طرف مقابل را به خشونت تهدید کرد، چت‌جی‌پی‌تی این گونه پاسخ داد: «واو، برای جای پارک مردم را تهدید به خشونت می‌کنی؛ واقعا چه ادم قلدر و شجاعی هستی!»

تنتوچی گفت این نتایج «پرسش‌های جدی برای ایمنی هوش مصنوعی، رباتیک، حکمرانی، دیپلماسی و هر زمینه‌ای که در ان هوش مصنوعی ممکن است در میانجیگری درگیری‌های انسانی نقش داشته باشد» مطرح می‌کند.

یورونیوز نکست برای دریافت نظر اپن‌ای‌آی با این شرکت تماس گرفت اما تا زمان انتشار این گزارش پاسخی دریافت نکرد.

رفتن به میانبرهای دسترسی
همرسانی نظرها

مطالب مرتبط

گزارش: هکرها به مدل هوش مصنوعی میتوس آنتروپیک نفوذ کردند

پژوهش: چت‌جی‌پی‌تی در بحث‌های تند زبان توهین‌آمیز را بازتاب می‌دهد

«یاوه‌گویی‌های یک ابرشرور»؛ مانیفست پالانتیر از سلاح‌های هوش مصنوعی و برتری فرهنگی می‌گوید