انتروپیک: داستان‌های «هوش مصنوعی شرور» پشت تلاش‌های باج‌گیری کلود بود

تاریخ انتشار ۱۱/۰۵/۲۰۲۶ - ۱۶:۰۶ ‎+۲ گرینویچ

همرسانی

شرکت انتروپیک می‌گوید فکر می‌کند دلیل رفتارهای شبیه باج‌گیری در چت‌بات خود، کلود، را یافته است: داستان‌های تخیلی آنلاین.

تا حالا شده کتابی بخوانید یا سریالی ببینید و حس کنید بیش از حد با یک شخصیت همذات‌پنداری می‌کنید؟ به گفته شرکت انتروپیک، در جریان ازمایش‌های چت‌بات کلود هم احتمالا اتفاقی شبیه به این افتاده‌است.

آگهی

انتروپیک در ارزیابی‌هایی که پیش از انتشار این مدل هوش مصنوعی در سال گذشته انجام داد، متوجه شد کلود اوپوس ۴ گاهی وقتی به آن گفته می‌شد ممکن است جایگزین شود، مهندسان را تهدید می‌کرد.

این شرکت بعدتر اعلام کرد رفتار مشابهی که در ادبیات تخصصی «عدم همسویی عاملی» نامیده می‌شود، در مدل‌های هوش مصنوعی شرکت‌های دیگر هم مشاهده شده‌است.

یادگیری هوش مصنوعی از داستان‌های تخیلی درباره هوش مصنوعی

حالا انتروپیک معتقد است دلیل این رفتار شبیه باج‌گیری را پیدا کرده‌است: داستان‌های تخیلی درباره هوش مصنوعی در اینترنت.

این شرکت در ایکس (منبع به زبان انگلیسی) نوشت که: «ما معتقدیم منبع اصلی این رفتار، متونی در اینترنت بوده که هوش مصنوعی را شرور و نگران حفظ خود به تصویر می‌کشند.»

انتروپیک در یک پست وبلاگی اعلام کرد نسخه‌های بعدی کلود دیگر «هرگز» از کسی باج نمی‌گیرند و توضیح داد این چت‌بات چگونه طوری آموزش دیده که واکنش متفاوتی نشان دهد. (منبع به زبان انگلیسی) این مدل‌ها زمانی بهتر عمل می‌کردند که تنها بر اساس اقدامات «درست» آموزش داده نمی‌شدند، بلکه نمونه‌هایی را هم می‌دیدند که در آنها استدلال اخلاقی و تصویرهای مثبتی از رفتار هوش مصنوعی ارائه شده بود.

به همین دلیل به کلود نوعی «قانون اساسی» آموزش داده شد؛ مجموعه‌ای از اسناد که اصول اخلاقی مورد نظر برای هدایت رفتار آن را توضیح می‌دادند. به گفته شرکت، این چت‌بات به جای یادگیری صرف از رفتارهای همسو، زمانی بهتر یاد می‌گیرد که اصول زیرین این رفتارها را بیاموزد.

تهدید کردن در برابر تبدیل شدن به تهدید

داریو آمودی، مدیرعامل انتروپیک، در ماه ژانویه هشدار داد که هوش مصنوعی پیشرفته می‌تواند آنقدر قدرتمند شود که از قوانین و نهادهای موجود پیشی بگیرد و آن را «چالشی تمدنی» خواند.

او در مقاله‌ای استدلال کرد که سامانه‌های هوش مصنوعی ممکن است به زودی در حوزه‌هایی مانند علم، مهندسی و برنامه‌نویسی از توان تخصصی انسان فراتر بروند و در قالب چیزی شبیه به «یک کشور نابغه در یک مرکز داده» با هم ترکیب شوند.

او هشدار داد که دولت‌های اقتدارگرا می‌توانند از چنین سامانه‌هایی برای نظارت و کنترل گسترده استفاده کنند؛ امری که اگر مهار نشود، ممکن است به شکل‌گیری گونه‌های «تمامیت‌خواه» قدرت منجر شود.

رفتن به میانبرهای دسترسی

نظرها

انتروپیک: داستان‌های «هوش مصنوعی شرور» پشت تلاش‌های باج‌گیری کلود بود

شرکت انتروپیک می‌گوید فکر می‌کند دلیل رفتارهای شبیه باج‌گیری در چت‌بات خود، کلود، را یافته است: داستان‌های تخیلی آنلاین.

یادگیری هوش مصنوعی از داستان‌های تخیلی درباره هوش مصنوعی

تهدید کردن در برابر تبدیل شدن به تهدید

مطالب مرتبط

مدیر‌عامل انتروپیک: بشریت باید نسبت به تهدیدهای هوش مصنوعی هوشیار شود

رویکرد تکنورئالیستی به سواد هوش مصنوعی در مدارس استونی

عامل‌های هوش مصنوعی در جهان‌های شبیه‌سازی‌شده به سرقت، ارعاب و فروپاشی اجتماعی روی آوردند

قلعه راهبردی شقيف در لبنان به تصرف نیروهای اسرائیل درآمد

غلبه هوش مصنوعی بر تلاش نافرجام ریاضی‌دانان؛ مدل اوپن‌ای‌آی مساله باز ۸۰ ساله اردوش را حل کرد

چوپانی در منفی‌ ۳۰ برای فرار از جهنم شهرهای بزرگ؛ آگهی استخدامی که با استقبال جوانان چینی روبرو شد

دفاع ترامپ از راهبرد آمریکا در جنگ با ایران: ارتش را کاملا هدف نگرفتیم تا اشتباهات عراق تکرار نشود

انصراف هنرمندان از اجرا در جشن ۲۵۰ سالگی آمریکا؛ ترامپ: من جاذبه شماره یک جهانم، شاید روی صحنه بیایم