در حالی که نقش هوش مصنوعی در زندگی روزمره انسانها روز به روز بیشتر میشود، پژوهشی تازه نشان میدهد که اکثریت مردم دیگر قادر نیستند تفاوت میان صدای انسان و نسخه مصنوعی آن را تشخیص دهند.
محققان میگویند در مطالعه جدیدی که صورت دادهاند، اکثر شرکتکنندگان نتوانستهاند میان صداهای انسانی واقعی و صداهایی که با هوش مصنوعی شبیهسازی شدهاند تمایز بگذارند.
در این تحقیق از شرکتکنندگان خواسته شد ۸۰ نمونه صدا را ارزیابی کنند؛ نیمی از آنها صدای واقعی انسان و نیمی دیگر صدای تولیدشده با هوش مصنوعی بودند. این افراد باید بر اساس شاخصهایی مانند میزان اعتمادپذیری یا اقتدار صداها را رتبهبندی میکردند.
در بخش مربوط به صداهای مصنوعی، دو نوع وجود داشت: صداهای کاملا تولیدشده توسط هوش مصنوعی و صداهایی که از روی نمونه واقعی انسان شبیهسازی شده بودند.
در حالی که اکثر افراد متوجه مصنوعی بودن دسته اول شدند، نسخههای شبیهسازیشده بسیار واقعیتر به نظر میرسیدند؛ بهطوریکه ۵۸ درصد از آنها به اشتباه به عنوان صدای انسان شناسایی شدند.
در مقابل، ۶۲ درصد از صداهای واقعی درست تشخیص داده شدند یعنی تفاوت در سطح تشخیص بسیار اندک بود.
دکتر نادین لاوان، استاد روانشناسی دانشگاه «کوئین مری لندن» و نویسنده اصلی این پژوهش، در گفتوگو با یورونیوز گفت: «مهمترین یافته این تحقیق آن است که صداهای تولیدشده با هوش مصنوعی، بهویژه صداهای شبیهسازیشده از انسان، به اندازه صدای واقعی انسان طبیعی به گوش میرسند. نکته قابل توجه این است که این صداها با ابزارهای تجاری در دسترس عموم تولید شدهاند و نیازی به دانش فنی یا هزینههای سنگین ندارند.»
نگرانیهای اخلاقی و امنیتی
فناوری شبیهسازی صدا با هوش مصنوعی، از طریق تحلیل و استخراج ویژگیهای کلیدی گفتار انسان کار میکند. همین دقت بالا باعث شده است این فناوری به ابزاری محبوب برای کلاهبرداران تلفنی تبدیل شود که گاهی از ویدیوها یا پستهای شبکههای اجتماعی برای تقلید صدای نزدیکان افراد استفاده میکنند.
پژوهشی از دانشگاه «پورتسموث» نشان داده است که دو سوم افراد بالای ۷۵ سال در معرض تماسهای کلاهبرداری تلفنی قرار گرفتهاند و نزدیک به ۶۰ درصد این تماسها از طریق صدا انجام میشود.
در صنعت سرگرمی نیز این فناوری باعث نگرانیهایی شده است؛ زیرا صدای برخی چهرههای مشهور بدون اجازه آنها مورد استفاده قرار گرفته است.
همچنین استفاده از «جعل عمیقهای صوتی» برای تقلید از سیاستمداران یا روزنامهنگاران با هدف تأثیرگذاری بر افکار عمومی و انتشار اطلاعات نادرست افزایش یافته است.
دکتر لاوان میگوید شرکتهای فناوری باید مسئولانهتر عمل کنند: «ما به عنوان پژوهشگر توصیه میکنیم شرکتهای توسعهدهنده این فناوری با متخصصان اخلاق و سیاستگذاران همکاری کنند تا مسائل مربوط به مالکیت صدا، رضایت افراد و ابعاد قانونی آن در این فضای در حال تغییر مشخص شود.»
جنبههای مثبت و کاربردهای مفید
در عین حال، صداهای مصنوعی میتوانند برای اهداف کمکرسان و انساندوستانه نیز بهکار گرفته شوند، بهویژه برای افرادی که توانایی صحبت کردن ندارند.
خانم لاوان در این باره میگوید: «فناوریهای کمکی از این نوع سالهاست وجود دارند؛ نمونه بارز آن استیون هاوکینگ است. تفاوت امروز در این است که میتوان صداهای مصنوعی را شخصیسازی کرد تا با هویت و سلیقه فرد هماهنگ شوند. کاربر میتواند صدای خودش را بازسازی کند یا صدایی کاملاً تازه طراحی کند.»
وی میافزاید این فناوری، در صورت استفاده اخلاقی، میتواند دسترسی و تنوع در آموزش، رسانه و کتابهای صوتی را بهبود بخشد.
یورونیوز فارسی را در ایکس دنبال کنید
بهعنوان نمونه، پژوهشی جدید نشان داده که استفاده از صدای هوش مصنوعی در آموزش شنیداری، انگیزه و تمرکز دانشآموزان را افزایش داده است.
یکی از قابلیتهای جالب دیگر، امکان تکثیر یک صدا به زبانهای مختلف است؛ بدین معنا که فرد میتواند با حفظ هویت صوتی خود، در زبانهای گوناگون صحبت کند. به گفته دکتر لاوان، این امر میتواند ارتباطات جهانی و تبادل فرهنگی را متحول کند.
نتایج مطالعه جدید در نشریه علمی «PLoS One» منتشر شده است.