وقتی در یک مهمانی شبانه با یک نوشیدنی در دست در اتاقی مملو از افراد ایستادهاید و مشغول صحبت با یک نفر هستید، به صورت ناخودآگاه کار سختی را انجام میدهید که شاید خودتان از آن خبر نداشته باشید.
در واقع انسانها یک مهارت منحصر به فرد دارند و آن این است که میتوانند در یک اتاق شلوغ، صداهای مزاحم را فیلتر کنند و فقط صدای فردی را که مشغول گفتگو با او هستند، بشنوند.
این مهارت هرچند ممکن است ساده و بدیهی فرض شود، اما تا همین اواخر فناوری قادر به تقلید و بازتولید آن نبود.
اگرچه حذف صداهای اشیاء در پسزمینه از صدای مکالمههای انسانی کار به نسبت آسانی است، چالش وقتی بروز میکند که صدای پسزمینه از صدای اشیاء به صدای آدمها تغییر پیدا میکند. چیزی که با نام «مشکل مهمانی شبانه» شناخته میشود.
کیت مک الوین، بنیانگذار و مدیر ارشد فناوری در موسسه آمریکایی «ویو ساینسز»، در این باره میگوید: «من در حذف نویزهایی مانند صدای خودرو یا سیستمهای تهویه هوا از گفتار موفق بودم، اما وقتی شروع به حذف گفتار از گفتار کردم معلوم شد که این مسئله بسیار سختی است. صداها با هم تداخل میکنند و حل آن از نظر ریاضی وحشتناک میشود.»
در یک اتاق شلوغ صدا میپیچد و تشخیص صدای اصلی و جدا کردن آن از صدای پسزمینه بینهایت دشوار میشود. این همان جایی است که هوش مصنوعی برای شناسایی دقیق و غربال کردن صداهای رقیب وارد میدان شده است.
شرکتی به نام «ویو ساینسز» در سال ۲۰۰۹ با این هدف تاسیس شد که بتواند صداهای همپوشان را با استفاده از یک فناوری پیشرو از هم جدا کند.
این شرکت سرانجام پس از ۱۰ سال تحقیق این مشکل را حل کرد و در سپتامبر ۲۰۱۹ یک اختراع جدید را به ثبت رساند.
این اختراع جدید در واقع یک فناوری هوش مصنوعی بود که میتواند چگونگی پرش صدا را قبل از رسیدن به میکروفون یا گوش ما در یک اتاق تجزیه و تحلیل کند.
آقای مک الوین میگوید: «ما صدا را وقتی به هر میکروفون میرسد میگیریم و به عقب برمیگردیم تا بفهمیم از کجا آمده است. سپس هر صدایی را که نمیتوانسته از جایی که فرد نشسته است خارج شده باشد، حذف میکنیم.»
این فناوری از جهاتی قابل مقایسه با وقتی است که با دوربین روی یک سوژه تمرکز میکنید و پسزمینه محو میشود.
فناوری ابداعشده برای اولین بار در تحقیقات راجع به یک قتل در ایالات متحده به کمک گرفته شده است. در این پرونده جنایی کارشناسان بخش پزشکی قانونی میخواستند شواهدی را که برای محکومیتها مهم بود، مورد راستیآزمایی قرار دهند.
نتیجه کار این فناوری، که صدای ضبط شده از ملاقات حضوری دو قاتل در یک رستوران را مورد تجزیه و تحلیل قرار داده بود، به عنوان یک مدرک محوری مورد استناد دادگاه قرار گرفت.
تری آرمنتا، محقق در آکادمی علوم پزشکی قانونی آمریکا، میگوید هوش مصنوعی در حال حاضر در سایر زمینههای پزشکی قانونی نیز مورد استفاده قرار میگیرد.
وی اضافه میکند: «مدلهای یادگیری ماشینی الگوهای صوتی را برای تعیین هویت گویندگان تجزیه و تحلیل میکنند، فرآیندی که به ویژه در تحقیقات جنایی مفید است. جایی که شواهد صوتی نیاز به تأیید اعتبار دارند.»
علاوه بر این، ابزارهای هوش مصنوعی میتوانند دستکاریها یا تغییرات در ضبط های صوتی را شناسایی کرده و از صحت مدارک ارائه شده در دادگاه اطمینان حاصل کنند.
از آن زمان دیگر آزمایشگاههای دولتی از جمله در بریتانیا این فناوری را به خدمت گرفتهاند.
بنابر گفته شرکت سازنده، از این فناوری هوش مصنوعی همچنین میتوان در بررسی سیگنالهای سونار در زیر دریا و همینطور مذاکرات با گروگانگیرها استفاده کرد.
شرکت ویو ساینسز میگوید قصد دارد این فناوری خود را برای استفاده در کیتهای ضبط صدا، رابط های صوتی در خودروها، بلندگوهای هوشمند و سمعکها معرفی و عرضه کند.
به اینستاگرام یورونیوز فارسی بپیوندید
برای مثال اگر با خودرو یا بلندگوی هوشمند خود صحبت کنید، مهم نیست که صدای زیادی در اطراف شما وجود داشته باشد، دستگاه همچنان میتواند آنچه را که میگویید تشخیص دهد.
آقای مک الوین میگوید: «آنچه که الگوریتم ریاضی ما با دقت میتواند انجام دهد، به طرز شگفتآوری شبیه به برخی از ویژگیهای عجیب ساختار دستگاه شنوایی در انسان است.»
وی اضافه میکند: «ما تصور میکنیم که مغز انسان ممکن است از همان الگوریتمهای ریاضیای استفاده کند که ما در حل مشکل مهمانی شبانه تصادفا به آن برخورد کردهایم.»