play_arrow

keyboard_arrow_right

skip_previous play_arrow skip_next
00:00 00:00
playlist_play chevron_left
volume_up
chevron_left

اخبار هنری

استخراج صدای افراد از همهمه ممکن شد

علی علیزاده مهر ۲۲, ۱۳۹۷ 3


زمینه
share close

اطلاعات خبری / مهر/ اگر چه برخی بلندگوهای هوشمند مانند گوگل هوم و آمازون اکو از توانایی های خوبی در این زمینه برخوردار هستند، اما آنها هم در تشخیص یک صدا از میان چند صدای همزمان دچار مشکل می شوند.

به تازگی محققان مرکز تحقیقاتی Idiap در سوئیس با همکاری گوگل راه حلی برای این مشکل یافتند . آنها با طراحی دو شبکه عصبی مبتنی بر هوش مصنوعی و ترکیب کارکردهای آنها با هم استخراج صدای فرد مورد نظر در یک جمع بزرگ و پرسروصدا را ممکن کرده اند.

از دو شبکه عصبی طراحی شده یکی وظیفه شناسایی صدای تک تک افراد و دیگری وظیفه استخراج آنها را بر عهده دارد. تلاش برای طراحی این سیستم از ابتدای سال جاری میلادی آغاز شده و آزمایش آن با موفقیت در آزمایشگاه هوش مصنوعی و علوم رایانه دانشگاه ام آی تی انجام شد.

این سیستم که پیکسل پلیر نام دارد، با دریافت ویدئوهایی از یوتیوب توانسته صدای تک تک افراد هدف را از آنها استخراج کند. تغذیه این سیستم و افزایش توان یادگیری آن از طریق تغذیه آن با استفاده از انبوهی از نمونه های صدا صورت گرفته که تعداد آنها بالغ بر ۳۴ میلیون مورد می باشد .

میزان خطای این سیستم در ابتدا در حدود ۵۵.۹ درصد بوده که بعد از مدتی به ۲۳.۴ درصد کاهش یافته است.

 

 

 

تیم صداهای همراه کلیک کنید

برجسب ها : , , , , , .

Rate it
آواتار
نویسنده

علی علیزاده

علی علیزاده هستم، مدرس کلاس های: تحول فردی - تغییر الگوهای رفتاری (پارادایم شیفت) - زبان بدن - شخصیت شناسی دیسک

list بایگانی

ارسال نظر (0)

نظر دهید

آدرس ایمیل شما منتشر نخواهد شد. فیلدهای مورد نیاز علامت گذاری شده اند *