ترجمه مقاله تشخیص همپوشانی گفتار با حافظه کوتاه و بلند مدت شبکه های عصبی بازگشتی - نشریه CiteSeerX

ترجمه مقاله تشخیص همپوشانی گفتار با حافظه کوتاه و بلند مدت شبکه های عصبی بازگشتی - نشریه CiteSeerX
قیمت خرید این محصول
۲۷,۰۰۰ تومان
دانلود رایگان نمونه دانلود مقاله انگلیسی
عنوان فارسی
تشخیص همپوشانی گفتار با حافظه کوتاه و بلند مدت شبکه های عصبی بازگشتی
عنوان انگلیسی
Detecting Overlapping Speech with Long Short-Term Memory Recurrent Neural Networks
صفحات مقاله فارسی
13
صفحات مقاله انگلیسی
5
سال انتشار
0
نشریه
CiteSeerX
فرمت مقاله انگلیسی
PDF
فرمت ترجمه مقاله
ورد تایپ شده
کد محصول
8028
وضعیت ترجمه عناوین تصاویر و جداول
ترجمه شده است
وضعیت ترجمه متون داخل تصاویر و جداول
ترجمه نشده است
وضعیت فرمولها و محاسبات در فایل ترجمه
به صورت عکس، درج شده است
رشته های مرتبط با این مقاله
مهندسی کامپیوتر
گرایش های مرتبط با این مقاله
هوش مصنوعی و مهندسی الگوریتم ها و محاسبات
دانشگاه
موسسه ارتباطات انسان و ماشین، آلمان
کلمات کلیدی
تشخیص هم پوشانی گفتار ، تقطیع سخنگو ، شبکه های عصبی ، حافظه بلند و کوتاه مدت
فهرست مطالب
چکیده
1- مقدمه
2 – سیستم تشخیص هم پوشانی
2.1 سیستم مدل پنهان مارکف
2.2. ویژگی های صوتی
3 - حافظه کوتاه و بلند مدت شبکه های عصبی بازگشتی برای تشخیص هم پوشانی
3.1 حافظه کوتاه /بلند مدت-شبکه عصبی برگشتی ها
4. آزمایش
4.1. راه اندازی آزمایشی
4.2 نتایج
نتیجه گیری
نمونه چکیده متن اصلی انگلیسی
Abstract

Detecting segments of overlapping speech (when two or more speakers are active at the same time) is a challenging problem. Previously, mostly HMM-based systems have been used for overlap detection, employing various different audio features. In this work, we propose a novel overlap detection system using Long Short-Term Memory (LSTM) recurrent neural networks. LSTMs are used to generate framewise overlap predictions which are applied for overlap detection. Furthermore, a tandem HMM-LSTM system is obtained by adding LSTM predictions to the HMM feature set. Experiments with the AMI corpus show that overlap detection performance of LSTMs is comparable to HMMs. The combination of HMMs and LSTMs improves overlap detection by achieving higher recall.

نمونه چکیده ترجمه متن فارسی
چکیده
تشخیص بخش های همپوشانی گفتار ( زمانی دو یا بیشتر از دو گوینده در یک زمان فعالیت می کنند ) در حال حاضر با مشکلاتی دست و پنجه نرم می کند . پیش تربیشتر سیستم های مبتنی بر مدل پنهان مارکف به منظور تشخیص هم پوشانی مورد استفاده قرار گرفته اند و در این راستا از ویژگی های صوتی و آدیوی گوناگونی استفاده کرده اند . در این مقاله یک سیستم تشخیص همپوشانی مورد برسی قرار گرفته است که از حافظه بلند و کوتاه مدت شبکه های عصبی بازگشتی استفاده می کند . از این سیستم ها برای ایجاد ساختار های پیش بینی کننده ی همپوشانی استفاده می کنند که در تشخیص هم پوشانی هم به کار می آید . به علاوه یک سیستم مدل پنهان مارکف-حافظه کوتاه /بلند مدت با استفاده از پیش بینی حافظه کوتاه /بلند مدت به ویژگی مدل پنهان مارکف به کار گرفته شده است . آزمایش هایی که با لاشه ی تعامل افزوده چند کاربره انجام شده است نشان می دهد که اجرای تشخیص هم پوشانی حافظه کوتاه /بلند مدت ها با مدل پنهان مارکف ها قابل قیاس است . ترکیب مدل پنهان مارکف ها و حافظه کوتاه /بلند مدت ها تشخیص هم پوشانی را با استفاده از فراخوان های بالاتر تقویت می کند .

بدون دیدگاه