تلفن: ۰۴۱۴۲۲۷۳۷۸۱
تلفن: ۰۹۲۱۶۴۲۶۳۸۴

ترجمه مقاله تشخیص همپوشانی گفتار با حافظه کوتاه و بلند مدت شبکه های عصبی بازگشتی – نشریه CiteSeerX

عنوان فارسی: تشخیص همپوشانی گفتار با حافظه کوتاه و بلند مدت شبکه های عصبی بازگشتی
عنوان انگلیسی: Detecting Overlapping Speech with Long Short-Term Memory Recurrent Neural Networks
تعداد صفحات مقاله انگلیسی : 5 تعداد صفحات ترجمه فارسی : 13
نشریه : CiteSeerX فرمت مقاله انگلیسی : PDF
فرمت ترجمه مقاله : ورد تایپ شده کد محصول : 8028
محتوای فایل : zip حجم فایل : 919.02Kb
رشته های مرتبط با این مقاله: مهندسی کامپیوتر
گرایش های مرتبط با این مقاله: هوش مصنوعی و مهندسی الگوریتم ها و محاسبات
دانشگاه: موسسه ارتباطات انسان و ماشین، آلمان
کلمات کلیدی: تشخیص هم پوشانی گفتار ، تقطیع سخنگو ، شبکه های عصبی ، حافظه بلند و کوتاه مدت
وضعیت ترجمه عناوین تصاویر و جداول: ترجمه شده است
وضعیت ترجمه متون داخل تصاویر و جداول: ترجمه نشده است
وضعیت فرمولها و محاسبات در فایل ترجمه: به صورت عکس، درج شده است
ترجمه این مقاله با کیفیت عالی آماده خرید اینترنتی میباشد. بلافاصله پس از خرید، دکمه دانلود ظاهر خواهد شد. ترجمه به ایمیل شما نیز ارسال خواهد گردید.
فهرست مطالب

چکیده

1- مقدمه

2 – سیستم تشخیص هم پوشانی

2.1 سیستم مدل پنهان مارکف

2.2. ویژگی های صوتی

3 - حافظه کوتاه و بلند مدت شبکه های عصبی بازگشتی برای تشخیص هم پوشانی

3.1 حافظه کوتاه /بلند مدت-شبکه عصبی برگشتی ها

4. آزمایش

4.1. راه اندازی آزمایشی

4.2 نتایج

نتیجه گیری

نمونه متن انگلیسی

Abstract

Detecting segments of overlapping speech (when two or more speakers are active at the same time) is a challenging problem. Previously, mostly HMM-based systems have been used for overlap detection, employing various different audio features. In this work, we propose a novel overlap detection system using Long Short-Term Memory (LSTM) recurrent neural networks. LSTMs are used to generate framewise overlap predictions which are applied for overlap detection. Furthermore, a tandem HMM-LSTM system is obtained by adding LSTM predictions to the HMM feature set. Experiments with the AMI corpus show that overlap detection performance of LSTMs is comparable to HMMs. The combination of HMMs and LSTMs improves overlap detection by achieving higher recall.

نمونه متن ترجمه

چکیده

تشخیص بخش های همپوشانی گفتار ( زمانی دو یا بیشتر از دو گوینده در یک زمان فعالیت می کنند ) در حال حاضر با مشکلاتی دست و پنجه نرم می کند . پیش تربیشتر سیستم های مبتنی بر مدل پنهان مارکف به منظور تشخیص هم پوشانی مورد استفاده قرار گرفته اند و در این راستا از ویژگی های صوتی و آدیوی گوناگونی استفاده کرده اند . در این مقاله یک سیستم تشخیص همپوشانی مورد برسی قرار گرفته است که از حافظه بلند و کوتاه مدت شبکه های عصبی بازگشتی استفاده می کند . از این سیستم ها برای ایجاد ساختار های پیش بینی کننده ی همپوشانی استفاده می کنند که در تشخیص هم پوشانی هم به کار می آید . به علاوه یک سیستم مدل پنهان مارکف-حافظه کوتاه /بلند مدت با استفاده از پیش بینی حافظه کوتاه /بلند مدت به ویژگی مدل پنهان مارکف به کار گرفته شده است . آزمایش هایی که با لاشه ی تعامل افزوده چند کاربره انجام شده است نشان می دهد که اجرای تشخیص هم پوشانی حافظه کوتاه /بلند مدت ها با مدل پنهان مارکف ها قابل قیاس است . ترکیب مدل پنهان مارکف ها و حافظه کوتاه /بلند مدت ها تشخیص هم پوشانی را با استفاده از فراخوان های بالاتر تقویت می کند .