تلفن: ۰۴۱۴۲۲۷۳۷۸۱
تلفن: ۰۹۲۱۶۴۲۶۳۸۴

ترجمه مقاله الگوریتم CLOSE روشی داده محور برای تفکیک گفتار – نشریه IEEE

عنوان فارسی: الگوریتم CLOSE: روشی داده محور برای تفکیک گفتار
عنوان انگلیسی: CLOSE—A Data-Driven Approach to Speech Separation
تعداد صفحات مقاله انگلیسی : 14 تعداد صفحات ترجمه فارسی : 33
سال انتشار : 2013 نشریه : آی تریپل ای - IEEE
فرمت مقاله انگلیسی : PDF فرمت ترجمه مقاله : ورد تایپ شده
کد محصول : 6332 رفرنس : دارد
محتوای فایل : zip حجم فایل : 3.12Mb
رشته های مرتبط با این مقاله: مهندسی کامپیوتر
گرایش های مرتبط با این مقاله: مهندسی الگوریتم ها و محاسبات، مهندسی نرم افزار و هوش مصنوعی
مجله: نتایج و یافته های بدست آمده در حوزه پردازش شنیداری، بیان و زبان
دانشگاه: مهندسی برق و علوم کامپیوتر، دانشکده الکترونیک، دانشگاه کوئین بلفاست، بریتانیا
کلمات کلیدی: گفتار هم کانال، طولانی ترین بخش تطبیقی، شناسایی گوینده، بازشناسی گفتار، تفکیک گفتار، ساختار های زمانی
وضعیت ترجمه عناوین تصاویر و جداول: ترجمه شده است
وضعیت ترجمه متون داخل تصاویر و جداول: ترجمه نشده است
وضعیت فرمولها و محاسبات در فایل ترجمه: به صورت عکس، درج شده است
ترجمه این مقاله با کیفیت عالی آماده خرید اینترنتی میباشد. بلافاصله پس از خرید، دکمه دانلود ظاهر خواهد شد. ترجمه به ایمیل شما نیز ارسال خواهد گردید.
فهرست مطالب

چکیده

1. مقدمه

2. روش CLOSE برای تفکیک گفتار

A. مدل سازی سخن های آموزش

B. تفکیک مبتنی بر ترکیب طولانی ترین بخش ها- CLOSE

C. موارد خاص

3. جزئیات بیشتر اجرا

A. اصلاح فریم ترکیبی و مدلسازی GA

B. تعیین زوج گوینده ها

C. بازسازی بیان بی نقص

4. مطالعات تجربی

A. داده تست، سیستم ها و سنجش های عملکرد

B. ارزیابی شناسایی گوینده

C. ارزیابی سیستم CLOSE محدود یک طرفه

D. تحلیل الگوریتم CLOSE

5. نتایج به دست آمده

نمونه متن انگلیسی

Abstract

This paper studies single-channel speech separation, assuming unknown, arbitrary temporal dynamics for the speech signals to be separated. A data-driven approach is described, which matches each mixed speech segment against a composite training segment to separate the underlying clean speech segments. To advance the separation accuracy, the new approach seeks and separates the longest mixed speech segments with matching composite training segments. Lengthening the mixed speech segments to match reduces the uncertainty of the constituent training segments, and hence the error of separation. For convenience, we call the new approach Composition of Longest Segments, or CLOSE. The CLOSE method includes a data-driven approach to model long-range temporal dynamics of speech signals, and a statistical approach to identify the longest mixed speech segments with matching composite training segments. Experiments are conducted on the Wall Street Journal database, for separating mixtures of two simultaneous large-vocabulary speech utterances spoken by two different speakers. The results are evaluated using various objective and subjective measures, including the challenge of large-vocabulary continuous speech recognition. It is shown that the new separation approach leads to significant improvement in all these measures.

نمونه متن ترجمه

چکیده

این مقاله تفکیک گفتار تک کانالی را با فرض ساختار های زمانی ناشناخته و اختیاری به منظور تفکیک سیگنال های گفتاری مورد بررسی و مطالعه قرار می دهد. یک روش داده محور توصیف می شود به طوری که هر بخش ترکیب گفتاری را در برابر یک بخش ترکیبی آموزشی برای تفکیک بخش های گفتار مورد نظر مطابقت می دهد. این روش جدید به منظور افزایش دقت جداسازی به دنبال طولانی ترین بخش های ترکیبی گفتار که با بخش های ترکیبی آموزش سازگانی دارند می گردد و آن ها را تفکیک می کند. طولانی کردن بخش های ترکیبی گفتار به منظور سازگاری، عدم قطعیت بخش های تشکیل دهنده آموزشی را کاهش می دهد و در نتیجه خطای جداسازی را کاهش می دهد. برای راحتی کار این روش را ترکیب طولانی ترین بخش ها یا به طور خلاصه CLOSE می نامیم. روش CLOSE شامل یک روش داده محور برای مدل سازی ساختار زمانی دراز مدت سیگنال های گفتار است و همچنین یک روش آماری برای شناسایی طولانی ترین بخش های ترکیبی گفتار سازگار با بخش های ترکیبی آموزش است. آزمایش ها بر روی دیتابیس Wall Street Journal برای تفکیک ترکیب های دو سخن گفتاری لحظه ای و با واژگان گسترده انجام شده است که توسط دو گوینده متفاوت ارائه شده است. نتایج به دست آمده با استفاده از سنجش های هدف و موضوعی مختلف ارزیابی شده است که شامل چالش بازشناسی گفتار پیوسته با دامنه لغات وسیع است. نشان داده شده است که این روش جدید جداسازی منجر به بهبود قابل توجهی در تمامی این سنجش ها شده است.