تلفن: ۰۴۱۴۲۲۷۳۷۸۱
تلفن: ۰۹۲۱۶۴۲۶۳۸۴

ترجمه مقاله بهبود سیستم های خودکار شناسایی گفتار از طریق ویژگی های دینامیک ارزیابی شده – نشریه الزویر

عنوان فارسی: بهبود سیستم های خودکار شناسایی گفتار از طریق ویژگی های دینامیک ارزیابی شده از طرح بازگشتی سیگنال های گفتار
عنوان انگلیسی: Improvement of automatic speech recognition systems via nonlinear dynamical features evaluated from the recurrence plot of speech signals
تعداد صفحات مقاله انگلیسی : 12 تعداد صفحات ترجمه فارسی : 24 (شامل 1 صفحه رفرنس انگلیسی)
سال انتشار : 2016 نشریه : الزویر - Elsevier
فرمت مقاله انگلیسی : PDF فرمت ترجمه مقاله : ورد تایپ شده و pdf
نوع مقاله : ISI نوع نگارش : مقالات پژوهشی (تحقیقاتی)
پایگاه : اسکوپوس نوع ارائه مقاله : ژورنال
ایمپکت فاکتور(IF) مجله : 2.762 در سال 2018 شاخص H_index مجله : 49 در سال 2019
شاخص SJR مجله : 0.443 در سال 2018 شناسه ISSN مجله : 0045-7906
شاخص Q یا Quartile (چارک) : Q2 در سال 2018 کد محصول : 9757
محتوای فایل : zip حجم فایل : 3.32Mb
رشته و گرایش های مرتبط با این مقاله: مهندسی کامپیوتر، هوش مصنوعی و مهندسی ااگوریتم ها و محاسبات
مجله: کامپیوتر و مهندسی برق - Computers and Electrical Engineering
دانشگاه: گروه مهندسی پزشکی، دانشگاه صنعتی امیرکبیر، تهران، ایران
کلمات کلیدی: تشخیص گفتار خودکار، ضریب های کپسترال فرکانسی مل، فاز بازسازی شده، طرح تکرار، تبدیل موجک دو بعدی
کلمات کلیدی انگلیسی: Automatic speech recognition - Mel-frequency cepstral coefficients - Reconstructed phase space - Recurrence plot - Two-dimensional wavelet transform
وضعیت ترجمه عناوین تصاویر و جداول: ترجمه شده است ✓
وضعیت ترجمه متون داخل تصاویر و جداول: جداول ترجمه شده است ✓ تصاویر ترجمه نشده است ☓
وضعیت ترجمه منابع داخل متن: درج نشده است ☓
وضعیت فرمولها و محاسبات در فایل ترجمه: به صورت عکس، درج شده است ✓
بیس: نیست ☓
مدل مفهومی: ندارد ☓
پرسشنامه: ندارد ☓
متغیر: ندارد ☓
رفرنس: دارای رفرنس در داخل متن و انتهای مقاله
رفرنس در ترجمه: در انتهای مقاله درج شده است
doi یا شناسه دیجیتال: https://doi.org/10.1016/j.compeleceng.2016.07.006
ترجمه این مقاله با کیفیت عالی آماده خرید اینترنتی میباشد. بلافاصله پس از خرید، دکمه دانلود ظاهر خواهد شد. ترجمه به ایمیل شما نیز ارسال خواهد گردید.
فهرست مطالب

چکیده

مقدمه

تاثیر مطالعه

روش ها و مواد مورد استفاده

فضای فاز بازسازی شده

طرح بازگشتی

استخراج ویژگی

متغیر های ثابت دینامیک استخراج شده از RP ها

انتروپی : ر این قسمت، انتروپی رنی به عنوان چهارمین ویژگی در نظر گرفته میشود

استخراج ویژگی با استفاده از تبدیل موجک

روش های کاهش ابعاد

انتخاب ویژگی

تبدیل ویژگی ها

روش شناسی های آزمایشی

مروری بر روی سیستم

دیتابیس

نتایج آزمایشی

مباحث

جمع بندی

نمونه متن انگلیسی

Abstract

The spectral-based features, typically used in Automatic Speech Recognition (ASR) systems, reject the phase information of speech signals. Thus, employing extra features, in which the phase of the signal is not rejected, may fill this gap. Embedding the speech signal in the Reconstructed Phase Space (RPS) and then extracting some useful features from it, is a recently considered approach in this field. In this paper, we will follow this approach by evaluating some useful features from the Recurrence Plot (RP) of the embedded speech signals in the RPS; the proposed features are evaluated via applying a two-dimensional wavelet transform to the resulted RP diagrams. The proposed features are examined in an ASR task alone and in combination with the traditional Mel-Frequency Cepstral Coefficients (MFCC). For the second case, using English TIMIT corpus, 3.94% absolute classification accuracy improvement in the phoneme recognition accuracy rate, against using only the MFCC features is gained.

نمونه متن ترجمه

چکیده

ویژگی های مبتنی بر طیف سیگنال، که معمولا در سیستم های خودکار تشخیص گفتار مورد استفاده قرار میگیرد (ASR) ، اطلاعات فاز سیگنال های گفتار رد میشود. ازین رو، با استفاده از ویژگی های اضافی، که در آن ها فاز سیگنال رد نشود، میتواند موجب پر شدن این خلا شود. با قرار دادن سیگنال های گفتار در فضای فاز بازسازی شده ( RPS) و سپس استخراج کردن بعضی از ویژگی های مفید از آن، روش جدیدی در این زمینه به دست آمده است. در این مقاله، ما این روش را با ارزیابی بعضی از ویژگی های مفید از طرح بازگشتی (RP) از سیگنال های داخلی RPS ، دنبال میکنیم ؛ ویژگی های پیشنهاد شده با استفاده از اعمال کردن یک تبدیل موجک دو بعدی بر روی دیاگرام های منتج شده ی RP ، ارزیابی میشود. ویزگی های پیشنهاد شده در یک طرح ASR به تنهایی ارزیابی شده و سپس در ترکیب با ضریب های کپسترال فرکانسی مل متداول (MFCC) بررسی میشود. برای مورد دوم، با استفاده از مجموعه کلام رایج انگلیسی TIMIT ، 3.94% بهبود صحت طبقه بندی در نرخ صحت شناسایی صوت ، در مقایسه با استفاده ی تنها از ویژگی های MFCC به دست آمد.