ترجمه مقاله بهبود سیستم های خودکار شناسایی گفتار از طریق ویژگی های دینامیک ارزیابی شده - نشریه الزویر

ترجمه مقاله بهبود سیستم های خودکار شناسایی گفتار از طریق ویژگی های دینامیک ارزیابی شده - نشریه الزویر
قیمت خرید این محصول
۳۷,۰۰۰ تومان
دانلود رایگان نمونه دانلود مقاله انگلیسی
عنوان فارسی
بهبود سیستم های خودکار شناسایی گفتار از طریق ویژگی های دینامیک ارزیابی شده از طرح بازگشتی سیگنال های گفتار
عنوان انگلیسی
Improvement of automatic speech recognition systems via nonlinear dynamical features evaluated from the recurrence plot of speech signals
صفحات مقاله فارسی
24
صفحات مقاله انگلیسی
12
سال انتشار
2016
رفرنس
دارای رفرنس در داخل متن و انتهای مقاله
نشریه
الزویر - Elsevier
فرمت مقاله انگلیسی
PDF
فرمت ترجمه مقاله
ورد تایپ شده و pdf
نوع مقاله
ISI
نوع نگارش
مقالات پژوهشی (تحقیقاتی)
نوع ارائه مقاله
ژورنال
پایگاه
اسکوپوس
ایمپکت فاکتور(IF) مجله
2.762 در سال 2018
شاخص H_index مجله
49 در سال 2019
شاخص SJR مجله
0.443 در سال 2018
شناسه ISSN مجله
0045-7906
شاخص Q یا Quartile (چارک)
Q2 در سال 2018
کد محصول
9757
وضعیت ترجمه عناوین تصاویر و جداول
ترجمه شده است ✓
وضعیت ترجمه متون داخل تصاویر و جداول
جداول ترجمه شده است ✓ تصاویر ترجمه نشده است ☓
وضعیت ترجمه منابع داخل متن
درج نشده است ☓
وضعیت فرمولها و محاسبات در فایل ترجمه
به صورت عکس، درج شده است ✓
بیس
نیست ☓
مدل مفهومی
ندارد ☓
پرسشنامه
ندارد ☓
متغیر
ندارد ☓
رفرنس در ترجمه
در انتهای مقاله درج شده است
رشته و گرایش های مرتبط با این مقاله
مهندسی کامپیوتر، هوش مصنوعی و مهندسی ااگوریتم ها و محاسبات
مجله
کامپیوتر و مهندسی برق - Computers and Electrical Engineering
دانشگاه
گروه مهندسی پزشکی، دانشگاه صنعتی امیرکبیر، تهران، ایران
کلمات کلیدی
تشخیص گفتار خودکار، ضریب های کپسترال فرکانسی مل، فاز بازسازی شده، طرح تکرار، تبدیل موجک دو بعدی
کلمات کلیدی انگلیسی
Automatic speech recognition - Mel-frequency cepstral coefficients - Reconstructed phase space - Recurrence plot - Two-dimensional wavelet transform
doi یا شناسه دیجیتال
https://doi.org/10.1016/j.compeleceng.2016.07.006
فهرست مطالب
چکیده
مقدمه
تاثیر مطالعه
روش ها و مواد مورد استفاده
فضای فاز بازسازی شده
طرح بازگشتی
استخراج ویژگی
متغیر های ثابت دینامیک استخراج شده از RP ها
انتروپی : ر این قسمت، انتروپی رنی به عنوان چهارمین ویژگی در نظر گرفته میشود
استخراج ویژگی با استفاده از تبدیل موجک
روش های کاهش ابعاد
انتخاب ویژگی
تبدیل ویژگی ها
روش شناسی های آزمایشی
مروری بر روی سیستم
دیتابیس
نتایج آزمایشی
مباحث
جمع بندی
نمونه چکیده متن اصلی انگلیسی
Abstract

The spectral-based features, typically used in Automatic Speech Recognition (ASR) systems, reject the phase information of speech signals. Thus, employing extra features, in which the phase of the signal is not rejected, may fill this gap. Embedding the speech signal in the Reconstructed Phase Space (RPS) and then extracting some useful features from it, is a recently considered approach in this field. In this paper, we will follow this approach by evaluating some useful features from the Recurrence Plot (RP) of the embedded speech signals in the RPS; the proposed features are evaluated via applying a two-dimensional wavelet transform to the resulted RP diagrams. The proposed features are examined in an ASR task alone and in combination with the traditional Mel-Frequency Cepstral Coefficients (MFCC). For the second case, using English TIMIT corpus, 3.94% absolute classification accuracy improvement in the phoneme recognition accuracy rate, against using only the MFCC features is gained.

نمونه چکیده ترجمه متن فارسی
چکیده
ویژگی های مبتنی بر طیف سیگنال، که معمولا در سیستم های خودکار تشخیص گفتار مورد استفاده قرار میگیرد (ASR) ، اطلاعات فاز سیگنال های گفتار رد میشود. ازین رو، با استفاده از ویژگی های اضافی، که در آن ها فاز سیگنال رد نشود، میتواند موجب پر شدن این خلا شود. با قرار دادن سیگنال های گفتار در فضای فاز بازسازی شده ( RPS) و سپس استخراج کردن بعضی از ویژگی های مفید از آن، روش جدیدی در این زمینه به دست آمده است. در این مقاله، ما این روش را با ارزیابی بعضی از ویژگی های مفید از طرح بازگشتی (RP) از سیگنال های داخلی RPS ، دنبال میکنیم ؛ ویژگی های پیشنهاد شده با استفاده از اعمال کردن یک تبدیل موجک دو بعدی بر روی دیاگرام های منتج شده ی RP ، ارزیابی میشود. ویزگی های پیشنهاد شده در یک طرح ASR به تنهایی ارزیابی شده و سپس در ترکیب با ضریب های کپسترال فرکانسی مل متداول (MFCC) بررسی میشود. برای مورد دوم، با استفاده از مجموعه کلام رایج انگلیسی TIMIT ، 3.94% بهبود صحت طبقه بندی در نرخ صحت شناسایی صوت ، در مقایسه با استفاده ی تنها از ویژگی های MFCC به دست آمد.

بدون دیدگاه