Robust voice activity detection directed by noise classification
صفحات مقاله فارسی
22
صفحات مقاله انگلیسی
12
سال انتشار
2013
نشریه
اشپرینگر - Springer
فرمت مقاله انگلیسی
PDF
فرمت ترجمه مقاله
ورد تایپ شده
رفرنس
دارد
کد محصول
6928
وضعیت ترجمه عناوین تصاویر و جداول
ترجمه شده است
وضعیت ترجمه متون داخل تصاویر و جداول
ترجمه نشده است
وضعیت فرمولها و محاسبات در فایل ترجمه
به صورت عکس، درج شده است
رشته های مرتبط با این مقاله
مهندسی کامپیوتر
گرایش های مرتبط با این مقاله
هوش مصنوعی و مهندسی الگوریتم ها و محاسبات
مجله
پردازش ویدئو، سیگنال و تصویر - Signal
دانشگاه
دانشکده مهندسی برق، دانشگاه صنعتی امیرکبیر، تهران، ایران
کلمات کلیدی
تشخیص فعالیت صوتی، تبدیل بسته موجک ادراکی، طبقه بندی نویز، ماشین بردار پشتیبانی
۰.۰(بدون امتیاز)
امتیاز دهید
فهرست مطالب
چکیده
1 مقدمه
2 تبدیل بسته موجک ادراکی
3 روش ارائه شده
3.1 دستهبندی نویز
3.1.1 استخراج ویژگی
3.1.2 نتایج دستهبندی نویز
2.3. تشخیص گفتار هدایت شده با روش دستهبندی نویز
1.2.3 استخراج ویژگی
2.2.3. ایجاد مدل SVM بر اساس نوع نویز
4. نتایج تجربی
5 نتیجهگیری
نمونه چکیده متن اصلی انگلیسی
Abstract
In this paper voice activity detection (VAD) is formulated as a two-class classification problem using support vector machines (SVM). The proposed method combines a noise robust speech processing feature extraction process together with SVM models trained in different background noises for speech/non-speech classification. A multiclass SVM is also used to classify background noises in order to select SVM model for VAD. The proposed VAD is tested with TIMIT data artificially distorted by different additive noise types and is compared with state-of-the-art VADs. Experimental results show that the proposed VAD can extract speech activity under poor SNR conditions, and it is also insensitive to variable levels of noise.
نمونه چکیده ترجمه متن فارسی
چکیده
در این مقاله تشخیص گفتار (VAD) به کمک ماشین بردار پشتیبان (SVM) به صورت یک مساله دستهبندی دو کلاسه فرموله شده است. روش ارائه شده، برای دستهبندی گفتار/غیرگفتار، یک فرایند استخراج ویژگی پردازش گفتار مقاوم به نویز را با مدلهای ماشین بردار پشتیبان آموزش دیده در انواع نویز زمینهها ترکیب میکند. همچنین از یک ماشین بردار پشتیان چندکلاسه به منظور دستهبندی نویزهای زمینه به کار رفت تا برای تشخیص گفتار، مدل ماشین بردار پشتیبان انتخاب شود. روش تشخیص گفتار ارائهشده در این مقاله، توسط دادههای TIMIT که به صورت مصنوعی و با کمک انواع نویزهای افزوده شده به آن معوج شدهاند، تست شده و با تشخیصگفتارهای بروز و پیشرفته مقایسه میوشد. نتایج شبیهسازی نشان میدهند که روش تشخیص گفتار ارائه شده میتواند گفتار را تحت شرایط نسبت سیگنال به نویز ضعیف استخراج کند و اینکه به سطوح مختلفی از نویز حساس نیست.