ترجمه مقاله خوشه بندی با ثبات با استفاده از منظم سازی داده های پرت پراکندگی - نشریه IEEE

قیمت خرید این محصول

۲۹,۰۰۰ تومان

دانلود مقاله انگلیسی

عنوان فارسی

خوشه بندی با ثبات با استفاده از منظم سازی داده های پرت-پراکندگی

عنوان انگلیسی

Robust Clustering Using Outlier-Sparsity Regularization

صفحات مقاله فارسی

44

صفحات مقاله انگلیسی

15

سال انتشار

2012

نشریه

آی تریپل ای - IEEE

فرمت مقاله انگلیسی

PDF

فرمت ترجمه مقاله

ورد تایپ شده

رفرنس

دارد

کد محصول

F844

وضعیت ترجمه عناوین تصاویر و جداول

ترجمه شده است

وضعیت ترجمه متون داخل تصاویر و جداول

ترجمه شده است

وضعیت فرمولها و محاسبات در فایل ترجمه

به صورت عکس، درج شده است

رشته های مرتبط با این مقاله

مهندسی کامپیوتر

گرایش های مرتبط با این مقاله

مهندسی الگوریتم ها و محاسبات

مجله

یافته ها در حوزه سیگنال - TRANSACTIONS ON SIGNAL

دانشگاه

بخش مهندسی برق و کامپیوتر، دانشگاه مینه سوتا، مینیاپولیس، ایالات متحده آمریکا

کلمات کلیدی

نزول مختصات (بلوک)، خوشه بندی، الگوریتم بیشینه سازی امید ریاضی، گروه-لاسو، کامینز، روش های هسته ای، مدل های ترکیبی، استواری، پراکندگی

ترجمه این مقاله با کیفیت متوسط انجام شده است. بلافاصله پس از خرید، دکمه دانلود ظاهر خواهد شد. ترجمه به ایمیل شما نیز ارسال خواهد گردید.

فهرست مطالب

چکیده
1- مقدمه
2- خوشه بندی پراکندگی-آگاه: شرایط و معیار ها
الف: خوشه بندی کامینز
ب: خوشه بندی احتمالی
3- الگوریتم های خوشه بندی با ثبات
الف: الگوریتم های کامینز( نرم) با ثبات
الگوریتم 1: کامینز با ثبات
ب: الگوریتم های خوشه بندی احتمالی با ثبات
الگوریتم 2: خوشه بندی احتمال گرایانه قوی
پ: الگوریتم های خوشه بندی با ثبات وزنی
4- خوشه بندی داده های تفکیک پذیر غیر خطی و با بعد بالا
الف: کامینز با ثبات برای داده های با بعد بالا
ب:RKM هسته ای برای خوشه های تفکیک پذیر غیر خطی
ج: خوشه بندی احتمالی با ثبات هسته ای
الگوریتم 4: RPC هسته ای
5- تست های عددی
الف: مجموعه داده های مصنوعی
ب: مجموعه داده های USPS
پ: خوشه بندی سند
ت: شبکه فوتبال کالج
6-نتیجه گیری
پیوست A: اثبات قضیه
اثبات فرض1
پیوست ب
اثبات فرض 2
اثبات فرض 3

نمونه چکیده متن اصلی انگلیسی

Abstract

Notwithstanding the popularity of conventional clustering algorithms such as K-means and probabilistic clustering, their clustering results are sensitive to the presence of outliers in the data. Even a few outliers can compromise the ability of these algorithms to identify meaningful hidden structures rendering their outcome unreliable. This paper develops robust clustering algorithms that not only aim to cluster the data, but also to identify the outliers. The novel approaches rely on the infrequent presence of outliers in the data, which translates to sparsity in a judiciously chosen domain. Leveraging sparsity in the outlier domain, outlier-aware robust K-means and probabilistic clustering approaches are proposed. Their novelty lies on identifying outliers while effecting sparsity in the outlier domain through carefully chosen regularization. A block coordinate descent approach is developed to obtain iterative algorithms with convergence guarantees and small excess computational complexity with respect to their non-robust counterparts. Kernelized versions of the robust clustering algorithms are also developed to efficiently handle high-dimensional data, identify nonlinearly separable clusters, or even cluster objects that are not represented by vectors. Numerical tests on both synthetic and real datasets validate the performance and applicability of the novel algorithms.

نمونه چکیده ترجمه متن فارسی

چکیده
علی رغم محبوبیت الگوریتم های خوشه بندی سنتی نظیر کامینز و خوشه بندی احتمالی، نتایج خوشه بندی آن ها به حضور داده های پرت در داده ها حساس است. حتی تعداد کمی از داده های پرت قادرند تا توانایی این الگوریتم ها را در شناسایی ساختار های پنهان معنی دار کاهش دهند به طوری که موجب می شوند تا نتایج و برایند آن ها نیز غیر قابل اطمینان شود. این مقاله الگوریتم های خوشه بندی قوی( با ثبات/) را توسعه می دهد، الگوریتم هایی که نه تنها هدف آن ها خوشه بندی داده ها، بلکه شناسایی داده های پرت است. رویکرد های جدید به حضور نادر داده های پرت متکی هستند که به پراکندگی در یک دامنه انتخاب شده به طور منطقی ترجمه می شود. با استفاده از پراکندگی در دامنه داده پرت، رویکرد های خوشه بندی احتمالی و کامینز قوی داده پرت-آگاه پیشنهاد می شوند. تازگی آن ها منوط به شناسایی داده های پرت ضمن تاثیر گذاری بر پراکندگی در دامنه داده های پرت از طریق منظم سازی انتخاب شده به طور منطقی می باشد. یک رویکرد نزول مختصات بلوکی برای دست یابی به الگوریتم های تکراری با تضمین های همگرایی و اندکی پیچیدگی محاسباتی مازاد با توجه به همتاهای غیر قوی آن ها توسعه می یابد. نسخه مرکزی الگوریتم های خوشه بندی قوی نیز برای مدیریت کارامد داده های با بعد زیاد، شناسایی خوشه های قابل تفکیک غیر خطی یا حتی اشیای خوشه که با بردار ها نشان داده نمی شوند توسعه می یابد. تست های عددی در هر دو مجموعه داده های مصنوعی و واقعی برای ارزیابی عملکرد و قابلیت تعمیم و اجرای الگوریتم های جدید استفاده می شوند.