تلفن: 04142273781

ترجمه مقاله Sprint یک طبقه بندی موازی مقیاس پذیر برای داده کاوی – نشریه ACM

عنوان فارسی: Sprint: یک طبقه بندی موازی مقیاس پذیر برای داده کاوی
عنوان انگلیسی: SPRINT: A Scalable Parallel Classifier for Data Mining
تعداد صفحات مقاله انگلیسی : 12 تعداد صفحات ترجمه فارسی : 30
سال انتشار : 1996 نشریه : ACM
فرمت مقاله انگلیسی : PDF فرمت ترجمه مقاله : ورد تایپ شده
کد محصول : 5796 رفرنس : دارد
محتوای فایل : zip حجم فایل : 1.90Mb
رشته های مرتبط با این مقاله: مهندسی کامپیوتر
گرایش های مرتبط با این مقاله: مهندسی الگوریتم ها و محاسبات، مهندسی نرم افزار و رایانش ابری
مجله: بیست و دومین کنفرانس بین المللی بانک های اطلاعاتی بسیار بزرگ
دانشگاه: مرکز تحقیقات آلمادن IBM
وضعیت ترجمه عناوین تصاویر و جداول: ترجمه شده است
وضعیت ترجمه متون داخل تصاویر و جداول: ترجمه نشده است
وضعیت فرمولها و محاسبات در فایل ترجمه: به صورت عکس، درج شده است
ترجمه این مقاله با کیفیت عالی آماده خرید اینترنتی میباشد. بلافاصله پس از خرید، دکمه دانلود ظاهر خواهد شد. ترجمه به ایمیل شما نیز ارسال خواهد گردید.
فهرست مطالب

1-مقدمه

2- الگوریتم مجموعه ای

2-1-ساختار های داده

لیستهای صفات

هیستوگرامها

2-2 یافتن نقاط تقسیم

صفات پیوسته

صفات طبقه ای

2-3 انجام تقسیم

2-4- مقایسه با SLIQ

3- موازی سازی طبقه بندی

3-1-قرار دهی داده و حفظ تعادل حجم کار

3-2-یافتن نقاط تقسیم

صفات پیوسته

صفات دسته بندی

3-3- انجام تقسیم

3-4- موازی سازی SLIQ

3-4-1- لیست طبقه تکرار شده

3-4-2-لیست طبقه توزیع یافته

4-ارزیابی کارایی

4-1- مجموعه داده ها

4-2- کارایی مجموعه ای

4-3-عملکرد موازی

4-3-1 مقایسه الگوریتم های موازی

4-3-2 مقیاس پذیری

4-3-3-افزایش سرعت

4-3-4-سایزبندی

5 نتیجه گیری

نمونه متن انگلیسی

Abstract

Classification is an important data mining problem. Although classification is a wellstudied problem, most of the current classification algorithms require that all or a portion of the the entire dataset remain permanently in memory. This limits their suitability for mining over large databases. We present a new decision-tree-based classification algorithm, called SPRINT that removes all of the memory restrictions, and is fast and scalable. The algorithm has also been designed to be easily parallelized, allowing many processors to work together to build a single consistent model. This parallelization, also presented here, exhibits excellent scalability as well. The combination of these characteristics makes the proposed algorithm an ideal tool for data mining.

نمونه متن ترجمه

چکیده

طبقه بندی یکی از مسائل داده کاوی مهم می باشد. گرچه طبقه بندی یک مسئله ای است که به خوبی مطالعه شده است، بسیاری از الگوریتم های طبقه بندی فعلی نیاز دارند که همه یا بخشی از کل  مجموعه داده ها به طور دائم در حافظه باقی بمانند. این مسئله مناسب بودن آنها برای کاوش در پایگاه داده های بزرگ را محدود می کند. ما یک الگوریتم طبقه بندی مبتنی بر درخت تصمیم به نام sprit را ارائه کردیم که تمامی محدودیتهای حافظه را حذف می کند ، و سریع و مقیاس پذیر می باشد. الگوریتم طوری طراحی شده که به راحتی موازی شود، به بسیاری از پردازشگرها باید اجازه دهد تا یک مدل سازگار واحد ایجاد کنند. این موازی سازی ، که در اینجا نیز ارائه شده، مقیاس پذیری خوبی را نیز نشان می دهد. ترکیب این ویژگی ها الگوریتم پیشنهادی را یک ابزار ایده آل برای داده کاوی تبدیل می کند.