ترجمه مقاله Sprint یک طبقه بندی موازی مقیاس پذیر برای داده کاوی - نشریه ACM

ترجمه مقاله Sprint یک طبقه بندی موازی مقیاس پذیر برای داده کاوی - نشریه ACM
قیمت خرید این محصول
۳۹,۰۰۰ تومان
دانلود رایگان نمونه دانلود مقاله انگلیسی
عنوان فارسی
Sprint: یک طبقه بندی موازی مقیاس پذیر برای داده کاوی
عنوان انگلیسی
SPRINT: A Scalable Parallel Classifier for Data Mining
صفحات مقاله فارسی
30
صفحات مقاله انگلیسی
12
سال انتشار
1996
نشریه
ACM
فرمت مقاله انگلیسی
PDF
فرمت ترجمه مقاله
ورد تایپ شده
رفرنس
دارد
کد محصول
5796
وضعیت ترجمه عناوین تصاویر و جداول
ترجمه شده است
وضعیت ترجمه متون داخل تصاویر و جداول
ترجمه نشده است
وضعیت فرمولها و محاسبات در فایل ترجمه
به صورت عکس، درج شده است
رشته های مرتبط با این مقاله
مهندسی کامپیوتر
گرایش های مرتبط با این مقاله
مهندسی الگوریتم ها و محاسبات، مهندسی نرم افزار و رایانش ابری
مجله
بیست و دومین کنفرانس بین المللی بانک های اطلاعاتی بسیار بزرگ
دانشگاه
مرکز تحقیقات آلمادن IBM
فهرست مطالب
1-مقدمه
2- الگوریتم مجموعه ای
2-1-ساختار های داده
لیستهای صفات
هیستوگرامها
2-2 یافتن نقاط تقسیم
صفات پیوسته
صفات طبقه ای
2-3 انجام تقسیم
2-4- مقایسه با SLIQ
3- موازی سازی طبقه بندی
3-1-قرار دهی داده و حفظ تعادل حجم کار
3-2-یافتن نقاط تقسیم
صفات پیوسته
صفات دسته بندی
3-3- انجام تقسیم
3-4- موازی سازی SLIQ
3-4-1- لیست طبقه تکرار شده
3-4-2-لیست طبقه توزیع یافته
4-ارزیابی کارایی
4-1- مجموعه داده ها
4-2- کارایی مجموعه ای
4-3-عملکرد موازی
4-3-1 مقایسه الگوریتم های موازی
4-3-2 مقیاس پذیری
4-3-3-افزایش سرعت
4-3-4-سایزبندی
5 نتیجه گیری
نمونه چکیده متن اصلی انگلیسی
Abstract

Classification is an important data mining problem. Although classification is a wellstudied problem, most of the current classification algorithms require that all or a portion of the the entire dataset remain permanently in memory. This limits their suitability for mining over large databases. We present a new decision-tree-based classification algorithm, called SPRINT that removes all of the memory restrictions, and is fast and scalable. The algorithm has also been designed to be easily parallelized, allowing many processors to work together to build a single consistent model. This parallelization, also presented here, exhibits excellent scalability as well. The combination of these characteristics makes the proposed algorithm an ideal tool for data mining.

نمونه چکیده ترجمه متن فارسی
چکیده

طبقه بندی یکی از مسائل داده کاوی مهم می باشد. گرچه طبقه بندی یک مسئله ای است که به خوبی مطالعه شده است، بسیاری از الگوریتم های طبقه بندی فعلی نیاز دارند که همه یا بخشی از کل  مجموعه داده ها به طور دائم در حافظه باقی بمانند. این مسئله مناسب بودن آنها برای کاوش در پایگاه داده های بزرگ را محدود می کند. ما یک الگوریتم طبقه بندی مبتنی بر درخت تصمیم به نام sprit را ارائه کردیم که تمامی محدودیتهای حافظه را حذف می کند ، و سریع و مقیاس پذیر می باشد. الگوریتم طوری طراحی شده که به راحتی موازی شود، به بسیاری از پردازشگرها باید اجازه دهد تا یک مدل سازگار واحد ایجاد کنند. این موازی سازی ، که در اینجا نیز ارائه شده، مقیاس پذیری خوبی را نیز نشان می دهد. ترکیب این ویژگی ها الگوریتم پیشنهادی را یک ابزار ایده آل برای داده کاوی تبدیل می کند.


بدون دیدگاه