ترجمه مقاله نقش ضروری ارتباطات 6G با چشم انداز صنعت 4.0
- مبلغ: ۸۶,۰۰۰ تومان
ترجمه مقاله پایداری توسعه شهری، تعدیل ساختار صنعتی و کارایی کاربری زمین
- مبلغ: ۹۱,۰۰۰ تومان
Classification is an important data mining problem. Although classification is a wellstudied problem, most of the current classification algorithms require that all or a portion of the the entire dataset remain permanently in memory. This limits their suitability for mining over large databases. We present a new decision-tree-based classification algorithm, called SPRINT that removes all of the memory restrictions, and is fast and scalable. The algorithm has also been designed to be easily parallelized, allowing many processors to work together to build a single consistent model. This parallelization, also presented here, exhibits excellent scalability as well. The combination of these characteristics makes the proposed algorithm an ideal tool for data mining.
طبقه بندی یکی از مسائل داده کاوی مهم می باشد. گرچه طبقه بندی یک مسئله ای است که به خوبی مطالعه شده است، بسیاری از الگوریتم های طبقه بندی فعلی نیاز دارند که همه یا بخشی از کل مجموعه داده ها به طور دائم در حافظه باقی بمانند. این مسئله مناسب بودن آنها برای کاوش در پایگاه داده های بزرگ را محدود می کند. ما یک الگوریتم طبقه بندی مبتنی بر درخت تصمیم به نام sprit را ارائه کردیم که تمامی محدودیتهای حافظه را حذف می کند ، و سریع و مقیاس پذیر می باشد. الگوریتم طوری طراحی شده که به راحتی موازی شود، به بسیاری از پردازشگرها باید اجازه دهد تا یک مدل سازگار واحد ایجاد کنند. این موازی سازی ، که در اینجا نیز ارائه شده، مقیاس پذیری خوبی را نیز نشان می دهد. ترکیب این ویژگی ها الگوریتم پیشنهادی را یک ابزار ایده آل برای داده کاوی تبدیل می کند.