ترجمه مقاله نقش ضروری ارتباطات 6G با چشم انداز صنعت 4.0
- مبلغ: ۸۶,۰۰۰ تومان
ترجمه مقاله پایداری توسعه شهری، تعدیل ساختار صنعتی و کارایی کاربری زمین
- مبلغ: ۹۱,۰۰۰ تومان
Database preprocessing is very important to utilize memory usage, compression is one of the preprocessing needed to reduce the memory required to store and load data for processing, the method of compression introduced in this paper was tested, by using proposed examples to show the effect of repetition in database, as well as the size of database, the results showed that as the repetition increased the compression ratio will be increased. The compression is one of the important activities for data preprocessing before implementing data mining. Data mining methods such as Na¨ıve Bayes, Nearest Neighbor and Decision Tree are tested. The implementation of the three methods showed that Na¨ıve Bayes method is effectively used when the data attributes are categorized, and it can be used successfully in machine learning. The Nearest Neighbor is most suitable when the data attributes are continuous or categorized. The third method tested is the Decision Tree, it is a simple predictive method implemented by using simple rule methods in data classification. The success of data mining implementation depends on the completeness of database, that represented by data warehouse, that must be organized by using the important characteristics of data warehouse.
پردازش پایگاه داده ها در بهره برداری از مصرف حافظه بسیار حایز اهمیت می باشد ، متراکم سازی یکی از ابزار پیش پردازش ضروری برای کاستن از حافظه مورد نیاز برای ذخیره کردن و بارگذاری داده ها به منظور پردازش می باشد ، روش متراکم سازی ارایه شده در این مقاله از طریق بکارگیری مثال های پیشنهاد شده مورد تست قرار گرفت تا تاثیر تکرار در پایگاه داده ها و همچنین اندازه پایگاه داده ها را نشان بدهد و نتایج مشخص نمودند که هر وقت تکرار افزایش یافته است ، نسیت متراکم سازی افزایش خواهد یافت . متراکم سازی یکی از فعالیت های مهم برای پیش پردازش داده ها قبل از اجرای داده کاوی می باشد . روش های داده کاوی نظیر Na¨ıve Bayes ، , Nearest neighbor و درختان تصمیم گیری مورد تست قرار می گیرند . اجرای سه روش نشان داد که روش Naïve Bayes به طور موثری درزمانی استفاده می شود که نشانه های داده ها دسته بندی می شوند و ان روش را می توان به طور موفقیت آمیزی در یادگیری ماشینی استفاده نمود . روش Nearest neighbor در زمانی بسیار مناسب می باشد که نشانه های داده ها دایمی هستند یا دسته بندی می شوند . درختان تصمیم گیری سومین روشی می باشد که مورد تست قرار گرفت و این روش یک روش پیشگویانه ساده می باشد که از طریق بکارگیری روش های ساده قاعده در دسته بندی داده ها اجراء گردید . موفقیت اجرای داده کاوی به کامل بودن پایگاه داده ها بستگی دارد که از طریق مخزن های داده ها نشان داده شدند که بایستی از طریق بکارگیری مشخصه های مهم مخزن داده ها سازماندهی گردند .