ترجمه مقاله یک الگوریتم کارآمد و موثر برای استخراج K الگوی برتر متناوب - نشریه الزویر

ترجمه مقاله یک الگوریتم کارآمد و موثر برای استخراج K الگوی برتر متناوب - نشریه الزویر
قیمت خرید این محصول
۴۱,۰۰۰ تومان
دانلود مقاله انگلیسی
عنوان فارسی
یک الگوریتم کارآمد و موثر برای استخراج K الگوی برتر متناوب
عنوان انگلیسی
An efficient and effective algorithm for mining top-rank-k frequent patterns
صفحات مقاله فارسی
24
صفحات مقاله انگلیسی
9
سال انتشار
2015
رفرنس
دارای رفرنس در داخل متن و انتهای مقاله
نشریه
الزویر - Elsevier
فرمت مقاله انگلیسی
PDF
فرمت ترجمه مقاله
pdf و ورد تایپ شده با قابلیت ویرایش
فونت ترجمه مقاله
بی نازنین
سایز ترجمه مقاله
14
نوع مقاله
ISI
نوع نگارش
مقالات پژوهشی (تحقیقاتی)
نوع ارائه مقاله
ژورنال
پایگاه
اسکوپوس
ایمپکت فاکتور(IF) مجله
7.836 در سال 2019
شاخص H_index مجله
184 در سال 2020
شاخص SJR مجله
1.494 در سال 2019
شناسه ISSN مجله
0957-4174
شاخص Q یا Quartile (چارک)
Q1 در سال 2019
کد محصول
11293
وضعیت ترجمه عناوین تصاویر و جداول
ترجمه شده است ✓
وضعیت ترجمه متون داخل تصاویر و جداول
ترجمه نشده است ☓
وضعیت ترجمه منابع داخل متن
به صورت انگلیسی درج شده است ✓
وضعیت فرمولها و محاسبات در فایل ترجمه
به صورت عکس، درج شده است ✓
ضمیمه
ندارد ☓
بیس
نیست ☓
مدل مفهومی
ندارد ☓
پرسشنامه
ندارد ☓
متغیر
ندارد ☓
رفرنس در ترجمه
در انتهای مقاله درج شده است
رشته و گرایش های مرتبط با این مقاله
مهندسی کامپیوتر، مهندسی الگوریتم ها و محاسبات، مهندسی نرم افزار
مجله
سیستم های خبره با کاربردی آن - Expert Systems with Applications
دانشگاه
گروه علوم کامپیوتر، دانشگاه علوم، ویتنام
کلمات کلیدی
داده کاوی، استخراج الگو، استخراج K الگوی برتر متناوب، لیست N
کلمات کلیدی انگلیسی
Data mining - Pattern mining - Top-rank-k frequent patterns - N-list
doi یا شناسه دیجیتال
https://doi.org/10.1016/j.eswa.2014.07.045
فهرست مطالب
چکیده
1. معرفی
2. کارهای مرتبط
3. تعریف مساله
3.1. الگوهای متناوب
3.2. مساله استخراج K الگوی برتر متناوب
3.3. ساختار N-لیست
3.4. شاخص استنتاج 1-الگوهای متناوب
4. الگوریتم iNTK
4.1 تابع درج N-list
4.2. شاخص استنتاج مربوط به هر 1-الگوی متناوب
4.3. الگوریتم پیشنهادی
4.4. یک مثال روشن
5. نتایج تجربی
5.1. زمان استخراج
5.2. مصرف حافظه
6. نتیجه گیری و کارهای آینده
تصاویر فایل ورد ترجمه مقاله (جهت بزرگنمایی روی عکس کلیک نمایید)
11293-IranArze     11293-IranArze1     11293-IranArze2
نمونه چکیده متن اصلی انگلیسی
Abstract

Frequent pattern mining generates a lot of candidates, which requires a lot of memory usage and mining time. In real applications, a small number of frequent patterns are used. Therefore, the mining of top-rank-k frequent patterns, which limits the number of mined frequent patterns by ranking them in frequency, has received increasing interest. This paper proposes the iNTK algorithm, which is an improved version of the NTK algorithm, for mining top-rank-k frequent patterns. This algorithm employs an N-list structure to represent patterns. The subsume concept is used to speed up the process of mining top-rank-k patterns. The experiments are conducted to evaluate iNTK and NTK in terms of mining time and memory usage for eight datasets. The experimental results show that iNTK is more efficient and faster than NTK.

1. Introduction

An expert system is an intelligent system that solves the complex problems based on knowledge throughout inference procedures. Generally, there are three components in an expert system including knowledge base, inference engine and user interface (Jackson, 1999). The central of expert systems is the knowledge base, because it contains the problem solving knowledge of the particular application (Ahmed, 2008). Therefore, the reduction of this knowledge space plays a big role in the implemented performance of expert systems. Association rules are important of the knowledge (Daniel & Viorel, 2004; Guil, Bosch, Túnez, & Marín, 2003) which represent the relationships between items in a dataset. To generate association rules, traditional approaches first mine frequent patterns which are itemsets, subsequences, and substructures that appear in large transactions or relational datasets with a frequency no less than a given threshold. After that, the system uses these frequent patterns and the minimum confidence to find all rules. Two above phrases require a lot of memory usage and mining time. Therefore, the reduction of time to mine frequent patterns is very useful to enhance expert systems.

6. Conclusion and future work

This paper presents an efficient improvement algorithm called iNTK to mine top-rank-k frequent patterns. The advantage of iNTK lies in that it uses N-list and subsume index of 1-patterns. N-list store information shorter than Node-list and subsume index help iNTK directly mining in case of patterns belonged to top-rank-k table contain other 1-patterns in their subsume set. This causes that iNTK consume less memory and runtime. Extensive experiments show that iNTK outperforms NTK for various datasets.

نمونه چکیده ترجمه متن فارسی
چکیده

استخراج  الگوهای متناوب کاندیدهای بسیاری تولید میکند که نیاز به صرف مقدار زیادی از حافظه و زمان استخراج دارد. در کاربردهای واقعی، از تعداد کمی از الگوهای متناوب استفاده می شود. بنابراین، استخراج K الگوی برتر متناوب که تعداد الگوهای متناوب استخراج شده را با رتبه بندی آنها برحسب تناوب محدود میکند، مورد توجه قرار گرفته است. این مقاله الگوریتم iNTK را پیشنهاد می کند که یک نسخه بهبود یافته از الگوریتم NTK برای استخراج K الگوی برتر متناوب است. این الگوریتم از یک ساختار N-لیست برای نشان دادن الگوها استفاده میکند. این مفهوم استنتاجی برای سرعت بخشیدن به روند استخراج K الگوی برتر مورد استفاده قرار میگیرد. آزمایش هایی برای ارزیابی iNTK و NTK برحسب زمان استخراج  و مصرف حافظه برای هشت مجموعه داده انجام گرفته است. نتایج تجربی نشان می دهد که iNTK کارآمد تر و سریعتر از NTK است.

1. معرفی

سیستم خبره یک سیستم هوشمند است که مسائل پیچیده مبتنی بر دانش  را از طریق روشهای استنتاج حل میکند. به طور کلی، سه مولفه در یک سیستم خبره وجود دارد از جمله پایگاه دانش، موتور استنتاج و رابط کاربری (Jackson ،1999). مرکز سیستم های خبره پایگاه دانش است، چراکه حاوی دانش حل مساله یک کاربرد خاص می باشد (Ahmed ، 2008). بنابراین، کاهش این فضای دانش نقش بزرگی در عملکرد اجرایی سیستم های خبره ایفا می کند. قوانین وابستگی دانش (Daniel و Viorel، 2004؛ Guil، Bosch ، Tunez ، و Marín ، 2003) که نشان دهنده روابط بین اقلام در یک مجموعه داده اند ، مهم هستند. برای ایجاد قوانین وابستگی، رویکردهای سنتی ابتدا الگوهای متناوب شامل مجموعه آیتم ها، زیردنباله ها و زیر ساختها را استخراج  میکنند که در تراکنش های بزرگ و یا مجموعه داده های رابطه ای با تناوب کمتر از یک آستانه داده شده ظاهر می شوند. پس از آن، این سیستم از این الگوهای متناوب و حداقل اطمینان برای یافتن تمام قوانین استفاده میکند. دو عبارت بالا به مقدار زیادی حافظه و زمان استخراج  نیاز دارد. بنابراین، کاهش زمان استخراج الگوهای متناوب به منظور بهبود سیستم های خبره بسیار مفید است.

6. نتیجه گیری و کارهای آینده

در این مقاله یک الگوریتم بهبودیافته کارآمد به نام iNTK برای استخراج  K الگوی برتر متناوب ارائه شد. مزیت iNTK در استفاده از N-لیست و شاخص استنتاج 1-الگوها نهفته است. N-لیست نسبت به لیست-گره اطلاعات کمتری ذخیره کرده و شاخص استنتاج به طور مستقیم به iNTK در استخراج  الگوهای متعلق به جدول K رتبه برتر حاوی 1-الگوها در مجموعه استنتاج کمک میکند. این باعث می شود که iNTK مصرف حافظه و زمان اجرای کمتری داشته باشد. آزمایش های گسترده نشان می دهد که iNTK از NTK برای مجموعه داده های مختلف بهتر عمل میکند.


بدون دیدگاه