تلفن: 04142273781

ترجمه مقاله استخراج مجموعه اقلام مکرر در یک جریان – نشریه الزویر

عنوان فارسی: استخراج مجموعه اقلام مکرر در یک جریان
عنوان انگلیسی: Mining frequent itemsets in a stream
تعداد صفحات مقاله انگلیسی : 23 تعداد صفحات ترجمه فارسی : 69
سال انتشار : 2014 نشریه : الزویر - Elsevier
فرمت مقاله انگلیسی : PDF فرمت ترجمه مقاله : ورد تایپ شده
کد محصول : 5614 رفرنس : دارد
محتوای فایل : zip حجم فایل : 2.43Mb
رشته های مرتبط با این مقاله: مهندسی کامپیوتر
گرایش های مرتبط با این مقاله: مهندسی الگوریتم ها و محاسبات و مهندسی نرم افزار
مجله: سیستم های اطلاعاتی - Information Systems
دانشگاه: دانشگاه فناوری آیندهوون، هلند
کلمات کلیدی: استخراج مجموعه اقلام مکرر، جریان داده‌ها، نظریه، الگوریتم، آزمایشات
وضعیت ترجمه عناوین تصاویر و جداول: ترجمه شده است
وضعیت ترجمه متون داخل تصاویر و جداول: ترجمه شده است
وضعیت فرمولها و محاسبات در فایل ترجمه: به صورت عکس، درج شده است
ترجمه این مقاله با کیفیت عالی آماده خرید اینترنتی میباشد. بلافاصله پس از خرید، دکمه دانلود ظاهر خواهد شد. ترجمه به ایمیل شما نیز ارسال خواهد گردید.
فهرست مطالب

چکیده

۱.پیشگفتار

۲.بازبینی حداکثر فرکانس

۲.۱. شمارش‌ها، فرکانس‌ها و ماکسیمم فرکانس

۳.۲. طول پنجره‌ی مینیمال

۲.۳. مساله‌ی کاوش (یا استخراج) مجموعه آیتم با ماکسیمم فرکانس

۳.استخراج یک مجموعه آیتم مفرد

۳.۱. پنجره‌های ماکسیمال، مرزها، و خلاصه‌ها

۳.۲. طول پنجره‌ی مینیمال

۳.۳. آستانه‌ی فرکانس مینیمال

۳.۴. طول پنجره‌ی مینیمال و آستانه‌ی فرکانس مینیمال

۴.استخراج همه‌ی آیتم‌ها

۴.۱. الگوریتم

۴.۲. پیچیدگی

۴.۳. بهینه‌سازی‌ها

۵.بهره‌وری مرز بزرگتر

۵.۱. تنها مرزهای آیتم

۵.۲. بستار مرز

۶ تجزیه و تحلیل بدترین حالت

۶.۱. جریان‌های فری

۶.۲. کران‌ها

۷ آزمایش‌ها

۷.۱.۱. Eclat افزایشی

۷.۲.۱ خلاصه‌های موقعیت

۷.۲.مجموعه داده‌ها

۷.۲.۱. جریان‌های داده‌ای ترکیبی (یا مصنوعی)

۷.۲.۲. جریان‌های داده‌ای جهان واقعی: هشدارها

۷.۳. بهره‌وری حافظه

7.3.1 نتیجه‌گیری

۷.۴. زمان‌بندی کنترل و رسیدگی سست

۷.۴.۱. جریان‌های پراکنده و پشت سر هم (یا متوالی)

۷.۴.۲. جریان‌های پشت سر هم

۷.۴.۳. جریان‌های کوتاه

۷.۴.۴. هشدارها

۷.۴.۵. نتیجه گیری

۷.۵. موقعیت‌های مرز

۸ خلاصه

نمونه متن انگلیسی

Abstract

Mining frequent itemsets in a datastream proves to be a difficult problem, as itemsets arrive in rapid succession and storing parts of the stream is typically impossible. Nonetheless, it has many useful applications; e.g., opinion and sentiment analysis from social networks. Current stream mining algorithms are based on approximations. In earlier work, mining frequent items in a stream under the max-frequency measure proved to be effective for items. In this paper, we extended our work from items to itemsets. Firstly, an optimized incremental algorithm for mining frequent itemsets in a stream is presented. The algorithm maintains a very compact summary of the stream for selected itemsets. Secondly, we show that further compacting the summary is nontrivial. Thirdly, we establish a connection between the size of a summary and results from number theory. Fourthly, we report results of extensive experimentation, both of synthetic and real-world datasets, showing the efficiency of the algorithm both in terms of time and space.

نمونه متن ترجمه

چکیده

ثابت می‌شود که استخراج مجموعه اقلام مکرر در یک جریان از داده‌ها مساله‌ای سخت باشد، زیرا مجموعه اقلام در یک توالی سریع وارد می‌شوند و ذخیره‌سازی بخش‌های جریان معمولا غیر ممکن است. با این وجود، آن ممکن است کاربردهای بسیار مفیدی داشته باشد، برای مثال، تجزیه و تحلیل نیات و عقاید شبکه‌های اجتماعی. الگوریتم‌های جاری استخراج جریان مبتنی بر تقریب‌ها هستند. در کار قبلی ثابت شد که استخراج آیتم‌های مکرر در یک جریان تحت اندازه‌گیری ماکسیمم فرکانس (یا تکرار)، برای اقلام، موثر است. در این مقاله، ما کار خود برای آیتم‌ها (یا اقلام) را به مجموعه‌های اقلام گسترش دادیم. در مرحله‌ی اول، یک الگوریتم افزایشی بهینه برای استخراج مجموعه اقلام مکرر در یک جریان ارائه می‌شود. این الگوریتم، یک خلاصه‌ی بسیار فشرده‌ای از جریان را برای مجموعه اقلام انتخاب شده حفظ می‌کند. در مرحله‌ی دوم، ما نشان می‌دهیم که فشرده‌سازی بیشتر خلاصه، مهم است. در مرحله‌ی شوم، ما یک ارتباطی بین اندازه‌ی یک خلاصه و نتایج از نظریه‌ی اعداد، برقرار می‌کینم. در مرحله‌ی چهارم، ما گزارشی از نتایج آزمایش‌های گسترده، برای هردو مجموعه داده‌های دنیای واقعی و مصنوعی، با نشان داده کارامدی الگوریتم در هر دو زمینه‌ی زمان و مکان ارائه می‌دهیم.