تلفن: ۰۴۱۴۲۲۷۳۷۸۱
تلفن: ۰۹۲۱۶۴۲۶۳۸۴

ترجمه مقاله شناسایی Spam در بین اطلاعات به دست آمده ایمیل

عنوان فارسی: شناسایی Spam در بین اطلاعات به دست آمده ایمیل- آنالیز عملکرد نسبی
عنوان انگلیسی: Spam Mail Detection through Data Mining – A Comparative Performance Analysis
تعداد صفحات مقاله انگلیسی : 9 تعداد صفحات ترجمه فارسی : 22
سال انتشار : 2013 نشریه : Ijmecs
فرمت مقاله انگلیسی : PDF فرمت ترجمه مقاله : ورد تایپ شده
کد محصول : 5144 رفرنس : دارد
محتوای فایل : zip حجم فایل : 607.73Kb
رشته های مرتبط با این مقاله: مهندسی کامپیوتر و مهندسی فناوری اطلاعات IT
گرایش های مرتبط با این مقاله: اینترنت و شبکه های گسترده و مهندسی الگوریتم ها و محاسبات
مجله: مجله بین المللی آموزش مدرن و علوم کامپیوتر
دانشگاه: گروه علوم کامپیوتر دانشگاه Banasthali، هند
کلمات کلیدی: طبقه بندی کننده، انتخاب ویژگی ها، ایمیل، میل های Spam
وضعیت ترجمه عناوین تصاویر و جداول: ترجمه شده است
وضعیت ترجمه متون داخل تصاویر و جداول: ترجمه شده است
ترجمه این مقاله با کیفیت عالی آماده خرید اینترنتی میباشد. بلافاصله پس از خرید، دکمه دانلود ظاهر خواهد شد. ترجمه به ایمیل شما نیز ارسال خواهد گردید.
فهرست مطالب

چکیده

مقدمه

سابقه مطالعات

الگوریتم مورد استفاده در این مقاله

Naïve Bayes

تعیین درخت

ویژگی های انتخاب

طبقه بندی و پیشگویی

کار های انجام شده

ساختار پیشنهادی

آنالیز و تحلیل

آزمایش اول

آزمایش دوم

نتیجه گیری

نمونه متن انگلیسی

Abstract — As web is expanding day by day and people generally rely on web for communication so e-mails are the fastest way to send information from one place to another. Now a day’s all the transactions all the communication whether general or of business taking place through e-mails. E-mail is an effective tool for communication as it saves a lot of time and cost. But emails are also affected by attacks which include Spam Mails. Spam is the use of electronic messaging systems to send bulk data. Spam is flooding the Internet with many copies of the same message, in an attempt to force the message on people who would not otherwise choose to receive it. In this study, we analyze various data mining approach to spam dataset in order to find out the best classifier for email classification. In this paper we analyze the performance of various classifiers with feature selection algorithm and without feature selection algorithm. Initially we experiment with the entire dataset without selecting the features and apply classifiers one by one and check the results. Then we apply Best-First feature selection algorithm in order to select the desired features and then apply various classifiers for classification. In this study it has been found that results are improved in terms of accuracy when we embed feature selection process in the experiment. Finally we found Random Tree as best classifier for spam mail classification with accuracy = 99.72%. Still none of the algorithm achieves 100% accuracy in classifying spam emails but Random Tree is very nearby to that.

نمونه متن ترجمه

چکیده: امروزه وب سایت ها در حال گسترش هستند و مردم برای برقرای ارتباط از این وب سایت ها استفاده

می کنند بنابراین ایمیل یکی از سریع ترین راه ها برای ارسال اطلاعات از یک مکان به مکان دیگر است. امروزه تمام ارتباطات، چه خصوصی چه تجاری همه توسط ایمیل صورت می گیرد. ایمیل یکی از راه های مناسب ارتباطی می-باشد و سبب صرفه جویی در وقت و هزینه می گردد. اما ایمیل ها با یک سری حمله ها و تهاجم که ان را Spam می نامند رو به رو هستند. Spam از سیستم پیام الکترونیکی استفاده می کند که حجم زیادی از حافظه را می گیرد. Spam همچنین خیلی در دنیای اینترنت رایج شده است و یکسری پیام ها را کپی می کند و افرادی را که دوست ندارند این ایمیل ها را ببینند آن ها را به زور وسوسه می کنند. در این مقاله ما به بررسی روش های استفاده و بهره-برداری از اطلاعات Spam به منظور اینکه بتوانیم بهترین دسته بندی را در ایمیل داشته باشیم، خواهیم پرداخت. در این مقاله ما به آنالیز عملکرد دسته بندی های مختلف با الگوریتم انتخاب مشخصه ها و بدون مشخصه ها خواهیم پرداخت. در ابتدا ما به بررسی و تنظیم اطلاعات بدون انتخاب این مشخصه ها خواهیم پرداخت و سپس این دسته-ها را یکی یکی امتحان خواهیم کرد. سپس اولین مشخصه خوب را به منظور انتخاب بهترین ویژگی و سپس دسته بندی مناسب برخواهیم گزید. در این تحقیق ثابت شده است که با فرآیند انتخاب ویژگی نتایج دارای بهبود قابل توجهی هستند. در آخر، ما یک درخت تصادفی برای پیدا کردن بهترین

طبقه بندی کننده برای Spam پیدا کنیم همچنین دقت این کار ۷۲/۹۹ درصد است. در حال حاضر هیچ کدان از الگوریتم ها به دقت ۱۰۰ درصد نرسیده اند اما این الگوریتم تقریبا به این مقدار نزدیک است.