ترجمه مقاله کافی بودن داده های کم برای تشخیص داده های پرت بر اساس فاصله - نشریه الزویر

ترجمه مقاله کافی بودن داده های کم برای تشخیص داده های پرت بر اساس فاصله - نشریه الزویر
قیمت خرید این محصول
۶۶,۰۰۰ تومان
دانلود مقاله انگلیسی
عنوان فارسی
کافی بودن داده های کم برای تشخیص داده های پرت بر اساس فاصله
عنوان انگلیسی
Little data is often enough for distance-based outlier detection
صفحات مقاله فارسی
16
صفحات مقاله انگلیسی
9
سال انتشار
2022
رفرنس
دارای رفرنس در داخل متن و انتهای مقاله
نشریه
الزویر - Elsevier
فرمت مقاله انگلیسی
pdf و ورد تایپ شده با قابلیت ویرایش
فرمت ترجمه مقاله
pdf و ورد تایپ شده با قابلیت ویرایش
فونت ترجمه مقاله
بی نازنین
سایز ترجمه مقاله
14
نوع نگارش
مقالات پژوهشی (تحقیقاتی)
نوع ارائه مقاله
ژورنال
پایگاه
اسکوپوس
ایمپکت فاکتور(IF) مجله
2.267 در سال 2021
شاخص H_index مجله
92 در سال 2022
شاخص SJR مجله
0.569 در سال 2021
شناسه ISSN مجله
1877-0509
کد محصول
13491
وضعیت ترجمه عناوین تصاویر و جداول
ترجمه شده است ✓
وضعیت ترجمه متون داخل تصاویر و جداول
ترجمه شده است ✓
وضعیت ترجمه منابع داخل متن
به صورت عدد درج شده است ✓
وضعیت فرمولها و محاسبات در فایل ترجمه
ندارد ☓
ضمیمه
ندارد ☓
بیس
نیست ☓
مدل مفهومی
ندارد ☓
پرسشنامه
ندارد ☓
متغیر
ندارد ☓
فرضیه
ندارد ☓
رفرنس در ترجمه
در انتهای مقاله درج شده است
رشته و گرایش های مرتبط با این مقاله
مهندسی کامپیوتر - مهندسی نرم افزار - علوم داده - مهندسی الگوریتم ها و محاسبات
مجله
Procedia Computer Science
کلمات کلیدی
تشخیص داده های پرت - تشخیص ناهنجاری - خوشه بندی - نمونه های اولیه - نظارت نشده - نزدیکترین همسایگی ها - عامل داده های پرت محلی - knn - lof - k-means
کلمات کلیدی انگلیسی
outlier detection - anomaly detection - clustering - prototypes - unsupervised - nearest neighbors - local outlier factor- knn - lof - k-means
doi یا شناسه دیجیتال
https://doi.org/10.1016/j.procs.2022.01.297
فهرست مطالب
چکیده
1. مقدمه
2. روش شناسی
3. نتایج
4. نتیجه گیری
منابع
تصاویر فایل ورد ترجمه مقاله (جهت بزرگنمایی روی عکس کلیک نمایید)
       
فایل پاورپوینت این مقاله
در کنار ترجمه مقاله، فایل پاورپوینت این مقاله نیز ایجاد شده و در این محصول قرار داده شده است که پس از خریداری به همراه ترجمه قابل دانلود خواهد بود. تعداد اسلایدهای این پاورپوینت 17 می باشد و آماده ارائه در دانشگاه یا سایر سمینارها است.
فایل خلاصه ترجمه
در صورتی که نیاز به خلاصه ای از متن ترجمه این مقاله دارید، می توانید از فایل خلاصه ترجمه استفاده نمایید که به این محصول اضافه شده است. خلاصه ترجمه این مقاله در 7 صفحه در فایل word انجام شده و داخل بسته قرار گرفته است.
نمونه چکیده ترجمه متن فارسی
چکیده
تعداد زیادی از مطالعات موردی از آموزش سریع و دفعات پیش بینی سود می برند، و بیشتر تحقیقات به بررسی تسریع روش های تشخیص داده های پرت مبتنی بر فاصله برای میلیون ها نقطه داده می پردازند. یافته های ما برخلاف عقیده عموم نشان می دهند که داده های اندک اغلب برای مدلهای تشخیص داده های پرت مبتنی بر فاصله کافی هستند. ما نشان می دهیم که از بخش کوچکی از داده ها برای آموزش مدلهای تشخیص داده های پرت مبتنی بر فاصله استفاده می شود که اغلب منجر به کاهش غیرمعنی داری در عملکرد پیش بینانه و واریانس تشخیص در محدوده گسترده ای از مجموعه داده های جدولی می شود. علاوه بر این، ما کاهش داده را براساس زیرنمونه گیری تصادفی و نمونه های اولیه مبتنی بر خوشه بندی مقایسه می کنیم و نشان می دهیم که هر دو رویکرد منجر به نتایج تشخیص داده های پرت مشابهی می شوند. بنابراین، زیرنمونه گیری تصادفی ساده ثابت می کند که یک معیار مفید و مبنایی برای تحقیقات آینده در تسریع تشخیص داده های پرت مبتنی بر فاصله است.
2. روش شناسی
هدف ما بررسی نحوه تاثیرگذاری الگوریتم های تشخیص داده های پرت مبتنی بر فاصله بر کاهش داده های آموزشی یا از طریق زیرنمونه گیری تصادفی یا از طریق نمونه های اولیه مبتنی بر خوشه بندی است. به ویژه، بررسی ما با سه سوال تحقیقاتی (RQ) زیر مرتبط می شود.
RQ1: چگونه زیرنمونه گیری داده های تصادفی بر عملکرد تشخیص داده های پرت مبتنی بر فاصله تاثیر می گذارند؟
RQ2: چگونه زیرنمونه گیری داده های مبتنی بر نمونه اولیه بر عملکرد تشخیص داده های پرت مبتنی بر فاصله تاثیر می گذارند؟
RQ3: آیا زیرنمونه گیری مبتنی بر نمونه اولیه منجر به نتایج تشخیص داده های پرت بهتر نسبت به زیرنمونه گیری تصادفی می شود؟
ما در بخش های زیر مجموعه داده های مختلف مورد استفاده برای ارزیابی (2.1)، زیرنمونه گیری تصادفی خودمان و روش شناسی نمونه اولیه (2.2)، الگوریتم های مورد استفاده در تحقیق خودمان (2.3)، و روش ارزیابی مورد استفاده برای پاسخ به سوالات تحقیقاتی مطرح شده را توصیف می کنیم (2.4).

2.1. مجموعه داده ها
مجموعه داده های مورد استفاده در تحقیق ما اغلب از بررسی کامپوس و همکاران در ارزیابی تشخیص داده های پرت بدون نظارت نشات می گیرند و شامل محدوده ای از مجموعه داده های جدولی هستند. این مجموعه ها قبلا در ادبیات تحقیق آشکار شدند یا در اصل با هدف طبقه بندی آشکار شدند، که یک یا چند کلاس تفسیر مفهومی به صورت داده های پرت دارند. تمام مجموعه داده های معنی دار مفهومی به شکاف های داده های پرت مختلف نمونه گذاری می شوند. شکافهای نمونه گیری داده های پرت {0.02,0.05,0.1,0.2} هستند. برای کاهش اثر تصادفی سازی هنگام کاهش میزان نمونه ها، این روش ده مرتبه برای هر مجموعه داده تکرار می شود که منجر به 10 متغیر مختلف برای این مجموعه داده ها می شود. چهار مجموعه داده ارائه شده در [8] شامل کمتر از 200 نمونه هستند که ما آن را از ارزیابی خودمان حذف می کنیم.


بدون دیدگاه