چکیده
محوریت بنیادین تکامل بشریت، همواره جستجوی روش های تغییر طبیعت در راستای پاسخگویی به نیازهایمان بوده است. نقطۀ عطف اساسی در این زمینه، اختراع ماشینی تحت عنوان کامپیوتر است که قادر است وظیفه ای که به آن محول شده را در کسری از زمان به طول انجامیده توسط یک انسان معمولی، به انجام برساند. در عین حال که جالب به نظر می رسد، اما تنها ایراده وارده به این مسئله این است که تصمیم گیری، باید توسط انسانی صورت گیرد که در قیدوبند کالبد انسانی اش گرفتار است. تلاش های صورت گرفته در راستای بهره برداری کامل از منافع، منجر به بروز پدیده ای گشته است که هوش مصنوعی نامیده می شود. یادگیری ماشین بخشی از AI (هوش مصنوعی) به شمار می رود که از طریق نمونه های مرتبط متعدد به انتقال دانش به کامپیوتر می پردازد. در طی این سال ها، الگوریتم های یادگیری ماشین متنوعی همراه با مزایا و معایبشان توسعه داده شده اند. این مقاله، تلاش همه جانبه ای به منظور گرد آوری الگوریتم های ML مختلفی همچون رگرسیون خطی، KNN(k-نزدیک ترین همسایگی) و مواردی از این قبیل می باشد. این مقاله، جدید ترین توسعه ها در این حوزۀ مطالعاتی را به چالش می کشد و درصدد تعریف بهترین کاربرد ها برای هریک از آنها مبتنی بر پژوهشات قبلی می باشد.
II. پیشینه
پیش از این، انواع الگوریتم یادگیری ماشین را مطرح نمودیم.[1]
1. یادگیری نظارت شده: این مدل وظیفه محور است و اهداف به خوبی تعریف شده اند. متغیر هدف موجود می باشد.
2. یادگیری نظارت نشده: این مدل داده محور است و نتیجه صرفاً مبتنی بر ورودی است. متغیر هدف یا متغیر وابسته موجود یا شناخته شده نمی باشد.
3. یادگیری تقویتی: مبتنی بر روش ابتکاری است، رویکرد برنامه نویسی پویا، از اشتباهات یاد می گیرد (بنابر رعایت قواعد بازی). وضعیت اولیه و وضعیت هدف تعریف شده اند.
4. یادگیری عمیق DL : (DL) مبتنی بر اصل ANN(شبکه های عصبی مصنوعی) و الهام گرفته از مفهوم بیولوژی سیستم عصبی می باشد. مدلهای DL کارآمد هستند و عمدتاً به منظور دسته بندی و پیش بینی مورد استفاده قرار می گیرند.
الف. انواع یادگیری نظارت شده
آ. رگرسیون: مبتنی بر متغیر هدف پیوسته است، روش های به کار رفته برای وظیفۀ دسته بندی عبارتند از: رگرسیون خطی، رگرسیون درخت تصمیم، جنگل تصادفی، مدل KNN، ماشین های بردار پشتیبان.
ب. دسته بندی: مبتنی بر متغیر هدف دسته بندی شده است. روشهای مورد استفاده در وظیفۀ دستهبندی عبارتند از: رگرسیون لجستیک، نایو بیز(بیز ساده)، گرادیان کاهشی تصادفی، KNN(K-نزدیکترین همسایگی)، SVM، درخت تصمیم، جنگل تصادفی.