چکیده
اقتصاد دیجیتال پرسرعت ما که به واسطه ی رقابت جهانی شکل گرفته مستلزم افزایش تصمیم گیری داده محور براساس هوش مصنوعی (AI) و یادگیری ماشین (ML) می باشد. مزایای یادگیری ژرف (DL) بسیار زیاد و فراوان می باشند، اما با محدودیت هایی نیز همراه است که تا کنون با پذیرش و اتخاذ گسترده ی صنعت تداخل داشته اند. این مقاله به توضیح این مسئله می پردازد که چرا یادگیری ژرف (DL) – علی رغم شهرت و آوازه اش – در سرعت بخشیدن به پذیرش و اتخاذش در واکاوش کسب و کار با دشواری هایی مواجه است. نشان داده شده است که پذیرش یادگیری ژرف نه تنها تحت تأثیر پیچیدگی محاسباتی قرار می گیرد، درحالیکه فاقد معماری کلان داده، فاقد شفافیت (جعبه سیاه)، کمبود مهارت، و تعهد رهبری می باشد، بلکه تحت تأثیر این واقعیت نیز قرار می گیرد که DL در مورد مجموعه داده های ساختاریافته با بردارهای ویژگی با طول ثابت بهتر از مدل های ML (یادگیری ماشین) عمل نمی کند. یادگیری ژرف را باید به صورت یک گزینه ی اضافی قدرتمند برای پیکره ی موجود مدل های ML به جای یک راه حل همه کاره و مناسب درنظر گرفت. نتایج به شدت نشان می دهند که تقویت گرادیان (گرادیان بوستینگ) را می توان به صورت مدل برو به برای پیش بینی هایی در مورد مجموعه داده های ساختاریافته در واکاوش کسب و کار دید. علاوه بر مطالعه ی تجربی براساس سه مورد و نمونه ی کاربردی صنعت، این مقاله بحثی جامع از آن نتایج، کاربردهای عملی، و دستورکاری برای تحقیقات آتی را ارائه می کند.
2- مواد و روش ها
2-1 یادگیری ماشین
این بخش از مقاله مروری بر واکاوش پیش نگر و مدل های ML استفاده شده در آزمایش را ارائه می کند. مدل های ML استفاده و مقایسه شده در این آزمایش رگرسیون لجستیک (LR)، جنگل تصادفی (FR)، ماشین تقویت گرادیان (GBM)، و یادگیری ژرف (DL) می باشند. برای رسیدگی جامع به نظریه ی اساسی و بحث درمورد آن، به تحقیقات (هستی، تبشیرانی، و فرایدمن، 2017) و (مورفی، 2012) برای ML و (گودفلو و همکاران، 2016) برای DL اشاره شده است.
2-1-1 رگرسیون لجستیک
رگرسیون لجستیک (LR) به خانواده ی بزرگی از مدل های خطی تعمیم یافته (GLMs) تعلق دارد. GLMs اینگونه مشخص می شوند که به صورت ورودی، ترکیبی خطی از ویژگی ها و ربط دادن آن ها به خروجی با کمک تابعی که در آن خروجی از یک تابع توزیع نمایی اساسی مثل توزیع نرمال یا توزیع دو جمله ای برخوردار است (مورفی، 2012). رگرسیون لجستیک (LR) روش استانداردی برای طبقه بندی دودویی (باینری) می باشد و به شکل گسترده ای در دانشگاه و صنعت مورد استفاده قرار می گیرد. ترکیبی خطی از ورودی ها و وزن ها محاسبه می شود و از طریق وارد کردن wTx به تابع سیگموئید یا تابع منطقی اعمال می شود که از طریق فرمول (1) نشان داده می شود