چکیده
یادگیری عمیق از دید عموم به عنوان محصولات و ابزارهای پیش گویانه و تحلیلی به شکل سیستمهای انسان محور هوشمند جهانی شامل تبلیغات هدفمند، ابزارهای کمکی زبان طبیعی و مترجمان شفاهی، سیستمهای وسایل نقلیه خودران و غیره گسترش یافتهاند. البته، مکانیزم های اصلی که موجب ایجاد این محصولات هوشمند انسان محور میشوند، به شکل مبهم باقی ماندهاند. از طرف دیگر، محققان در حوزههای مختلف از یادگیری عمیق در تحقیقات خود به منظور حل مسائلی که پیشتر قابل بررسی نبودند، بهره بردهاند. ما در این مقاله در پی بررسی کامل یادگیری عمیق در برنامهها و مکانیزم های آن هستیم. به ویژه، با بررسی مجموعه دسته بندی شده از آخرین پیشرفتهای علمی در تحقیقات یادگیری عمیق، ما در پی ارائه یک مرجع بزرگ برای افرادی که در ابتدای مسیر آشنایی با یادگیری عمیق و کاربردها، پلتفرمها، الگوریتمها و استفادههای مختلف از آن در انواع سیستمهای هوشمند جهانی هستند، خواهیم بود. علاوه براین، ما در پی بررسی پیشرفتهای مهم اخیر در زمینه تکنولوژی و ایجاد نگرش مناسب نسبت به این حوزهها و بیان تأثیر یادگیری عمیق در بهبود ارزیابیها بوده و از سویی به حوزههای تحقیقاتی جدید که میتوانند از یادگیری عمیق بهره برده اما همچنان از این رویکرد استفاده نکردهاند، اشاره میکنیم. ما امیدواریم که این بررسی تبدیل به مرجعی ارزشمند برای کارشناسان و فعالان حوزه یادگیری عمیق و همچنین افرادی شود که در پی ایجاد نوآوری در زمینه یادگیری عمیق هستند.
مروری بر یادگیری عمیق
یادگیری ماشین شامل طیف وسیعی از فرآیندهای پیادهسازی الگوریتمی است که همگی آنها تحت عنوان یادگیری عمیق قابل دستهبندی نیستند. بهطور مثال، هرچند که الگوریتمهای منفرد شامل مکانیزههای آماری ازجمله الگوریتمهای بیزی، تقریب توابع مانند رگرسیون خطی و لجستیک یا درختهای تصمیم از قدرت و کارایی بالایی برخوردار هستند، اما توانایی آنها محدود به یادگیری نمایشهای دادهای پیچیده است. یادگیری عمیق نسبت به نظریههای شناختی و اطلاعاتی توسعهیافته است و در پی تقلید از فرآیند یادگیری رشتههای عصبی انسان و ایجاد ساختارهای عصبی پیچیده متصلبههم است. بهعنوان یکی از مفاهیم کلیدی رایانش رشتههای عصبی و مدل عصبی، توانایی اعمال یکرشته عصبی کلی برای هر نوع داده و یادگیری بهصورت کلی، بهعنوان یک مفهوم مهم و قابلتوجه محسوب میشود. اساساً هیچ ساختار واحدی برای هر فرایند اجرایی وجود ندارد، اما از سویی یک مدل کلی برای کلیه برنامهها وجود دارد.
آنچه در فرآیند یادگیری ماشین بهصورت ذاتی وجود دارد، مفاهیم آموزش (بهبود مستمر در یادگیری) و استنباط (استخراج خروجی یک مدل آموزشدیده از برخی از ورودیهای اجرایی) است. در آموزش یک مدل، حجمی از دادهها به مجموعههای آموزشی و آزمایشی و یا مجموعه صحت سنجی تقسیم میشود. در الگوریتم یادگیری ماشین، دادههای آموزشی جهت یادگیری نمایش دادهها قرار دارند که بهصورت تقریب تابع از توزیع شاخصها یا مجموعهای از تصمیمات بر اساس کارکردهای هر شاخص ارائه میشوند. میتوان از مجموعه صحت سنجی در طی آموزش بهعنوان یک روش جهت صحت سنجی اثرپذیری فرایند آموزش بهره برد که نتیجه آن برای تنظیم پارامترهای یادگیری الگوریتم و بهبود دقت نهایی به کار میرود. مجموعه آزمایشی موجب ارائه مجموعه مشاهده نشدهای از دادهها جهت تعیین دقت نهایی مدل آموزشی میشود و بهعنوان منشأ شاخصهای دقت گزارششده و دیگر معیارهای اثرپذیری محسوب میشود. میتوان اصطلاح استنتاج را بهصورت فرآیند اعمال یک آیتم دادهای به یک مدل یادگیری ماشین آموزشدیده شده و پیادهسازی شده و ارائه یک خروجی استنتاجی در نظر گرفت.
با پیشرفت فنّاوریهای رایانشی، پیادهسازی مجموعههای بزرگی از رشتههای عصبی امکانپذیر شده و به شکل شبکههای عصبی تعمیمیافته است. درواقع هرچند که شبکههای عصبی بهصورت گسترده مورداستفاده قرارگرفتهاند، اما آنها بهعنوان یک فنّاوری قدیمی محسوب میشوند که به دلیل پیچیدگی و نقایص محاسباتی منسوخشدهاند. بااینحال، این موضوع به دلیل عدم برتری شبکههای عصبی نسبت به روشهای دیگر تغییریافته است. بهطور مثال میتوان به برتری رقابت شناختشی ImageNet اشاره کرد که طی آن شبکههای عصبی فراتر از دقت انسان عمل کرده و یا انسانها را در بازی Go بدون دستیابی به ورودی مستقیم یا جلسات بازی نسبت به بازیکنان دیگر مغلوب کردند.