دانلود ترجمه مقاله یادگیری تقویتی با راهنمایی هماهنگی – مجله ACM

عنوان فارسی: | یادگیری تقویتی با راهنمایی هماهنگی |
عنوان انگلیسی: | Coordination Guided Reinforcement Learning |
تعداد صفحات مقاله انگلیسی : 8 | تعداد صفحات ترجمه فارسی : 23 |
سال انتشار : 2012 | نشریه : ACM |
فرمت مقاله انگلیسی : PDF | فرمت ترجمه مقاله : ورد تایپ شده |
کد محصول : 3234 | رفرنس : دارد |
محتوای فایل : zip | حجم فایل : 879.83Kb |
رشته های مرتبط با این مقاله: مهندسی کامپیوتر |
گرایش های مرتبط با این مقاله: مهندسی نرم افزار، هوش مصنوعی و رباتیک |
مجله: کنفرانس بین المللی عاملهای خودکار و سامانه چندعامله |
دانشگاه: گروه علوم کامپیوتر دانشگاه ملی سنگاپور |
کلمات کلیدی: یادگیری تقویتی، هدایت و راهنمایی اکتشاف، محدودیت های هماهنگی، فرایند تصمیم گیری عاملی مارکو |
وضعیت ترجمه عناوین تصاویر و جداول: ترجمه نشده است |
وضعیت ترجمه متون داخل تصاویر و جداول: ترجمه نشده است |
وضعیت فرمولها و محاسبات در فایل ترجمه: به صورت عکس، درج شده است |
چکیده
۱ مقدمه
۲ سیستم RL دو سطحی
۱ ۲ معادلات یادگیری و به روزدرآوری ها
۲ ۲ انتخاب عمل
۳ ۲ ویژگیها و محدودیت ها
۴ ۲ کارایی یادگیری سطح بالا
۳ نتایج تجربی
۱ ۳ حوزه فوتبال ساده شده
۱ ۱ ۳ تنها روشهای درست
۲ ۱ ۳ با تقریب تابع
۲ ۳ حوزه RTS تاکتیکی
۱ ۲ ۳ ویژگیها و نادرستی یابی دقتی و رابطه ای
۴ بحث و کار وابسته
۵ نتیجه گیری
ABSTRACT
In this paper, we propose to guide reinforcement learning (RL) with expert coordination knowledge for multi-agent problems managed by a central controller. The aim is to learn to use expert coordination knowledge to restrict the joint action space and to direct exploration towards more promising states, thereby improving the overall learning rate. We model such coordination knowledge as constraints and propose a two-level RL system that utilizes these constraints for online applications. Our declarative approach towards specifying coordination in multi-agent learning allows knowledge sharing between constraints and features (basis functions) for function approximation. Results on a soccer game and a tactical real-time strategy game show that coordination constraints improve the learning rate compared to using only unary constraints. The two-level RL system also outperforms existing single-level approach that utilizes joint action selection via coordination graphs.
چکیده
دراین مقاله، راهنمایی یادگیری تقویتی (RL) با دانش هماهنگی تخصصی برای مسائل چند عاملی مدیریت شده توسط کنترلریا کنترل کننده مرکزی را پیشنهاد می کنیم. هدف یادگیری نحوه استفاده از دانش هماهنگی تخصصی یا خبره به منظور محدود نمودن فضای عمل و اقدام مشترک و هدایت روند اکتشاف به سمت حالات امیدوارکننده تر و بدین طریق بهبود نرخ یادگیری کلی می باشد. در اینجا چنین دانش هماهنگی را به شکل محدودیت ها مدلسازی نموده و سیستم RL دو سطحی را پیشنهاد می کنیم که از این محدودیت ها برای برنامه های کاربردی آنلاین استفاده می کند. شیوه اخباری ما در مورد تعیین هماهنگی در یادگیری چند عاملی امکان به اشتراک گذاری دانش بین محدودیت ها و ویژگیها (توابع پایه) برای تقریب تابع را فراهم می آورد. نتایج مربوط به بازی فوتبال و بازی استراتژی تاکتیکی نشان می دهد که محدودیت های هماهنگی در مقایسه با محدودیت های یگانی یا واحد، نرخ یادگیری را بهبود می بخشند. سیستم RL دو سطحی، همچنین برتر از شیوه تک سطحی موجود عمل می کند که از انتخاب عمل مشترک از طریق نمودارها و گراف های هماهنگی استفاده می کند.
اگر مایل به تهیه نسخه پاورپوینت مقاله یادگیری تقویتی با راهنمایی هماهنگی هستید اینجا کلیک نمایید. همچنین برای خرید مقاله ورد از دکمه های زیر استفاده نمایید.