تلفن: ۰۴۱۴۲۲۷۳۷۸۱
تلفن: ۰۹۲۱۶۴۲۶۳۸۴

دانلود ترجمه مقاله یادگیری تقویتی با راهنمایی هماهنگی – مجله ACM

عنوان فارسی: یادگیری تقویتی با راهنمایی هماهنگی
عنوان انگلیسی: Coordination Guided Reinforcement Learning
تعداد صفحات مقاله انگلیسی : 8 تعداد صفحات ترجمه فارسی : 23
سال انتشار : 2012 نشریه : ACM
فرمت مقاله انگلیسی : PDF فرمت ترجمه مقاله : ورد تایپ شده
کد محصول : 3234 رفرنس : دارد
محتوای فایل : zip حجم فایل : 879.83Kb
رشته های مرتبط با این مقاله: مهندسی کامپیوتر
گرایش های مرتبط با این مقاله: مهندسی نرم افزار، هوش مصنوعی و رباتیک
مجله: کنفرانس بین المللی عاملهای خودکار و سامانه چندعامله
دانشگاه: گروه علوم کامپیوتر دانشگاه ملی سنگاپور
کلمات کلیدی: یادگیری تقویتی، هدایت و راهنمایی اکتشاف، محدودیت های هماهنگی، فرایند تصمیم گیری عاملی مارکو
وضعیت ترجمه عناوین تصاویر و جداول: ترجمه نشده است
وضعیت ترجمه متون داخل تصاویر و جداول: ترجمه نشده است
وضعیت فرمولها و محاسبات در فایل ترجمه: به صورت عکس، درج شده است
ترجمه این مقاله با کیفیت عالی آماده خرید اینترنتی میباشد. بلافاصله پس از خرید، دکمه دانلود ظاهر خواهد شد. ترجمه به ایمیل شما نیز ارسال خواهد گردید.
فهرست مطالب

چکیده

۱ مقدمه

۲ سیستم RL دو سطحی

۱ ۲ معادلات یادگیری و به روزدرآوری ها

۲ ۲ انتخاب عمل

۳ ۲ ویژگیها و محدودیت ها

۴ ۲ کارایی یادگیری سطح بالا

۳ نتایج تجربی

۱ ۳ حوزه فوتبال ساده شده

۱ ۱ ۳ تنها روشهای درست

۲ ۱ ۳ با تقریب تابع

۲ ۳ حوزه RTS تاکتیکی

۱ ۲ ۳ ویژگیها و نادرستی یابی دقتی و رابطه ای

۴ بحث و کار وابسته

۵ نتیجه گیری

نمونه متن انگلیسی

ABSTRACT

In this paper, we propose to guide reinforcement learning (RL) with expert coordination knowledge for multi-agent problems managed by a central controller. The aim is to learn to use expert coordination knowledge to restrict the joint action space and to direct exploration towards more promising states, thereby improving the overall learning rate. We model such coordination knowledge as constraints and propose a two-level RL system that utilizes these constraints for online applications. Our declarative approach towards specifying coordination in multi-agent learning allows knowledge sharing between constraints and features (basis functions) for function approximation. Results on a soccer game and a tactical real-time strategy game show that coordination constraints improve the learning rate compared to using only unary constraints. The two-level RL system also outperforms existing single-level approach that utilizes joint action selection via coordination graphs.

نمونه متن ترجمه

چکیده

دراین مقاله، راهنمایی یادگیری تقویتی (RL) با دانش هماهنگی تخصصی برای مسائل چند عاملی مدیریت شده توسط کنترلریا کنترل کننده مرکزی را پیشنهاد می کنیم. هدف یادگیری نحوه استفاده از دانش هماهنگی تخصصی یا خبره به منظور محدود نمودن فضای عمل و اقدام مشترک و هدایت روند اکتشاف به سمت حالات امیدوارکننده تر و بدین طریق بهبود نرخ یادگیری کلی می باشد. در اینجا چنین دانش هماهنگی را به شکل محدودیت ها مدلسازی نموده و سیستم RL دو سطحی را پیشنهاد می کنیم که از این محدودیت ها برای برنامه های کاربردی آنلاین استفاده می کند. شیوه اخباری ما در مورد تعیین هماهنگی در یادگیری چند عاملی امکان به اشتراک گذاری دانش بین محدودیت ها و ویژگیها (توابع پایه) برای تقریب تابع را فراهم می آورد. نتایج مربوط به بازی فوتبال و بازی استراتژی تاکتیکی نشان می دهد که محدودیت های هماهنگی در مقایسه با محدودیت های یگانی یا واحد، نرخ یادگیری را بهبود می بخشند. سیستم RL دو سطحی، همچنین برتر از شیوه تک سطحی موجود عمل می کند که از انتخاب عمل مشترک از طریق نمودارها و گراف های هماهنگی استفاده می کند.

نحوه خرید نسخه پاورپوینت این مقاله