دانلود ترجمه مقاله یادگیری تقویتی با راهنمایی هماهنگی - مجله ACM

دانلود ترجمه مقاله یادگیری تقویتی با راهنمایی هماهنگی - مجله ACM
قیمت خرید این محصول
۱۹,۰۰۰ تومان
دانلود رایگان نمونه دانلود مقاله انگلیسی
عنوان فارسی
یادگیری تقویتی با راهنمایی هماهنگی
عنوان انگلیسی
Coordination Guided Reinforcement Learning
صفحات مقاله فارسی
23
صفحات مقاله انگلیسی
8
سال انتشار
2012
نشریه
ACM
فرمت مقاله انگلیسی
PDF
فرمت ترجمه مقاله
ورد تایپ شده
رفرنس
دارد
کد محصول
3234
وضعیت ترجمه عناوین تصاویر و جداول
ترجمه نشده است
وضعیت ترجمه متون داخل تصاویر و جداول
ترجمه نشده است
وضعیت فرمولها و محاسبات در فایل ترجمه
به صورت عکس، درج شده است
رشته های مرتبط با این مقاله
مهندسی کامپیوتر
گرایش های مرتبط با این مقاله
مهندسی نرم افزار، هوش مصنوعی و رباتیک
مجله
کنفرانس بین المللی عاملهای خودکار و سامانه چندعامله
دانشگاه
گروه علوم کامپیوتر دانشگاه ملی سنگاپور
کلمات کلیدی
یادگیری تقویتی، هدایت و راهنمایی اکتشاف، محدودیت های هماهنگی، فرایند تصمیم گیری عاملی مارکو
فهرست مطالب
چکیده
۱ مقدمه
۲ سیستم RL دو سطحی
۱ ۲ معادلات یادگیری و به روزدرآوری ها
۲ ۲ انتخاب عمل
۳ ۲ ویژگیها و محدودیت ها
۴ ۲ کارایی یادگیری سطح بالا
۳ نتایج تجربی
۱ ۳ حوزه فوتبال ساده شده
۱ ۱ ۳ تنها روشهای درست
۲ ۱ ۳ با تقریب تابع
۲ ۳ حوزه RTS تاکتیکی
۱ ۲ ۳ ویژگیها و نادرستی یابی دقتی و رابطه ای
۴ بحث و کار وابسته
۵ نتیجه گیری
نحوه خرید نسخه پاورپوینت این مقاله
نمونه چکیده متن اصلی انگلیسی
ABSTRACT

In this paper, we propose to guide reinforcement learning (RL) with expert coordination knowledge for multi-agent problems managed by a central controller. The aim is to learn to use expert coordination knowledge to restrict the joint action space and to direct exploration towards more promising states, thereby improving the overall learning rate. We model such coordination knowledge as constraints and propose a two-level RL system that utilizes these constraints for online applications. Our declarative approach towards specifying coordination in multi-agent learning allows knowledge sharing between constraints and features (basis functions) for function approximation. Results on a soccer game and a tactical real-time strategy game show that coordination constraints improve the learning rate compared to using only unary constraints. The two-level RL system also outperforms existing single-level approach that utilizes joint action selection via coordination graphs.

نمونه چکیده ترجمه متن فارسی
چکیده
دراین مقاله، راهنمایی یادگیری تقویتی (RL) با دانش هماهنگی تخصصی برای مسائل چند عاملی مدیریت شده توسط کنترلریا کنترل کننده مرکزی را پیشنهاد می کنیم. هدف یادگیری نحوه استفاده از دانش هماهنگی تخصصی یا خبره به منظور محدود نمودن فضای عمل و اقدام مشترک و هدایت روند اکتشاف به سمت حالات امیدوارکننده تر و بدین طریق بهبود نرخ یادگیری کلی می باشد. در اینجا چنین دانش هماهنگی را به شکل محدودیت ها مدلسازی نموده و سیستم RL دو سطحی را پیشنهاد می کنیم که از این محدودیت ها برای برنامه های کاربردی آنلاین استفاده می کند. شیوه اخباری ما در مورد تعیین هماهنگی در یادگیری چند عاملی امکان به اشتراک گذاری دانش بین محدودیت ها و ویژگیها (توابع پایه) برای تقریب تابع را فراهم می آورد. نتایج مربوط به بازی فوتبال و بازی استراتژی تاکتیکی نشان می دهد که محدودیت های هماهنگی در مقایسه با محدودیت های یگانی یا واحد، نرخ یادگیری را بهبود می بخشند. سیستم RL دو سطحی، همچنین برتر از شیوه تک سطحی موجود عمل می کند که از انتخاب عمل مشترک از طریق نمودارها و گراف های هماهنگی استفاده می کند.

بدون دیدگاه