1. پیشگفتار
2. زنجیرههای قابل کنترل مارکوف
3. فرمولبندی مساله
3.1. مفهوم تعادل استاکلبرگ-نش
3.2. کاربرد اصل لاگرانژ منظم
3.3. فرمت پروگزیمال
3.4. روش اکسترا-پروگزیمال
4. فرمت مارکوف برای روش اکسترا-پروگزیمال
4.1. توابع هزینه و نمادگذاری
4.2. روش منطمسازی تیخونوف
4.3. اصل لاگرانژ
4.4. روش اکسترا-پروگزیمال برای زنجیرههای مارکوف
4.5. حل کننده برنامهنویسی درجه دوم
5. تجزیه و تحلیل همگرایی
5.1. نتایج کمکی
5.2. قضیه همگرایی اصلی
6. مثال عددی
7. نتیجهگیری
نمونه چکیده متن اصلی انگلیسی
In this paper we present the extraproximal method for computing the Stackelberg/Nash equilibria in a class of ergodic controlled finite Markov chains games. We exemplify the original game formulation in terms of coupled nonlinear programming problems implementing the Lagrange principle. In addition, Tikhonov’s regularization method is employed to ensure the convergence of the cost-functions to a Stackelberg/Nash equilibrium point. Then, we transform the problem into a system of equations in the proximal format. We present a two-step iterated procedure for solving the extraproximal method: (a) the first step (the extra-proximal step) consists of a “prediction” which calculates the preliminary position approximation to the equilibrium point, and (b) the second step is designed to find a “basic adjustment” of the previous prediction. The procedure is called the “extraproximal method” because of the use of an extrapolation. Each equation in this system is an optimization problem for which the necessary and efficient condition for a minimum is solved using a quadratic programming method. This solution approach provides a drastically quicker rate of convergence to the equilibrium point. We present the analysis of the convergence as well the rate of convergence of the method, which is one of the main results of this paper. Additionally, the extraproximal method is developed in terms of Markov chains for Stackelberg games. Our goal is to analyze completely a three-player Stackelberg game consisting of a leader and two followers. We provide all the details needed to implement the extraproximal method in an efficient and numerically stable way. For instance, a numerical technique is presented for computing the first step parameter (λ) of the extraproximal method. The usefulness of the approach is successfully demonstrated by a numerical example related to a pricing oligopoly model for airlines companies.
نمونه چکیده ترجمه متن فارسی
در این مقاله، روش اکسترا-پروگزیمال را برای محاسبه تعادل استاکلبرگ/نش در کلاسی از بازیهای زنجیرهای کنترل شده ارگودیک متناهی مارکوف ارائه میدهیم. نمونهای از فرمولبندی اصلی بازی را در زمینه مسائل به هم پیوسته برنامهنویسی غیر خطی در پیادهسازی اصل لاگرانج فراهم میسازیم. علاوهبراین، از روش تنظیم تیخونوف برای حصول اطمینان از همگرایی توابع هزینه به یکی از نقاط تعادل استاکلبرگ/نش استفاده میکنیم. سپس مساله را به سیستمی از معادلات در فرمت پروگزیمال تبدیل میکنیم. روال تکرار دو-مرحلهای را برای حل روش پروگزیمال ارائه میدهیم: a) مرحله اول (گام اکسترا پروگزیمال) شامل «پیشبینی» است که تقریب موقعیت اولیه در نقطه تعادل را محاسبه میکند، و b) مرحله دوم به منظور یافتن «تنظیمی اساسی » از پیشبینی قبلی طراحی میشود. این روال به دلیل استفاده از برونیابی ، «روش اکسترا-پروگزیمال» نامیده میشود. هر معادله در این سیستم، مسالهای بهینهسازی است که شرط لازم و کارامد برای یافتن مینیمم برای آن با استفاده از روش برنامهنویسی درجه دوم حل میشود. این روش راهحل، نرخ همگرایی بسیار سریع به نقطه تعادل را فراهم میکند. همگرایی و همچنین نرخ همگرایی روش را به عنوان یکی از نتایج اصلی این مقاله تجزیه و تحلیل میکنیم. علاوهبراین، روش اکسترا-پروگزیمال در زمینه زنجیرههای مارکوف برای بازیهای استاکلبرگ توسعه مییابد. هدف ما تجزیه و تحلیل کامل بازی سه مرحلهای استاکلبرگ متشکل از یک رهبر و دو پیرو است. همه جزئیات مورد نیاز برای پیادهسازی روش اکسترا-پروگزیمال به شیوهای کارامد و از لحاظ عددی پایدار را فراهم میکنیم. به عنوان مثال، تکنیکی عددی را برای محاسبه پارامتر گام اول ( ) روش اکسترا-پروگزیمال ارائه میدهیم. سودمندی این رویکرد به گونهای موفقیتآمیز با استفاده از مثال عددی مربوط به مدل انحصار چند جانبه قیمتگذاری برای شرکتهای هواپیمایی نشان داده میشود.