عنوان : ( کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط )
نویسندگان: فرزانه تاتاری , محمدباقر نقیبی سیستانی ,چکیده
این مقاله به معرفی بازی های گرافی دیفرانسیلی برای سیستم های چند عاملی غیر خطی زمان پیوسته می پردازد و یک روش بهینه توزیع شده برخط برای حل آنها پیشنهاد می کند. در بازی های گرافی دیفرانسیلی، دینامیک خطا و اندیس عملکرد هر بازیکن تنها بستگی به اطلاعات همسایگان محلی آن عامل دارد. الگوریتم تکرار سیاست توزیع شده پیشنهاد شده، حل تقریبی معادلات همیلتون-جاکوبی کوپل شده همکارانه متعلق به عامل های غیر خطی را به صورت برخط انجام می دهد. در این الگوریتم که بر مبنای یادگیری تقویتی طراحی شده، هر یک از بازیکنان از ساختار شبکه عصبی نقاد-کنترلر استفاده می کند و تنظیم وزن های شبکه های عصبی نقاد و کنترلر به صورت همزمان انجام می شود. در حالی که تمام شبکه های عصبی نقاد-کنترلر در حال یادگیری هستند، پایداری حلقه بسته و همگرایی به قوانین کنترل بهینه تضمین می گردد. در انتها، نتایج به دست آمده از شبیه سازی، عملکرد و صحت الگوریتم پیشنهادی را نشان می دهد.
کلمات کلیدی
بازی های گرافی دیفرانسیلی غیرخطی؛ شبکه های عصبی؛ کنترل بهینه؛ یادگیری تقویتی@article{paperid:1054195,
author = {تاتاری, فرزانه and نقیبی سیستانی, محمدباقر},
title = {کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط},
journal = {کنترل},
year = {2015},
volume = {8},
number = {4},
month = {February},
issn = {2008-8345},
pages = {15--30},
numpages = {15},
keywords = {بازی های گرافی دیفرانسیلی غیرخطی؛ شبکه های عصبی؛ کنترل بهینه؛ یادگیری تقویتی},
}
%0 Journal Article
%T کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط
%A تاتاری, فرزانه
%A نقیبی سیستانی, محمدباقر
%J کنترل
%@ 2008-8345
%D 2015