کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط

کنترل, دوره (8), شماره (4), سال (2015-2) , صفحات (15-30)

عنوان : ( کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط )

نویسندگان: فرزانه تاتاری , محمدباقر نقیبی سیستانی ,

فایل:

Full Text

استناددهی: BibTeX | EndNote

چکیده

این مقاله به معرفی بازی های گرافی دیفرانسیلی برای سیستم های چند عاملی غیر خطی زمان پیوسته می پردازد و یک روش بهینه توزیع شده برخط برای حل آنها پیشنهاد می کند. در بازی های گرافی دیفرانسیلی، دینامیک خطا و اندیس عملکرد هر بازیکن تنها بستگی به اطلاعات همسایگان محلی آن عامل دارد. الگوریتم تکرار سیاست توزیع شده پیشنهاد شده، حل تقریبی معادلات همیلتون-جاکوبی کوپل شده همکارانه متعلق به عامل های غیر خطی را به صورت برخط انجام می دهد. در این الگوریتم که بر مبنای یادگیری تقویتی طراحی شده، هر یک از بازیکنان از ساختار شبکه عصبی نقاد-کنترلر استفاده می کند و تنظیم وزن های شبکه های عصبی نقاد و کنترلر به صورت همزمان انجام می شود. در حالی که تمام شبکه های عصبی نقاد-کنترلر در حال یادگیری هستند، پایداری حلقه بسته و همگرایی به قوانین کنترل بهینه تضمین می گردد. در انتها، نتایج به دست آمده از شبیه سازی، عملکرد و صحت الگوریتم پیشنهادی را نشان می دهد.

کلمات کلیدی

بازی های گرافی دیفرانسیلی غیرخطی؛ شبکه های عصبی؛ کنترل بهینه؛ یادگیری تقویتی

برای دانلود از شناسه و رمز عبور پرتال پویا استفاده کنید.

BibTeX
EndNote

@article{paperid:1054195,
author = {تاتاری, فرزانه and نقیبی سیستانی, محمدباقر},
title = {کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط},
journal = {کنترل},
year = {2015},
volume = {8},
number = {4},
month = {February},
issn = {2008-8345},
pages = {15--30},
numpages = {15},
keywords = {بازی های گرافی دیفرانسیلی غیرخطی؛ شبکه های عصبی؛ کنترل بهینه؛ یادگیری تقویتی},
}

[Download]

%0 Journal Article
%T کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط
%A تاتاری, فرزانه
%A نقیبی سیستانی, محمدباقر
%J کنترل
%@ 2008-8345
%D 2015

[Download]