کنترل, دوره (12), شماره (2), سال (2018-9) , صفحات (13-25)

عنوان : ( حل زیربهینه بازی های گرافی دیفرانسیلی غیر خطی با استفاده از برنامه ریزی پویای تقریبی تک - شبکه )

نویسندگان: مجید مازوچی , محمدباقر نقیبی سیستانی , سیدکمال حسینی ثانی ,

بر اساس تصمیم نویسنده مقاله دسترسی به متن کامل برای اعضای غیر دانشگاه ممکن نیست

استناددهی: BibTeX | EndNote

چکیده

در این مقاله یک الگوریتم یادگیری برخط برمبنای برنامه ریزی پویای تقریبی تک-شبکه برای حل تقریبی بازی های گرافی دیفرانسیلی زمان پیوسته غیرخطی با تابع هزینه زمان نامحدود و دینامیک معین پیشنهاد شده است. در بازی های گرافی دیفرانسیلی، هدف عامل ها ردیابی حالت رهبر به صورت بهینه می باشد، به طوری که دینامیک خطا و اندیس عملکرد هر عامل بستگی به توپولوژی گراف تعاملی بازی دارد. در الگوریتم پیشنهادی، هر عامل تنها از یک شبکه عصبی نقاد برای تقریب ارزش و سیاست کنترلی بهینه خود استفاده می کند و از قوانین تنظیم وزن پیشنهاد شده برای به روزرسانی برخط وزن های شبکه عصبی نقاد خود بهره می جوید. در این مقاله، با معرفی سوئیچ های پایدار ساز محلی در قوانین تنظیم وزن های شبکه عصبی که پایداری سیستم حلقه بسته و همگرایی به سیاست های تعادل آنش را تضمین می کنند، دیگر نیازی به مجموعه سیاست های کنترلی پایدار ساز اولیه وجود ندارد. بعلاوه در این مقاله از تئوری لیاپانوف برای اثبات پایداری سیستم حلقه بسته استفاده می شود. در پایان، مثال شبیه سازی، موثر بودن الگوریتم پیشنهادی را نشان می دهد.

کلمات کلیدی

, برنامه ریزی پویای تقریبی, شبکه های عصبی, کنترل بهینه, یادگیری تقویتی.
برای دانلود از شناسه و رمز عبور پرتال پویا استفاده کنید.

@article{paperid:1071126,
author = {مازوچی, مجید and نقیبی سیستانی, محمدباقر and حسینی ثانی, سیدکمال},
title = {حل زیربهینه بازی های گرافی دیفرانسیلی غیر خطی با استفاده از برنامه ریزی پویای تقریبی تک - شبکه},
journal = {کنترل},
year = {2018},
volume = {12},
number = {2},
month = {September},
issn = {2008-8345},
pages = {13--25},
numpages = {12},
keywords = {برنامه ریزی پویای تقریبی، شبکه های عصبی، کنترل بهینه، یادگیری تقویتی.},
}

[Download]

%0 Journal Article
%T حل زیربهینه بازی های گرافی دیفرانسیلی غیر خطی با استفاده از برنامه ریزی پویای تقریبی تک - شبکه
%A مازوچی, مجید
%A نقیبی سیستانی, محمدباقر
%A حسینی ثانی, سیدکمال
%J کنترل
%@ 2008-8345
%D 2018

[Download]