عنوان : ( تلفیق مبانی فازی و یادگیری تقویتی در کنترل سیستمهای دینامیکی )
نویسندگان: مسعود گوهری منش , علی اکبر اکبری , محمدباقر نقیبی سیستانی ,چکیده
یادگیری تقویتی، روشی است که در آن عامل یا عاملان باتوجه به یکسری پاداشهای مثبت و یا منفی، یک عمل بهینه را انجام میدهند. این روش، زمانی کارایی بسیار بالایی خواهد داشت که مدل سیستم بهصورت طبیعی موجود نباشد و یا بهدست آوردن آن موجب زحمت فراوان گردد. در این صورت میتوان، آن را جایگزین مناسبی برای منطقهای کنترلی دیگر دانست. یکی از معایب اساسی این روش، استفاده از عملهای گسسته در حین انجام آن میباشد. این در حالی است که خیلی از سیستمهای دینامیکی با چنین رویکردی، عملکرد بهینهای نخواهند داشت. برای جبران این نقیصه، رویکردهای متفاوتی از جمله تقریب مقادیر ظهور پیدا می کنند. در این مقاله از منطق فازی برای پیوسته کردن عملهای بهینه استفاده شده است. در این حالت، سیستم یادگیری تقویتی، قوانین بین کنترلکنندۀ فازی را در جهت نیل به بهینهترین عمل تنظیم مینماید و به این ترتیب می تواند عملهای پیوستهای را تولید نماید. به این منظور مدل یک آونگ معکوس در سیم مکانیکس در نظر گرفته شده است که توسط کنترلکننده طراحی شده است و حرکت آن در دو حالت کنترل زاویۀ آونگ و کنترل کامل آونگ و ارابه مورد بررسی قرار می گیرد. نتایج بهدست آمده نشان می دهند، هوش مصنوعی بهکار گرفته شده بهجای انتخاب قوانین موجود، می تواند کارایی بالاتری در کنترل سیستم های دینامیکی داشته باشد.
کلمات کلیدی
یادگیری تقویتی; منطق فازی; کنترل بهینه; آونگ معکوس@article{paperid:1056601,
author = {گوهری منش, مسعود and اکبری, علی اکبر and نقیبی سیستانی, محمدباقر},
title = {تلفیق مبانی فازی و یادگیری تقویتی در کنترل سیستمهای دینامیکی},
journal = {علوم کاربردی و محاسباتی در مکانیک},
year = {2016},
volume = {27},
number = {1},
month = {January},
issn = {2008-918x},
pages = {103--116},
numpages = {13},
keywords = {یادگیری تقویتی; منطق فازی; کنترل بهینه; آونگ معکوس},
}
%0 Journal Article
%T تلفیق مبانی فازی و یادگیری تقویتی در کنترل سیستمهای دینامیکی
%A گوهری منش, مسعود
%A اکبری, علی اکبر
%A نقیبی سیستانی, محمدباقر
%J علوم کاربردی و محاسباتی در مکانیک
%@ 2008-918x
%D 2016