علوم کاربردی و محاسباتی در مکانیک, دوره (27), شماره (1), سال (2016-1) , صفحات (103-116)

عنوان : ( تلفیق مبانی فازی و یادگیری تقویتی در کنترل سیستم‌های دینامیکی )

نویسندگان: مسعود گوهری منش , علی اکبر اکبری , محمدباقر نقیبی سیستانی ,
فایل: Full Text

استناددهی: BibTeX | EndNote

چکیده

یادگیری تقویتی، روشی است که در آن عامل یا عاملان باتوجه به یک‌سری پاداش‌های مثبت و یا منفی، یک عمل بهینه را انجام می‌دهند. این روش، زمانی کارایی بسیار بالایی خواهد داشت که مدل سیستم به‌صورت طبیعی موجود نباشد و یا به‌دست آوردن آن موجب زحمت فراوان گردد. در این صورت می‌توان، آن را جایگزین مناسبی برای منطق‌های کنترلی دیگر دانست. یکی از معایب اساسی این روش، استفاده از عمل‌های گسسته در حین انجام آن می‌باشد. این در حالی است که خیلی از سیستم‌های دینامیکی با چنین رویکردی، عملکرد بهینه‌ای نخواهند داشت. برای جبران این نقیصه، رویکردهای متفاوتی از جمله تقریب مقادیر ظهور پیدا می کنند. در این مقاله از منطق فازی برای پیوسته کردن عمل‌های بهینه استفاده شده است. در این حالت، سیستم یادگیری تقویتی، قوانین بین کنترل‌کنندۀ فازی را در جهت نیل به بهینه‌ترین عمل تنظیم می‌نماید و به این ترتیب می تواند عمل‌های پیوسته‌ای را تولید نماید. به این منظور مدل یک آونگ معکوس در سیم مکانیکس در نظر گرفته شده است که توسط کنترل‌کننده طراحی شده است و حرکت آن در دو حالت کنترل زاویۀ آونگ و کنترل کامل آونگ و ارابه مورد بررسی قرار می گیرد. نتایج به‌دست آمده نشان می دهند، هوش مصنوعی به‌کار گرفته شده به‌جای انتخاب قوانین موجود، می تواند کارایی بالاتری در کنترل سیستم های دینامیکی داشته باشد.

کلمات کلیدی

یادگیری تقویتی; منطق فازی; کنترل بهینه; آونگ معکوس
برای دانلود از شناسه و رمز عبور پرتال پویا استفاده کنید.

@article{paperid:1056601,
author = {گوهری منش, مسعود and اکبری, علی اکبر and نقیبی سیستانی, محمدباقر},
title = {تلفیق مبانی فازی و یادگیری تقویتی در کنترل سیستم‌های دینامیکی},
journal = {علوم کاربردی و محاسباتی در مکانیک},
year = {2016},
volume = {27},
number = {1},
month = {January},
issn = {2008-918x},
pages = {103--116},
numpages = {13},
keywords = {یادگیری تقویتی; منطق فازی; کنترل بهینه; آونگ معکوس},
}

[Download]

%0 Journal Article
%T تلفیق مبانی فازی و یادگیری تقویتی در کنترل سیستم‌های دینامیکی
%A گوهری منش, مسعود
%A اکبری, علی اکبر
%A نقیبی سیستانی, محمدباقر
%J علوم کاربردی و محاسباتی در مکانیک
%@ 2008-918x
%D 2016

[Download]