کنترل, دوره (3), شماره (11), سال (2009-6) , صفحات (1-11)

عنوان : ( بررسی یادگیری تقویتی و خواص سیاست بهینه در مسائل جدولی )

نویسندگان: سیّدمصطفی کلامی هریس , ناصر پریز , محمدباقر نقیبی سیستانی ,
فایل: Full Text

استناددهی: BibTeX | EndNote

چکیده

Markov Decision Process (MDP) has enormous applications in science, engineering, economics and management. Most of decision processes have Markov property and can be modeled as MDP. Reinforcement Learning (RL) is an approach to deal with Markov Decision Processes. RL methods are based on Dynamic Programming (DP) algorithms, such as Policy Evaluation, Policy Iteration and Value Iteration. In this paper, policy evaluation algorithm is represented in the form of a discrete-time dynamical system, namely a Discrete-Time Control system. Hence, using Discrete- Time Control methods, behavior of agent and properties of various policies, can be analyzed. Two grid-world problems are solved and analyzed using this approach. Therefore general case of gridworld problems is addressed, and some important results are obtained for this type of problems, For example, equivalent dynamical system of an optimal policy for a grid-world problem, is always a dead-beat system in the framework of Discrete-Time Control systems.

کلمات کلیدی

, برنام هریزی پویا, سیست مهای کنترل دیجیتال, فرآیندهای تصمی مگیری مارکوف, کنترل تصادفی, یادگیری تقویتی.
برای دانلود از شناسه و رمز عبور پرتال پویا استفاده کنید.

@article{paperid:1011430,
author = {کلامی هریس, سیّدمصطفی and پریز, ناصر and نقیبی سیستانی, محمدباقر},
title = {بررسی یادگیری تقویتی و خواص سیاست بهینه در مسائل جدولی},
journal = {کنترل},
year = {2009},
volume = {3},
number = {11},
month = {June},
issn = {2008-8345},
pages = {1--11},
numpages = {10},
keywords = {برنام هریزی پویا، سیست مهای کنترل دیجیتال، فرآیندهای تصمی مگیری مارکوف، کنترل تصادفی، یادگیری تقویتی.},
}

[Download]

%0 Journal Article
%T بررسی یادگیری تقویتی و خواص سیاست بهینه در مسائل جدولی
%A کلامی هریس, سیّدمصطفی
%A پریز, ناصر
%A نقیبی سیستانی, محمدباقر
%J کنترل
%@ 2008-8345
%D 2009

[Download]