Управляемый случайный процессБольшая Советская Энциклопедия. Статьи для написания рефератов, курсовых работ, научные статьи, биографии, очерки, аннотации, описания.
|
|||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||
|
Управляемый случайный процесс, случайный процесс, вероятностные характеристики которого можно изменять с помощью управляющих воздействий. Основная цель теории Управляемый случайный процесс – отыскание оптимальных (или близких к ним) управлений, доставляющих экстремум заданному критерию качества. В простейшем случае управляемых марковских цепей одна из математических постановок задачи нахождения оптимального управления формулируется следующим образом. Пусть Xd = (xn, Пусть: где функция f (d, х)³0 и f (d,0) = 0 (если точка {0} является поглощающим состоянием и f (d, x) = I, d ÎD, x = 1,..., N, то Va (x) есть матем. ожидание времени попадания из точки х в точку 0). Функцию называется ценой, а стратегию а* – оптимальной, если При довольно общих предположениях о множестве D устанавливается, что цена V (x) удовлетворяет следующему уравнению оптимальности (уравнению Беллмана): где
В классе всех стратегий наибольший интерес представляют т. н. однородные марковские стратегии, характеризуемые одной функцией а (х) такой, что an (x0,..., xn) = a (xn) при всех n = 0, 1,... Следовательно, критерий оптимальности (или достаточное условие оптимальности) может быть использован для проверки того, что данная однородная марковская стратегия является оптимальной: пусть существуют функции a* = а*(х) и V* = V*(x) такие, что для любого d ÎD 0 = f (x, a*(x)) + La*V*£f (x, d) + LdV*(x) (Ld = Td – I, I – единичный оператор), тогда V* является ценой (V* = V) и стратегия a* = a*(х) является оптимальной.
Лит.: Ховард Р.-А., Динамическое программирование и марковские процессы, пер. с англ., М. 1964. А. Н. Ширяев.
|
||||||||||||||||||||||||||||||||||||||||||||||
|