Постановка задачи управления безопасным движением. Динамическое программирование

Информация » Задачи управления безопасным движением при встрече с препятствием и выбор метода решения » Постановка задачи управления безопасным движением. Динамическое программирование

Страница 2

Выведем сначала функциональное уравнение Беллмана, рассуждая следующим образом. Пусть минимизируемое значение функционала J в начальный момент времени определенным образом зависит от начального состояния системы, т.е. от t0 и x(t0). Обозначим эту зависимость через , называемую функцией Беллмана, понимая под этим не любое значение функционала, а его минимум при оптимальном поведении системы.

Представим теперь, что система функционировала некоторое время , в результате чего к моменту она пришла в новое состояние . Тогда, согласно принципу оптимальности, оставшееся значение минимизируемого функционала

как результат последующих оптимальных действий есть также функция Беллмана , но уже зависящая от новых значений x(t1) и t1. Теперь осталось связать функции и друг с другом, представив последствия от выбираемого управления в промежуток времени в виде двух слагаемых — потерь внутри данного шага и потерь на всех последующих шагах вплоть до конца решения задачи, зависящих от , потому что последствия в будущем определяются новым состоянием , которое описывается выражением

Поэтому, преследуя цель минимизации суммарных потерь, как текущих так и последующих, можно записать:

Рассуждая аналогичным образом при переходе к следующему шагу от момента к моменту и т.д. к моменту , можно записать следующее функциональное уравнение:

Развивая этот же подход применительно к многомерному неавтономному объекту, можно получить функциональное уравнение Беллмана:

Пошаговый выбор управления с помощью уравнения (1.5) удобен для расчетов на ЭВМ. В этом случае численное решение обычно осуществляют с правого конца задачи. Поскольку краевые условия на правом конце не определены однозначно, то расчеты начинают, задавшись множеством значений вектора , разбивая, например, диапазон возможных значений на R- 1 участков. В результате для каждого из Rn вариантов конечного состояния определяется единственное управление на последнем шаге (в предположении, что управления на остальных шагах будут найдены позже), поскольку при заданном только от него зависит последнее слагаемое в функции (1.3):

Эта операция проводится также численно, например путем разбиения каждого из диапазонов возможных значений и на ( М -1 ) участков, что образует вариантов управления. Результаты наилучшего варианта запоминаются, а именно для каждого из вариантов фиксируются три величины — вектор состояния , оптимальное управление и минимум целевой функции . Таким образом, в памяти ЭВМ хранится чисел.

На следующем шаге, являющемся уже типичным для расчетов, снова формируются варианты состояния , а затем для каждого из них численно определяется управление , но уже исходя из минимума суммы двух слагаемых, причем второе слагаемое отыскивается в памяти ЭВМ в соответствии с переходом из B ;

Страницы: 1 2 3 4 5 6

Еще по теме:

Результаты проведения патентного поиска и изучения производственного опыта ремонтных организаций
При выполнении курсового проекта был проведен патентный поиск обзорно по ремонту кузовов автомобилей, кабин строительно-дорожных машин и прочих тонкостенных изделий. В патенте РФ 927366 предлагают устройство для правки металлоконструкций из листового материала, а именно для правки поврежденных кузо ...

Мероприятия по охране труда, технике безопасности и защите окружающей среды
Путевые машины, применяемые при выполнении путевых работ, повышают качество и производительность труда, а также облегчают условия труда. В настоящее время в путевом хозяйстве с помощью машин и механизмов выполняется подавляющее большинство трудоемких и тяжелых работ при ремонте и содержании пути. И ...

Определение числа путей в сортировочном парке
Количество сортировочных путей зависит от числа назначений плана формирования, их мощности, а также от объёма и характера местной работы, количества пунктов погрузки-выгрузки грузов на станции, системы организации развоза грузов на прилегающие участки. Определение числа путей в сортировочном парке ...


Навигация

Copyright © 2021 - All Rights Reserved - www.transpexplore.ru