Постановка задачи управления безопасным движением. Динамическое программирование

Информация » Задачи управления безопасным движением при встрече с препятствием и выбор метода решения » Постановка задачи управления безопасным движением. Динамическое программирование

Страница 6

Первое слагаемое можно преобразовать, учитывая очевидное соотношение

откуда получаем следующий результат:

Видно, что в оба слагаемых входят одни и те же функции которые мы теперь «обозначим через . Тогда условие (1.14) для оптимального процесса приобретет вид,

что сразу же позволяет левую часть этого равенства обозначить через гамильтониан Н, а из соотношения (1.15) получить используемую в принципе максимума систему дифференциальных уравнений относи тельно вспомогательных переменных

Таким образом, результаты динамического программирования и принципа максимума совпадают, если ввести обозначения

или в векторной форме .

Рис. 1.2. Геометрическая интерпретация динамического программирования в задаче максимального быстродействия.

Это позволяет дать следующую геометрическую интерпретацию динамического программирования. На рис. 1.2 представлены поверхности изохрон S = const для задачи максимального быстродействия, причем величина S, по смыслу равная оставшемуся минимизируемому времени убывает по мере приближения к конечной точке, т.е.

При этом движение должно осуществляться в направлении убывания функции S, т.е. в направлении, противоположном ее градиенту внутрь изоповерхностей S = const. Из физических соображений очевидно, что движение вдоль нормали — самое быстрое по времени, так как движение вдоль изоповерхности не дает приближения к конечной точке.

С помощью функции Беллмана S можно дать и другую трактовку процессу ее убывания, связав ее с функцией Ляпунова. Действительно, если целевая функция положительно определена,

то, выразив уравнение (1.12) в виде

или

видим, что функция S есть функция Ляпунова.

Значит, если функция S положительно определена, то оптимальная система обладает еще одним замечательным свойством — она асимптотически устойчива, что особенно важно для нелинейных систем.

Отличие динамического программирования от других методов состоит в том, что если принцип максимума есть необходимое условие оптимальности, то уравнения динамического программирования при соблюдении всех требуемых допущений понимаются как достаточное условие. Необходимо также подчеркнуть, что в принципе максимума переменные мыслятся как функции времени, а в динамическом программировании это функции от фазовых координат, характеризующие чувствительность минимизируемого значения функционала к изменению текущего состояния .

Формально это требует решения нелинейных дифференциальных уравнений вида (1.9) или (1.10) в частных производных, что так же сложно, как и решение краевых задач в принципе максимума.

Страницы: 1 2 3 4 5 6 

Еще по теме:

Аппараты управления с табло блочного типа
На станциях могут применяться АУ с табло блочного типа. Пульт-табло имеет 2 панели: вертикальную (табло) и горизонтальную (пульт). Для станций, имеющих 30 и более стрелок применяются пульты-манипуляторы с табло выносным блочным (ТВБ). Табло собирают из мозаичных блоков размером 40х40 мм. Всего разр ...

Выбор первоначального пункта погрузки на кольцевом маршруте
А2Б1 – Б1А1 – А1Б2 – Б2А2 А1: АТПА1 + Б1АТП – Б1А1 = 5 + 4 - 3 = 6 км А2: АТПА2 + Б2АТП – Б2А2 = 6 + 4 - 10 = 0 км Для данного маршрута первоначальным пунктом погрузки будет пункт А2 Количественный расчет показателей Техническая скорость (ЕНВ, с. 18) Время погрузки-разгрузки = 0,48 ч. (ЕНВ, с. 15, ...

Синтез регулятора без учета динамики сближения с препятствием в математической модели объекта
Рассмотрим другой случай синтеза закона управления транспортом малоразмерного неподвижного препятствия, когда штраф за приближение к препятствию растет, а при удалении уменьшается. Постановка задачи оптимального управления может быть сформулирована следующим образом. Дано: 1. Заданы уравнения движе ...


Навигация

Copyright © 2020 - All Rights Reserved - www.transpexplore.ru