Постановка задачи управления безопасным движением. Динамическое программирование

Информация » Задачи управления безопасным движением при встрече с препятствием и выбор метода решения » Постановка задачи управления безопасным движением. Динамическое программирование

Страница 6

Первое слагаемое можно преобразовать, учитывая очевидное соотношение

откуда получаем следующий результат:

Видно, что в оба слагаемых входят одни и те же функции которые мы теперь «обозначим через . Тогда условие (1.14) для оптимального процесса приобретет вид,

что сразу же позволяет левую часть этого равенства обозначить через гамильтониан Н, а из соотношения (1.15) получить используемую в принципе максимума систему дифференциальных уравнений относи тельно вспомогательных переменных

Таким образом, результаты динамического программирования и принципа максимума совпадают, если ввести обозначения

или в векторной форме .

Рис. 1.2. Геометрическая интерпретация динамического программирования в задаче максимального быстродействия.

Это позволяет дать следующую геометрическую интерпретацию динамического программирования. На рис. 1.2 представлены поверхности изохрон S = const для задачи максимального быстродействия, причем величина S, по смыслу равная оставшемуся минимизируемому времени убывает по мере приближения к конечной точке, т.е.

При этом движение должно осуществляться в направлении убывания функции S, т.е. в направлении, противоположном ее градиенту внутрь изоповерхностей S = const. Из физических соображений очевидно, что движение вдоль нормали — самое быстрое по времени, так как движение вдоль изоповерхности не дает приближения к конечной точке.

С помощью функции Беллмана S можно дать и другую трактовку процессу ее убывания, связав ее с функцией Ляпунова. Действительно, если целевая функция положительно определена,

то, выразив уравнение (1.12) в виде

или

видим, что функция S есть функция Ляпунова.

Значит, если функция S положительно определена, то оптимальная система обладает еще одним замечательным свойством — она асимптотически устойчива, что особенно важно для нелинейных систем.

Отличие динамического программирования от других методов состоит в том, что если принцип максимума есть необходимое условие оптимальности, то уравнения динамического программирования при соблюдении всех требуемых допущений понимаются как достаточное условие. Необходимо также подчеркнуть, что в принципе максимума переменные мыслятся как функции времени, а в динамическом программировании это функции от фазовых координат, характеризующие чувствительность минимизируемого значения функционала к изменению текущего состояния .

Формально это требует решения нелинейных дифференциальных уравнений вида (1.9) или (1.10) в частных производных, что так же сложно, как и решение краевых задач в принципе максимума.

Страницы: 1 2 3 4 5 6 

Еще по теме:

Санитарно-гигиенические факторы
Требования к микроклимату определяются ГОСТ 12.1.005-88 "Система стандартов безопасности труда. Общие санитарно-гигиенические требования к воздуху рабочей зоны" и СанПиН 2.2.4.548-96 «Гигиенические требования к микроклимату производственных помещений». Выполняемая работа относится к Iа ка ...

Охрана труда и техника безопасности при ремонте и техническом обслуживание
Все работы по техническому обслуживанию и ремонту автомобиля следует проводить на специально оборудованных постах. При установке автомобиля на пост технического обслуживания следует затормозить его стояночным тормозом, выключить зажигание, включить низшую передачу в коробке передач и под колеса под ...

Технического обслуживания коробки передач
Уход за коробкой передач заключается в периодическом наружном осмотре, проверке крепления коробки передач к картеру сцепления, крепления переднего и заднего картеров, корпуса рычага переключения, доливке и смене масла через 60 000 км пробега и очистке сапуна в соответствии с указаниями по обслужива ...


Навигация

Copyright © 2020 - All Rights Reserved - www.transpexplore.ru