Постановка задачи управления безопасным движением. Динамическое программирование

Информация » Задачи управления безопасным движением при встрече с препятствием и выбор метода решения » Постановка задачи управления безопасным движением. Динамическое программирование

Страница 6

Первое слагаемое можно преобразовать, учитывая очевидное соотношение

откуда получаем следующий результат:

Видно, что в оба слагаемых входят одни и те же функции которые мы теперь «обозначим через . Тогда условие (1.14) для оптимального процесса приобретет вид,

что сразу же позволяет левую часть этого равенства обозначить через гамильтониан Н, а из соотношения (1.15) получить используемую в принципе максимума систему дифференциальных уравнений относи тельно вспомогательных переменных

Таким образом, результаты динамического программирования и принципа максимума совпадают, если ввести обозначения

или в векторной форме .

Рис. 1.2. Геометрическая интерпретация динамического программирования в задаче максимального быстродействия.

Это позволяет дать следующую геометрическую интерпретацию динамического программирования. На рис. 1.2 представлены поверхности изохрон S = const для задачи максимального быстродействия, причем величина S, по смыслу равная оставшемуся минимизируемому времени убывает по мере приближения к конечной точке, т.е.

При этом движение должно осуществляться в направлении убывания функции S, т.е. в направлении, противоположном ее градиенту внутрь изоповерхностей S = const. Из физических соображений очевидно, что движение вдоль нормали — самое быстрое по времени, так как движение вдоль изоповерхности не дает приближения к конечной точке.

С помощью функции Беллмана S можно дать и другую трактовку процессу ее убывания, связав ее с функцией Ляпунова. Действительно, если целевая функция положительно определена,

то, выразив уравнение (1.12) в виде

или

видим, что функция S есть функция Ляпунова.

Значит, если функция S положительно определена, то оптимальная система обладает еще одним замечательным свойством — она асимптотически устойчива, что особенно важно для нелинейных систем.

Отличие динамического программирования от других методов состоит в том, что если принцип максимума есть необходимое условие оптимальности, то уравнения динамического программирования при соблюдении всех требуемых допущений понимаются как достаточное условие. Необходимо также подчеркнуть, что в принципе максимума переменные мыслятся как функции времени, а в динамическом программировании это функции от фазовых координат, характеризующие чувствительность минимизируемого значения функционала к изменению текущего состояния .

Формально это требует решения нелинейных дифференциальных уравнений вида (1.9) или (1.10) в частных производных, что так же сложно, как и решение краевых задач в принципе максимума.

Страницы: 1 2 3 4 5 6 

Еще по теме:

Характеристика предприятия
автодорожный техникум Адрес предприятия, наименование ГОУ СПО Хабаровский автодорожный техникум находится по адресу г. Хабаровск ул. Тихоокеанская 169. Организационно-правовая форма. Учредитель предприятия Данное предприятие является учреждением Учредителем данной организации является Федеральное Д ...

Мировое морское судоходство
Глобализация навсегда изменила то, как мы растем, общаемся и учимся. Глобализация также дала волю новым вызовам и возможностям, которые оказывают основополагающее влияние на наше экономическое процветание и то, как правительство вместе с заинтересованными лицами в нем оценивают ситуацию и принимают ...

Назначение, устройство и принцип работы
Стартер типа СТ-221 служит для пуска двигателя, устанавливается с правой его стороны и крепится фланцем к картеру сцепления тремя болтами. Стартер СТ-221 представляет собой четырёхщеточный, четырёхполюсный электродвигатель постоянного тока со смешанным возбуждением и состоит из: корпуса 20 с обмотк ...


Навигация

Copyright © 2018 - All Rights Reserved - www.transpexplore.ru