Постановка задачи управления безопасным движением. Динамическое программирование

Информация » Задачи управления безопасным движением при встрече с препятствием и выбор метода решения » Постановка задачи управления безопасным движением. Динамическое программирование

Страница 6

Первое слагаемое можно преобразовать, учитывая очевидное соотношение

откуда получаем следующий результат:

Видно, что в оба слагаемых входят одни и те же функции которые мы теперь «обозначим через . Тогда условие (1.14) для оптимального процесса приобретет вид,

что сразу же позволяет левую часть этого равенства обозначить через гамильтониан Н, а из соотношения (1.15) получить используемую в принципе максимума систему дифференциальных уравнений относи тельно вспомогательных переменных

Таким образом, результаты динамического программирования и принципа максимума совпадают, если ввести обозначения

или в векторной форме .

Рис. 1.2. Геометрическая интерпретация динамического программирования в задаче максимального быстродействия.

Это позволяет дать следующую геометрическую интерпретацию динамического программирования. На рис. 1.2 представлены поверхности изохрон S = const для задачи максимального быстродействия, причем величина S, по смыслу равная оставшемуся минимизируемому времени убывает по мере приближения к конечной точке, т.е.

При этом движение должно осуществляться в направлении убывания функции S, т.е. в направлении, противоположном ее градиенту внутрь изоповерхностей S = const. Из физических соображений очевидно, что движение вдоль нормали — самое быстрое по времени, так как движение вдоль изоповерхности не дает приближения к конечной точке.

С помощью функции Беллмана S можно дать и другую трактовку процессу ее убывания, связав ее с функцией Ляпунова. Действительно, если целевая функция положительно определена,

то, выразив уравнение (1.12) в виде

или

видим, что функция S есть функция Ляпунова.

Значит, если функция S положительно определена, то оптимальная система обладает еще одним замечательным свойством — она асимптотически устойчива, что особенно важно для нелинейных систем.

Отличие динамического программирования от других методов состоит в том, что если принцип максимума есть необходимое условие оптимальности, то уравнения динамического программирования при соблюдении всех требуемых допущений понимаются как достаточное условие. Необходимо также подчеркнуть, что в принципе максимума переменные мыслятся как функции времени, а в динамическом программировании это функции от фазовых координат, характеризующие чувствительность минимизируемого значения функционала к изменению текущего состояния .

Формально это требует решения нелинейных дифференциальных уравнений вида (1.9) или (1.10) в частных производных, что так же сложно, как и решение краевых задач в принципе максимума.

Страницы: 1 2 3 4 5 6 

Еще по теме:

Тяговая характеристика трактора
Тяговая характеристика трактора показывает, как в зависимости от нагрузки на крюке Ркр (тягового усилия трактора) и включенной передачи изменяются основные показатели: скорость движения V, мощность на крюке (тяговая мощность) Nкр, часовой Gт и удельный тяговый gкр расходы топлива, потери на буксова ...

Выбор аппаратов управления и защиты, токопроводов
Основой для выбора аппаратов для коммутации, управления и защиты электропривода (ЭП) являются номинальные (паспортные) данные двигателя, режимы и условия его работы. Применяемые в ЭП устройства должны в наилучшей степени обеспечивать все возлагаемые на них функции и полностью соответствовать услови ...

Слесарный участок
Одним из мероприятий реконструкции а/к 1826 является разработка слесарного участка. Общий годовой объем работ на слесарном участке составил 11940,07 чел-ч. Участок имеет площадь 84м2, покрытие пола - бетон, отопление водяное, централизованное, освещение смешаное - естественное через окна и искустве ...


Навигация

Copyright © 2019 - All Rights Reserved - www.transpexplore.ru