Постановка задачи управления безопасным движением. Динамическое программирование

Информация » Задачи управления безопасным движением при встрече с препятствием и выбор метода решения » Постановка задачи управления безопасным движением. Динамическое программирование

Страница 3

Где

Результаты расчета для нового шага также запоминаются в ЭВМ. Эта процедура повторяется, двигаясь от конца к началу для всех шагов, кроме первого. При этом необходимый объем памяти непрерывно растет. Наконец на первом шаге, воспользовавшись единственным вариантом заданного начального состояния, численно определяют оптимальное управление , но именно ради этого необходимо было запомнить итоги оптимизации на втором шаге, а это приводит к необходимости помнить результаты на предыдущих шагах.

Теперь, поскольку управление найдено и, значит, определено значение , представляющее собой минимизируемое значение функционала, осталось выявить конкретные значения , соответствующие данной оптимальной траектории. Для этого на основании уравнения (1.7) и известного управления определяется состояние , которому соответствует свое запомненное управление . Продолжая теперь движение слева направо, последовательно восстанавливают всю программу управления и оптимальную траекторию за все к шагов.

Рис 1.1 Иллюстрация численного решения с правого конца задачи при дискретной форме динамического программирования

Рассмотренным методом решаются задачи, когда на правом конце часть фазовых координат закреплена. Например, на рис. (1.1) представлен случай перехода из точки А в точку В с произвольной конечной скоростью; Тогда движение справа налево, как это показано на рис. (1.1), при к = 3 требует переменного объема запоминаемых результатов, поскольку по координатам x1 и x2 вначале оценивается малое число вариантов, а потом число растет, вплоть до момента достижения точки А. При этом основное содержание расчета на каждом шаге остается прежним.

Нужно отметить, что, несмотря на определенную утомительность рассмотренной вычислительной процедуры, метод динамического программирования сводит задачу минимизации функции переменных отдельным шагам расчетами минимизации функции Беллмана, зависящей только от г переменных. Это экономит время расчета, требуя, правда, значительного объема памяти ЭВМ. Достоинством метода при численных расчетах является также и снижение объема вычислений при сужении области допустимых управлений или допустимого множества значений . Однако с увеличением размерности задачи дискретизация увеличивает число вариантов расчета запоминаемых результатов в степени n, что известно как «проклятие размерности», и требует иных подходов к применению динамического программирования.

Непрерывная форма динамического программирования

Принцип оптимальности Беллмана дает достаточно общее условие, которое можно применять как для дискретных, так и для непрерывных систем управления.

Рассмотрим следующий предельный случай, когда дискрет времени бесконечно мал, т.е. . Обратимся к функциональному уравнению Беллмана для одномерного объекта, заменив в нем дискретный момент времени ( на текущее время ) и согласно (1.2) и (1.3) функции и соответственно на и . Тогда можно получить выражение

При этом функция S во втором слагаемом правой части уравнения также имеет бесконечно малые приращения. Допустим, что функция Беллмана S непрерывна и, кроме того, существуют частные производные . Тогда можно разложить функцию ряд Тейлора в точке (х,t) и, пренебрегая членами второго порядка малости, получить

Страницы: 1 2 3 4 5 6

Еще по теме:

Гидрораспределители
Для направления потока рабочей жидкости от насосов к исполнительной части гидросистемы предназначаются гидрораспределители. Различаются секционные (состоящие из отдельных секций) и моноблочные (выполнены в одном литом блоке). Моноблочный гидрораспределитель экскаватора ЭО-2621 А состоит из чугунног ...

Примыкание подъездных путей
Существующие варианты примыкания подъездных путей определяются: расположением площадки предприятия по отношению к станции; размерами грузовой работы, выполняемой на подъездном пути. По заданию примыкание подъездного пути к рассматриваемой промежуточной станции находится в юго-восточном направлении. ...

Ограничивающие условия, влияющие на пропускную способность пр. Ленинградский
Пропускная способность контрольных участков 1-5 пр. Ленинградский была рассчитана с учетом влияния самых неблагоприятных условий для движения, а именно условий движения в зимний период. При этом во внимание принимаются характеристики типичные для северных российских городов: Неудовлетворительное со ...


Навигация

Copyright © 2019 - All Rights Reserved - www.transpexplore.ru