Постановка задачи управления безопасным движением. Динамическое программирование

Информация » Задачи управления безопасным движением при встрече с препятствием и выбор метода решения » Постановка задачи управления безопасным движением. Динамическое программирование

Страница 3

Где

Результаты расчета для нового шага также запоминаются в ЭВМ. Эта процедура повторяется, двигаясь от конца к началу для всех шагов, кроме первого. При этом необходимый объем памяти непрерывно растет. Наконец на первом шаге, воспользовавшись единственным вариантом заданного начального состояния, численно определяют оптимальное управление , но именно ради этого необходимо было запомнить итоги оптимизации на втором шаге, а это приводит к необходимости помнить результаты на предыдущих шагах.

Теперь, поскольку управление найдено и, значит, определено значение , представляющее собой минимизируемое значение функционала, осталось выявить конкретные значения , соответствующие данной оптимальной траектории. Для этого на основании уравнения (1.7) и известного управления определяется состояние , которому соответствует свое запомненное управление . Продолжая теперь движение слева направо, последовательно восстанавливают всю программу управления и оптимальную траекторию за все к шагов.

Рис 1.1 Иллюстрация численного решения с правого конца задачи при дискретной форме динамического программирования

Рассмотренным методом решаются задачи, когда на правом конце часть фазовых координат закреплена. Например, на рис. (1.1) представлен случай перехода из точки А в точку В с произвольной конечной скоростью; Тогда движение справа налево, как это показано на рис. (1.1), при к = 3 требует переменного объема запоминаемых результатов, поскольку по координатам x1 и x2 вначале оценивается малое число вариантов, а потом число растет, вплоть до момента достижения точки А. При этом основное содержание расчета на каждом шаге остается прежним.

Нужно отметить, что, несмотря на определенную утомительность рассмотренной вычислительной процедуры, метод динамического программирования сводит задачу минимизации функции переменных отдельным шагам расчетами минимизации функции Беллмана, зависящей только от г переменных. Это экономит время расчета, требуя, правда, значительного объема памяти ЭВМ. Достоинством метода при численных расчетах является также и снижение объема вычислений при сужении области допустимых управлений или допустимого множества значений . Однако с увеличением размерности задачи дискретизация увеличивает число вариантов расчета запоминаемых результатов в степени n, что известно как «проклятие размерности», и требует иных подходов к применению динамического программирования.

Непрерывная форма динамического программирования

Принцип оптимальности Беллмана дает достаточно общее условие, которое можно применять как для дискретных, так и для непрерывных систем управления.

Рассмотрим следующий предельный случай, когда дискрет времени бесконечно мал, т.е. . Обратимся к функциональному уравнению Беллмана для одномерного объекта, заменив в нем дискретный момент времени ( на текущее время ) и согласно (1.2) и (1.3) функции и соответственно на и . Тогда можно получить выражение

При этом функция S во втором слагаемом правой части уравнения также имеет бесконечно малые приращения. Допустим, что функция Беллмана S непрерывна и, кроме того, существуют частные производные . Тогда можно разложить функцию ряд Тейлора в точке (х,t) и, пренебрегая членами второго порядка малости, получить

Страницы: 1 2 3 4 5 6

Еще по теме:

Требования ЕПБ при эксплуатации самоходного оборудования
Сечение горной выработки по параметру транспорта при использовании самоходного оборудования определяется шириной выработки В и ее высотой Н. Ширина выработки у почвы определяется суммой ширины проезжей части А, регламентируемой ПБ ширины пешеходной дорожки (тротуара) и минимального расстояния между ...

Меморандум о конфиденциальности
Этот бизнес-план представляется на рассмотрение на конфиденциальной основе исключительно для принятия решений по финансированию данного проекта и не может быть использован для копирования или каких-либо иных целей, а также передаваться третьим лицам. Все оценки, прогнозы и расчеты, приведенные в да ...

Расчет стоимости основных фондов
Расчет стоимости зданий Стоимость части здания, приходящейся на участок, определяется по формуле: СЗД = VЗД * СМ3, руб. (5.1) гдеVЗД - объем здания приходящийся на участок, м3 СМ3 - стоимость 1 м3 здания, руб., СМ3 = 260 руб.; VЗД = 1,1*SВН*h, м3 (5.2) гдеSВН - внутренняя площадь участка, м2 h - вы ...


Навигация

Copyright © 2019 - All Rights Reserved - www.transpexplore.ru