Постановка задачи управления безопасным движением. Динамическое программирование

Информация » Задачи управления безопасным движением при встрече с препятствием и выбор метода решения » Постановка задачи управления безопасным движением. Динамическое программирование

Страница 3

Где

Результаты расчета для нового шага также запоминаются в ЭВМ. Эта процедура повторяется, двигаясь от конца к началу для всех шагов, кроме первого. При этом необходимый объем памяти непрерывно растет. Наконец на первом шаге, воспользовавшись единственным вариантом заданного начального состояния, численно определяют оптимальное управление , но именно ради этого необходимо было запомнить итоги оптимизации на втором шаге, а это приводит к необходимости помнить результаты на предыдущих шагах.

Теперь, поскольку управление найдено и, значит, определено значение , представляющее собой минимизируемое значение функционала, осталось выявить конкретные значения , соответствующие данной оптимальной траектории. Для этого на основании уравнения (1.7) и известного управления определяется состояние , которому соответствует свое запомненное управление . Продолжая теперь движение слева направо, последовательно восстанавливают всю программу управления и оптимальную траекторию за все к шагов.

Рис 1.1 Иллюстрация численного решения с правого конца задачи при дискретной форме динамического программирования

Рассмотренным методом решаются задачи, когда на правом конце часть фазовых координат закреплена. Например, на рис. (1.1) представлен случай перехода из точки А в точку В с произвольной конечной скоростью; Тогда движение справа налево, как это показано на рис. (1.1), при к = 3 требует переменного объема запоминаемых результатов, поскольку по координатам x1 и x2 вначале оценивается малое число вариантов, а потом число растет, вплоть до момента достижения точки А. При этом основное содержание расчета на каждом шаге остается прежним.

Нужно отметить, что, несмотря на определенную утомительность рассмотренной вычислительной процедуры, метод динамического программирования сводит задачу минимизации функции переменных отдельным шагам расчетами минимизации функции Беллмана, зависящей только от г переменных. Это экономит время расчета, требуя, правда, значительного объема памяти ЭВМ. Достоинством метода при численных расчетах является также и снижение объема вычислений при сужении области допустимых управлений или допустимого множества значений . Однако с увеличением размерности задачи дискретизация увеличивает число вариантов расчета запоминаемых результатов в степени n, что известно как «проклятие размерности», и требует иных подходов к применению динамического программирования.

Непрерывная форма динамического программирования

Принцип оптимальности Беллмана дает достаточно общее условие, которое можно применять как для дискретных, так и для непрерывных систем управления.

Рассмотрим следующий предельный случай, когда дискрет времени бесконечно мал, т.е. . Обратимся к функциональному уравнению Беллмана для одномерного объекта, заменив в нем дискретный момент времени ( на текущее время ) и согласно (1.2) и (1.3) функции и соответственно на и . Тогда можно получить выражение

При этом функция S во втором слагаемом правой части уравнения также имеет бесконечно малые приращения. Допустим, что функция Беллмана S непрерывна и, кроме того, существуют частные производные . Тогда можно разложить функцию ряд Тейлора в точке (х,t) и, пренебрегая членами второго порядка малости, получить

Страницы: 1 2 3 4 5 6

Еще по теме:

Судовая радиолокационная станция «Наяда-5»
Судовая радиолокационная станция (РЛС) «Наяда-5» имеет следующие характеристики. Длина волны 3,2 см (частота излучения 9430 МГц), поляризация волн горизонтальная. Шкалы дальности: 1, 2, 4, 8, 16, 32, 64 мили. Индикация относительного движения возможна на всех шкалах дальности, индикация истинного д ...

Четырехцилиндровый однорядный двигатель с кривошипами под углом 180
Данный тип двигателей наиболее распространен на современных автомобилях и тракторах, особенно на легковых автомобилях. Такие двигатели отличаются относительно хорошей уравновешенностью и равномерным чередованием вспышек в цилиндрах с угловым интервалом 1800. В рассматриваемом двигателе (рис. 9) дей ...

Базовые кривые распространения радиоволн
Дальность связи между радиостанциями рассчитывается на основе базовых кривых распространения сигналов в диапазоне 330 МГц (рис.10.1). Расчетные коэффициенты Поправочные коэффициенты. Поправочные коэффициенты учитывают отличие параметров антенно-фидерных трактов, мощности передатчика и высот установ ...


Навигация

Copyright © 2020 - All Rights Reserved - www.transpexplore.ru