Постановка задачи управления безопасным движением. Динамическое программирование

Информация » Задачи управления безопасным движением при встрече с препятствием и выбор метода решения » Постановка задачи управления безопасным движением. Динамическое программирование

Страница 3

Где

Результаты расчета для нового шага также запоминаются в ЭВМ. Эта процедура повторяется, двигаясь от конца к началу для всех шагов, кроме первого. При этом необходимый объем памяти непрерывно растет. Наконец на первом шаге, воспользовавшись единственным вариантом заданного начального состояния, численно определяют оптимальное управление , но именно ради этого необходимо было запомнить итоги оптимизации на втором шаге, а это приводит к необходимости помнить результаты на предыдущих шагах.

Теперь, поскольку управление найдено и, значит, определено значение , представляющее собой минимизируемое значение функционала, осталось выявить конкретные значения , соответствующие данной оптимальной траектории. Для этого на основании уравнения (1.7) и известного управления определяется состояние , которому соответствует свое запомненное управление . Продолжая теперь движение слева направо, последовательно восстанавливают всю программу управления и оптимальную траекторию за все к шагов.

Рис 1.1 Иллюстрация численного решения с правого конца задачи при дискретной форме динамического программирования

Рассмотренным методом решаются задачи, когда на правом конце часть фазовых координат закреплена. Например, на рис. (1.1) представлен случай перехода из точки А в точку В с произвольной конечной скоростью; Тогда движение справа налево, как это показано на рис. (1.1), при к = 3 требует переменного объема запоминаемых результатов, поскольку по координатам x1 и x2 вначале оценивается малое число вариантов, а потом число растет, вплоть до момента достижения точки А. При этом основное содержание расчета на каждом шаге остается прежним.

Нужно отметить, что, несмотря на определенную утомительность рассмотренной вычислительной процедуры, метод динамического программирования сводит задачу минимизации функции переменных отдельным шагам расчетами минимизации функции Беллмана, зависящей только от г переменных. Это экономит время расчета, требуя, правда, значительного объема памяти ЭВМ. Достоинством метода при численных расчетах является также и снижение объема вычислений при сужении области допустимых управлений или допустимого множества значений . Однако с увеличением размерности задачи дискретизация увеличивает число вариантов расчета запоминаемых результатов в степени n, что известно как «проклятие размерности», и требует иных подходов к применению динамического программирования.

Непрерывная форма динамического программирования

Принцип оптимальности Беллмана дает достаточно общее условие, которое можно применять как для дискретных, так и для непрерывных систем управления.

Рассмотрим следующий предельный случай, когда дискрет времени бесконечно мал, т.е. . Обратимся к функциональному уравнению Беллмана для одномерного объекта, заменив в нем дискретный момент времени ( на текущее время ) и согласно (1.2) и (1.3) функции и соответственно на и . Тогда можно получить выражение

При этом функция S во втором слагаемом правой части уравнения также имеет бесконечно малые приращения. Допустим, что функция Беллмана S непрерывна и, кроме того, существуют частные производные . Тогда можно разложить функцию ряд Тейлора в точке (х,t) и, пренебрегая членами второго порядка малости, получить

Страницы: 1 2 3 4 5 6

Еще по теме:

Характеристика аэропорта
На аэродроме имеется одна ВПП класса А длинной 3 826 метров, шириной 60 метров с посадочными курсами: Мкпос.= 023є и Мкпос.= 203є. Категория ВПП по уровню требуемой пожарной защиты – седьмая. На аэродроме имеется аварийно-спасательная станция (АСС), на которой оборудован наблюдательный пункт (НП) д ...

Определение потребного числа бригад ПТО
Задача разработки возможных вариантов организации технического осмотра в парке приема сводится к определению возможных продолжительностей технического осмотра составов в зависимости от числа бригад в парке и числа групп осмотрщиков в бригаде. Число бригад ПТО, обрабатывающих составы в парке, опреде ...

Определение производительности работы погрузочно-разгрузочного механизма
Производительность подъемно-транспортных механизмов цикличного действия зависит от состава и продолжительности рабочего цикла. Продолжительность рабочего цикла tц = t застропка + t подъем крюка + t перемещ.тележки+ t перемещ.крана+ t опускание + t отстропка + t подъем хол.крюка+ t перемещ.хол.тележ ...


Навигация

Copyright © 2021 - All Rights Reserved - www.transpexplore.ru