Постановка задачи управления безопасным движением. Динамическое программирование

Информация » Задачи управления безопасным движением при встрече с препятствием и выбор метода решения » Постановка задачи управления безопасным движением. Динамическое программирование

Страница 1

Метод динамического программирования, разработанный в 50-х годах американским математиком Р.Беллманом, представляет собой новый подход к решению вариационных задач. Идея этого подхода состоит в том, что оптимальное поведение рассматривается как функция состояния системы, описываемого с помощью значения фазовых координат в текущий момент времени t. Беллман очень точно подметил связь между причинностью и оптимальностью для динамических систем в том смысле, что если изменение состояния любой динамической системы под воздействием входного управляющего сигнала можно описать функциональным уравнением, характеризующим причинность

то у оптимальной системы для описания изменения ее состояния, характеризуемого некоторой функцией как степень достижения подавленной цели, существует по аналогии такого же типа функциональной уравнение лишь с той разницей, что достигается минимум или максимум целевой функции при выборе управления :

При этом выбор управления на отдельном шаге производится с точки зрения интересов не только данного шага, но и всего процесса в целом, как на текущем, так и на всех последующих шагах.

Исходя из этого, Беллманом был сформулирован принцип оптимальности: каковы бы ни были начальное состояние и начальное управление, последующие управления должны быть оптимальными относительно состояния, являющегося результатом применения первого управления. Принцип оптимальности можно также сформулировать следующим образом: оптимальное поведение не зависит от предыстории системы, а определяется только начальным (к данному моменту времени) условием и конечной целью, и текущее управление должно выбираться с учетом последствий в будущем. Классическим примером оптимального поведения является стратегия бегуна на дальнюю дистанцию. На старте бегун составляет график своего бега так, чтобы пройти дистанцию за минимальное время. Это не значит, что каждый участок он должен бежать как можно быстрее. Наоборот, находясь на дистанции, он в каждый момент времени должен распределять свои силы так, чтобы с учетом своего состояния пробежать оставшийся участок за минимальное время, чему может соответствовать и бурный финиш в конце дистанции.

Динамическому программированию органически присуще решение задач, дискретных по своей природе в силу рекуррентности последовательного выбора управления в многошаговой процедуре оптимизации. Заметим, что принцип оптимальности справедлив как для непрерывных детерминированных, так и для стохастических процессов управления, благодаря чему динамическое программирование может широко применяться в ряде кибернетических задач.

Несмотря на кажущуюся простоту принципа оптимальности из него можно вывести ряд нетривиальных условий оптимальной траектории.

Дискретная форма динамического программирования

Изучение метода начнем с решения одномерной задачи, когда управляемый автономный одномерный объект описывается либо в дискретной форме

либо в дифференциальной форме

которой соответствует разностное уравнение

где u — ограниченное в общем случае управление, т.е. ; Δt — дискрет времени, равный .

При заданном начальном состояний объекта и свободном правом конце необходимо за фиксированное время обеспечить минимум заданного функционала

или в виде аддитивной целевой функции

Таким образом, J есть функция (к + 1) выбираемых переменных , присутствующих в (к +1) уравнениях связи, т.е. можно попытаться решить задачу с помощью множителей Лагранжа. Однако это сложно из-за большой размерности задачи, поэтому применим иной подход.

Страницы: 1 2 3 4 5 6

Еще по теме:

Определение передаточных чисел трансмиссии
Исходя из задания на курсовой проект – автомобиль 6•6 – принимаем следующую схему трансмиссии. 1 – сцепление; 2 – коробка передач; 3,6 – карданные передачи; 4 – задний ведущий мост; 5 – раздаточная коробка; 7 – передний ведущий мост; 8 – шарнир равных угловых скоростей; 9-средний ведущий мост Рисун ...

Построение суточного плана-графика работы грузовой станции
Суточный план-график представляет собой графическое изображение последовательно выполняемых технологических операций по обработке поездов и вагонов, с которыми выполняются грузовые операции в грузовом районе и на подъездных путях с соблюдением необходимых интервалов времени, требований безопасности ...

Расчет параметров электрической передачи тепловоза
Определяем свободную мощность дизеля, передаваемую электрической передачей, кВт: Pен = Ne·вc, (2.1) где Ne - эффективная мощность дизеля, кВт; вc - коэффициент свободной мощности. Pен = 1472·0,92 = 1354,24 кВт. Определяем номинальную мощность синхронного генератора, кВт: PТГ = Pен· зтг, (2.2) где з ...


Навигация

Copyright © 2018 - All Rights Reserved - www.transpexplore.ru