Постановка задачи управления безопасным движением. Динамическое программирование

Информация » Задачи управления безопасным движением при встрече с препятствием и выбор метода решения » Постановка задачи управления безопасным движением. Динамическое программирование

Страница 1

Метод динамического программирования, разработанный в 50-х годах американским математиком Р.Беллманом, представляет собой новый подход к решению вариационных задач. Идея этого подхода состоит в том, что оптимальное поведение рассматривается как функция состояния системы, описываемого с помощью значения фазовых координат в текущий момент времени t. Беллман очень точно подметил связь между причинностью и оптимальностью для динамических систем в том смысле, что если изменение состояния любой динамической системы под воздействием входного управляющего сигнала можно описать функциональным уравнением, характеризующим причинность

то у оптимальной системы для описания изменения ее состояния, характеризуемого некоторой функцией как степень достижения подавленной цели, существует по аналогии такого же типа функциональной уравнение лишь с той разницей, что достигается минимум или максимум целевой функции при выборе управления :

При этом выбор управления на отдельном шаге производится с точки зрения интересов не только данного шага, но и всего процесса в целом, как на текущем, так и на всех последующих шагах.

Исходя из этого, Беллманом был сформулирован принцип оптимальности: каковы бы ни были начальное состояние и начальное управление, последующие управления должны быть оптимальными относительно состояния, являющегося результатом применения первого управления. Принцип оптимальности можно также сформулировать следующим образом: оптимальное поведение не зависит от предыстории системы, а определяется только начальным (к данному моменту времени) условием и конечной целью, и текущее управление должно выбираться с учетом последствий в будущем. Классическим примером оптимального поведения является стратегия бегуна на дальнюю дистанцию. На старте бегун составляет график своего бега так, чтобы пройти дистанцию за минимальное время. Это не значит, что каждый участок он должен бежать как можно быстрее. Наоборот, находясь на дистанции, он в каждый момент времени должен распределять свои силы так, чтобы с учетом своего состояния пробежать оставшийся участок за минимальное время, чему может соответствовать и бурный финиш в конце дистанции.

Динамическому программированию органически присуще решение задач, дискретных по своей природе в силу рекуррентности последовательного выбора управления в многошаговой процедуре оптимизации. Заметим, что принцип оптимальности справедлив как для непрерывных детерминированных, так и для стохастических процессов управления, благодаря чему динамическое программирование может широко применяться в ряде кибернетических задач.

Несмотря на кажущуюся простоту принципа оптимальности из него можно вывести ряд нетривиальных условий оптимальной траектории.

Дискретная форма динамического программирования

Изучение метода начнем с решения одномерной задачи, когда управляемый автономный одномерный объект описывается либо в дискретной форме

либо в дифференциальной форме

которой соответствует разностное уравнение

где u — ограниченное в общем случае управление, т.е. ; Δt — дискрет времени, равный .

При заданном начальном состояний объекта и свободном правом конце необходимо за фиксированное время обеспечить минимум заданного функционала

или в виде аддитивной целевой функции

Таким образом, J есть функция (к + 1) выбираемых переменных , присутствующих в (к +1) уравнениях связи, т.е. можно попытаться решить задачу с помощью множителей Лагранжа. Однако это сложно из-за большой размерности задачи, поэтому применим иной подход.

Страницы: 1 2 3 4 5 6

Еще по теме:

Организация работ
Работы по капитальному ремонту пути делятся на: * подготовительные, выполняемые до и во день «окна»; * основные, выполняемые в «окно»; * заключительные, выполняемые в день «окна» после открытия перегона; * отделочные, выполняемые после «окна». Подготовительные работы Подготовительные работы подразд ...

Электронная система измерения величины подачи топлива
подача топливо контроль температура Электронная система вместо измерительных мензурок работает с модулем обслуживания, а также с экранным и расчетным модулями. Все три модуля объединены в единый блок 6 (рис1), устанавливаемый обычно на испытательном стенде, однако во время дорожных испытаний он мож ...

Мероприятия по охране труда и технике безопасности
8. Собирайте первичный вал в порядке, обратном разборке. Задний подшипник напрессовывайте на вал, прикладывая усилие только к внутреннему кольцу, иначе подшипник будет поврежден. Общие требования безопасности. 1.1. Выполняйте только порученную Вам работу. 1.2. К ремонту автомобилей допускаются лица ...


Навигация

Copyright © 2020 - All Rights Reserved - www.transpexplore.ru