Постановка задачи управления безопасным движением. Динамическое программирование

Информация » Задачи управления безопасным движением при встрече с препятствием и выбор метода решения » Постановка задачи управления безопасным движением. Динамическое программирование

Страница 1

Метод динамического программирования, разработанный в 50-х годах американским математиком Р.Беллманом, представляет собой новый подход к решению вариационных задач. Идея этого подхода состоит в том, что оптимальное поведение рассматривается как функция состояния системы, описываемого с помощью значения фазовых координат в текущий момент времени t. Беллман очень точно подметил связь между причинностью и оптимальностью для динамических систем в том смысле, что если изменение состояния любой динамической системы под воздействием входного управляющего сигнала можно описать функциональным уравнением, характеризующим причинность

то у оптимальной системы для описания изменения ее состояния, характеризуемого некоторой функцией как степень достижения подавленной цели, существует по аналогии такого же типа функциональной уравнение лишь с той разницей, что достигается минимум или максимум целевой функции при выборе управления :

При этом выбор управления на отдельном шаге производится с точки зрения интересов не только данного шага, но и всего процесса в целом, как на текущем, так и на всех последующих шагах.

Исходя из этого, Беллманом был сформулирован принцип оптимальности: каковы бы ни были начальное состояние и начальное управление, последующие управления должны быть оптимальными относительно состояния, являющегося результатом применения первого управления. Принцип оптимальности можно также сформулировать следующим образом: оптимальное поведение не зависит от предыстории системы, а определяется только начальным (к данному моменту времени) условием и конечной целью, и текущее управление должно выбираться с учетом последствий в будущем. Классическим примером оптимального поведения является стратегия бегуна на дальнюю дистанцию. На старте бегун составляет график своего бега так, чтобы пройти дистанцию за минимальное время. Это не значит, что каждый участок он должен бежать как можно быстрее. Наоборот, находясь на дистанции, он в каждый момент времени должен распределять свои силы так, чтобы с учетом своего состояния пробежать оставшийся участок за минимальное время, чему может соответствовать и бурный финиш в конце дистанции.

Динамическому программированию органически присуще решение задач, дискретных по своей природе в силу рекуррентности последовательного выбора управления в многошаговой процедуре оптимизации. Заметим, что принцип оптимальности справедлив как для непрерывных детерминированных, так и для стохастических процессов управления, благодаря чему динамическое программирование может широко применяться в ряде кибернетических задач.

Несмотря на кажущуюся простоту принципа оптимальности из него можно вывести ряд нетривиальных условий оптимальной траектории.

Дискретная форма динамического программирования

Изучение метода начнем с решения одномерной задачи, когда управляемый автономный одномерный объект описывается либо в дискретной форме

либо в дифференциальной форме

которой соответствует разностное уравнение

где u — ограниченное в общем случае управление, т.е. ; Δt — дискрет времени, равный .

При заданном начальном состояний объекта и свободном правом конце необходимо за фиксированное время обеспечить минимум заданного функционала

или в виде аддитивной целевой функции

Таким образом, J есть функция (к + 1) выбираемых переменных , присутствующих в (к +1) уравнениях связи, т.е. можно попытаться решить задачу с помощью множителей Лагранжа. Однако это сложно из-за большой размерности задачи, поэтому применим иной подход.

Страницы: 1 2 3 4 5 6

Еще по теме:

Расход воды
Расчет расхода воды для СТО: Оборотной: Qоб = Х*3,0 = 81*0.15 =12.15 м3/сутки Где X – кол-во постов; 0.15 – средний расход оборотной воды на один пост м3/сутки; Свежей: технической Qт = 0.1Х =81*0.1 = 8.1 м3/сутки Питьевой Qпр = 0.05Х = 0.05*81 = 4.05 м3/сутки Где 0.1 – расход свежей технической во ...

Расчет и построение тягово-динамических характеристик
Тяговая характеристика представляет собой графическую зависимость на различных передачах Ра = f (V) и является основным документом, характеризующим тягово-динамические качества машины. Расчет тяговой характеристики производится в следующем порядке. Для построения кривых Ра = f (V) необходимо опреде ...

Анализ конструкций конечных передач
Назначение, классификация, требования и устройство. Конечной передачей называется агрегат трансмиссии, размещенный между ведущим колесом и дифференциалом колесного трактора или механизмом поворота гусеничного трактора. Число конечных передач трактора зависит от количества его ведущих колес. Конечны ...


Навигация

Copyright © 2020 - All Rights Reserved - www.transpexplore.ru