Система определения и реализации оптимальных траекторий управляющих воздействий в условиях неопределенности

 

Полезная модель относится к области автоматического управления и может быть использована при определении оптимальных траекторий управляющих воздействий с одновременным построением модели объекта управления и позволяет расширить функциональные возможности систем оптимизации в условиях неопределенности. Для этого система, содержит последовательно соединенные блоки расчета координат вершин симплекса на поверхности отклика модели объекта, постановки эксперимента в вершинах симплекса с регистрацией данных, расчета координат отраженной вершины симплекса, блок построения новой модели поверхности отклика в той ее области, где еще не определена оптимальная траектория, блок расчета границ адекватности модели, блок определения оптимальной траектории методом динамического программирования в той области поверхности отклика, где еще не определена оптимальная траектория, блок формирования оптимальной траектории и математической модели всей поверхности отклика, вход которого также соединен с входом блоком расчета координат вершин симплекса на поверхности отклика модели объекта. 4 илл.

Полезная модель относится к области автоматического управления и может быть использована при определении оптимальных траекторий управляющих воздействий с одновременным построением модели объекта управления.

Известны схемы оптимизации [Калихман И.Л., Войтенко М.А. Динамическое программирование в примерах и задачах: Учеб. пособие. - М.: Высш. школа, 1979. - 125 с. С[24-30]], реализующие метод динамического программирования и заключающиеся в следующем: выбирают способ деления процесса на шаги; вводят параметры состояния и переменные управления на каждом шаге процесса; записывают уравнение состояния; вводят показатели эффективности на k-ом шаге и суммарный показатель-целевую функцию; вводят в рассмотрение условные максимумы показателя эффективности от k-го шага (включительно) до конца процесса и условные оптимальные управления на k-ом шаге; из ограничений задачи определяют для каждого шага множества допустимых управлений на этом шаге; записывают основные для вычислительной схемы динамического программирования функциональные уравнения Беллмана.

Недостаток этой схемы заключается в низких функциональных возможностях, так как она работает при наличии полных моделей объекта и не предназначена для работы в условиях неопределенности.

Наиболее близкой является система автоматической оптимизации (АС 1310773, G05B 13/00). Функционально эта система представлена следующими блоками: блок расчета координат вершин симплекса на поверхности отклика модели объекта; блок постановки эксперимента в вершинах симплекса с регистрацией данных, состоящий из объекта оптимизации, блока планирования эксперимента, блока памяти, командного блока, анализатора выходов объекта оптимизации; блок расчета координат отраженной вершины симплекса, включающий блок запоминания наилучших входов объекта оптимизации и переключающий блок. При работе этой системы на каждой итерации поиска на объекте оптимизации и его моделях реализуют воздействия, соответствующие всем без исключения вершинам симплекса, обновляя, тем самым, информацию об откликах оптимизируемого объекта. В условиях дрейфа экстремума статических характеристик оптимизируемого объекта, обусловленного изменением свойств, это позволяет исключить ошибочные решения при выборе и отражении наихудших вершин, ускоряя отслеживание дрейфа экстремума, а на каждой итерации поиска производить отражение не одной, а двух наихудших вершин симплекса, сокращая, тем самым, число итераций, необходимых для определения оптимальных воздействий.

Недостатком системы оптимизации являются низкие функциональные возможности, так как, во-первых, она не гарантирует получение оптимальной траектории на всей поверхности отклика и, во-вторых, не выполняет функцию построения математической модели поверхности отклика.

Задача полезной модели - расширение функциональных возможностей систем оптимизации в условиях неопределенности.

Задача полезной модели, достигается тем, что в известную систему, содержащую последовательно соединенные блоки расчета координат вершин симплекса на поверхности отклика модели объекта, постановки эксперимента в вершинах симплекса с регистрацией данных, расчета координат отраженной вершины симплекса, введены подключенные к последнему блоку последовательно соединенные блок построения новой модели поверхности отклика в той ее области, где еще не определена оптимальная траектория, блок расчета границ адекватности модели, блок определения оптимальной траектории методом динамического программирования в той области поверхности отклика, где еще не определена оптимальная траектория, блок формирования оптимальной траектории и математической модели всей поверхности отклика, вход которого также соединен с входом блоком расчета координат вершин симплекса на поверхности отклика модели объекта.

На фиг.1 представлена предлагаемая система определения и реализации оптимальных траекторий управляющих воздействий в условиях неопределенности; на фиг.2 - конкретный вариант реализации блоков системы фиг.1; на фиг.3 - проекция поверхности функции отклика, аппроксимированная математической моделью и оптимальная траектория движения; на фиг.4 - оптимальная траектория движения, полученная по предлагаемой схеме.

Система представляет собой последовательно соединенные блок 1 расчета координат вершин симплекса на поверхности отклика модели объекта, блок 2 постановки эксперимента в вершинах симплекса с регистрацией данных, блок 3 расчета координат отраженной вершины симплекса, блок 4 построения новой модели поверхности отклика в той ее области, где еще не определена оптимальная траектория, блок 5 расчета границ адекватности модели, блок 6 определения оптимальной траектории методом динамического программирования в той области поверхности отклика, где еще не определена оптимальная траектория, блок 7 формирования оптимальной траектории и математической модели всей поверхности отклика, вход которого также соединен с входом блоком 1 расчета координат вершин симплекса на поверхности отклика модели объекта.

Реализация каждого блока приведена ниже:

1. Блок расчета координат вершин симплекса на поверхности отклика модели объекта:

1.1 Выбор объекта оптимизации и установки для проведения натурных экспериментов. Примером объекта оптимизации может быть процесс термоциклической обработки стальной заготовки из стали 30ХГСА на установке индукционного нагрева СЭЛТ 002-120/12-Т;

1.2 Выбор параметров процесса (например, нижняя и верхняя температура цикла Тн, Тв, длительность цикла );

1.3 Выбор целевой функции (например, зависимость твердости в ед. HRC от длительности цикла и Ти: HRC=a1+a2Тв+a0, где a1 , a2, a0 - постоянные коэффициенты);

1.4 Выбор координат начальной точки.

Координаты начальной точки выбираются, исходя из практических соображений в пределах установленных граничных условий (например, HRC0 -твердость стали в нетермообработанном состоянии, при Тв=0 и =0);

1.5 Расчет координат начального симплекса.

Вокруг начальной точки строится исходный симплекс, координаты которого определяются решением уравнений:

,

где xij - координаты вершин симплекса, Ri - радиус окружности, в которую вписан симплекс.

2. Блок постановки эксперимента в вершинах симплекса с регистрацией данных:

2.1 Эксперимент может проводиться следующим образом: металлическую заготовку помещают в индуктор ТВЧ установки и начинают нагрев по заданному температурно-временному режиму (например, при постоянной Т н). Контроль температуры Тв осуществляется при этом с помощью бесконтактного инфракрасного пирометра;

2.2 Регистрация натурных значений целевой функции (зависимость твердости в ед. HRC от длительности цикла и Тв) в заданных точках (вершинах симплекса) может осуществляться по методу Роквелла на твердомере «ТКС-2».

3. Блок расчета координат отраженной вершины симплекса:

3.1 Определение наихудшей вершины симплекса и ее отражение.

Из вершин симплекса выбираются точки: с наименьшим значением функции xh, со следующим по величине значением функции и с наибольшим значением функции. Относительно центра тяжести двух вершин симплекса отражается вершина с наименьшим значением функции (HRC) с коэффициентом (при =1 это будет центральная симметрия).

3.2 Расчет координат новой вершины.

Координаты новой вершины вычисляются по формуле: xr=(1+)xc-·xh, где xh - координаты наихудшей вершины, xc - координаты центра тяжести двух оставшихся вершин симплекса.

4. Блок построения новой модели поверхности отклика в той ее области, где еще не определена оптимальная траектория:

4.1 Выбор структуры модели (например, линейная функция);

4.2 Расчет начальных коэффициентов модели по методу наименьших квадратов решением системы уравнений:

,

где a1, a2, a 0 - искомые постоянные коэффициенты, yz - значение функции в данной точке с координатами x1zx2z ;

4.3 Экстраполяция полученной модели на область, где не определена оптимальная траектория (например, путем распространения путем распространения полученной модели на всю указанную область)

5. Блок расчета границ адекватности модели:

5.1 Расчет границ адекватности модели по выражению HRCmax =d HRCнаилуч, где d - постоянный коэффициент.

6. Блок определения оптимальной траектории методом динамического программирования в той области поверхности отклика, где еще не определена оптимальная траектория:

6.1 Выбор способа деления процесса на шаги (например, по числу циклов термической обработки);

6.2 Выбор параметров состояния , и переменных управления и (например, температура фазового перехода как характеристика структуры металла и температура нагрева в каждом цикле обработки как переменная управления): k=F(k-1; uk), где F - функция состояния, вида k=b1·k-1-b2uk, где b1 , b2 - постоянные коэффициенты, определяемые условиями поставленной задачи.

6.3 Выбор показателя эффективности - целевой функции (например, зависимости твердости в ед. HRC от переменных управления): , где fk - функция, выражаемая уравнением вида, например, Zk=g1·k-1-g2uk, где g1 g2 - постоянные коэффициенты.

6.4 Выбор условных оптимумов целевой функции Zk(k-1) от k-го шага до конца процесса и условных оптимальных управлений на k-ом шаге;

6.5 Определение для каждого шага множества допустимых управлений на этом шаге;

6.6 Решение уравнений Беллмана: Zk(k-1)=max{fn(k-1; uk)+Zk+1(k)} и Zn(n-1)=max{fn(n-1; un} (в результате решения указанных уравнений на условный оптимум получают две последовательности функций: условные оптимумы Zk(k-1) и условные оптимальные управления u k(k-1);

6.7 Определение оптимума целевой функции Zmax=Z(0) и искомого безусловного оптимального управления 0, определяемых выбором наилучших значений из последовательностей, полученных в п.6.6.

7. Блок формирования оптимальной траектории и математической модели всей поверхности отклика:

Сущность предлагаемой полезной модели поясняется на примере, где рассчитанная по предлагаемой схеме поверхность отклика представляет гладкую одноэкстремальную поверхность.

В блоке 1 расчета координат вершин симплекса на поверхности отклика модели объекта выбирались координаты исходной точки A0, показанной на фиг.3. Вокруг этой точки строился правильный симплекс и, согласно блоку 2 постановки эксперимента в вершинах симплекса с регистрацией данных, проводились натурные эксперименты для определения значении функции поверхности отклика. В блоке 3 расчета координат отраженной вершины симплекса проводилась сортировка и вершин симплекса и расчет координат новой вершины. По этим результатам в блоке 4 построения новой модели поверхности отклика в той ее области, где еще не определена оптимальная траектория, по методу наименьших квадратов строилась модель вида y=a1x1+a2x2 +a0. Согласно блоку 5 расчета границ адекватности модели, рассчитывались границы адекватности математической модели. Полученная модель распространялась на всю область исследования объекта. В блоке 6 определения оптимальной траектории методом динамического программирования в той области поверхности отклика, где еще не определена оптимальная траектория методом динамического программирования (по известной модели), определяли оптимальную траекторию движения от точки A1 до A0 в плоскости yI=-1,9x1-1,9x2+1,8. Полученная траектория движения фиксировалась в области адекватности модели (область I, отрезок траектории A02 на фиг.3). Вокруг точки A2 - конечной точки траектории, вновь строился правильный симплекс, в вершинах его проводились натурные эксперименты и рассчитывались коэффициенты математической модели. Определялись границы области адекватности модели. Полученная модель yII=-1,3x1-1,3x2+0,8 также распространялась на всю оставшуюся область исследования. Вновь методом динамического программирования отыскивалась оптимальная траектория движения от точки A3 до точки A2 . Полученная оптимальная траектория A2-A4 - фиксировалась в области II до точки 5 (фиг.4). Итерационная процедура продолжалась до аппроксимации всей исследуемой области математическими моделями. В результате расчетов в блоке 7 формирования оптимальной траектории и математической модели всей поверхности отклика была сформирована оптимальная траектория движения, состоящая из фрагментов A0-A2-A4-A 6-A7, и получена полная математическая модель поверхности отклика, представляющая собой набор аппроксимирующих моделей {yI, yIV}.

Система определения и реализации оптимальных траекторий управляющих воздействий в условиях неопределенности, включающая последовательно соединенные блоки расчета координат вершин симплекса на поверхности отклика модели объекта, постановки эксперимента в вершинах симплекса с регистрацией данных, расчета координат отраженной вершины симплекса, отличающаяся тем, что к последнему последовательно подключены блок построения новой модели поверхности отклика в той ее области, где еще не определена оптимальная траектория, блок расчета границ адекватности модели, блок определения оптимальной траектории методом динамического программирования в той области поверхности отклика, где еще не определена оптимальная траектория, блок формирования оптимальной траектории и математической модели всей поверхности отклика, вход которого соединен также с входом блока расчета координат вершин симплекса на поверхности отклика модели объекта.



 

Похожие патенты:

Изобретение относится к области мониторинга и компьютерного управления инженерным оборудованием (инженерными системами жизнеобеспечения и охраны), оборудованием учета, торговли и сервиса единого объекта, в частности «Научно-производственного логистического центра по совершенствованию сферы обслуживания населения», для оптимизации работы инженерного оборудования, работы персонала и качественного торгово-сервисного обслуживания покупателей
Наверх