Адаптивная система управления с идентификатором и неявной эталонной моделью
Изобретение относится к системам автоматического управления динамическими объектами широкого класса с неизвестными переменными параметрами и неконтролируемыми возмущениями. Технический результат заключается в упрощении условий и сокращении времени для достижения цели адаптации замкнутой системы управления, а также в расширении области применения системы на класс существенно нестационарных (нелинейных с текущей линеаризацией) объектов управления с неконтролируемыми внешними возмущениями. Технический результат достигается за счет того, что система содержит сумматор, первый и второй регуляторы, фильтр низких частот, объект управления, блок текущей идентификации, блок априорной информации о матрице эффективности управления и блок настройки регуляторов. 1 ил.
Изобретение относится к системам автоматического управления динамическими объектами широкого класса с неизвестными переменными параметрами и неконтролируемыми возмущениями.
Прототипом изобретения является беспоисковая адаптивная система управления с непрямым адаптивным управлением и неявной эталонной моделью, описанная в работе [1, с. 492]. Структурная схема адаптивной системы управления для объектов с неконтролируемыми возмущениями включает в себя сумматор, два регулятора (один в прямой и один в обратной связи), объект управления и контур адаптации. Последний в свою очередь состоит из блока текущей идентификации, блока настройки регуляторов и логического блока, осуществляющего переключение работы контура адаптации с цикла идентификации на цикл настройки регуляторов и наоборот. Рассмотрим построение такой системы управления для следующей задачи. Пусть объект управления (ОУ) описывается следующим матричным дифференциальным уравнением
, где x
Rn - непосредственно измеряемый вектор состояния ОУ; x
Rm - вектор управления (в дальнейшем - закон управления); f - вектор неконтролируемых внешних возмущений, ограниченный по норме; A, B и D - матрицы неизвестных параметров ОУ с соответствующими размерностями, в общем случае переменные;
- непосредственно измеряется или аналитически вычисляется по x. Адаптивная система должна формировать такой закон управления, чтобы ОУ вел себя подобно эталонной модели, которая задана неявным образом в виде следующего дифференциального уравнения:
где xм - вектор состояния модели; uм - ограниченное по норме входное воздействие модели; размерности соответствуют уравнению (1); Aм и Bм - матрицы параметров модели в общем случае переменные, причем Aм - гурвицева матрица (вещественные части собственных ее чисел строго отрицательны). Точный закон управления можно найти только тогда, когда выполнено условие полного соответствия моделей [2]. rankB = rank(B, Aм - A) = rank(B, Bм) = rank(B, D) или, что тождественноBB+(Aм - A) = Aм - A; BB+Bм = Bм; BB+D = D, (3)
где
B+ - псевдообратная матрица к B. В дальнейшем будем считать, что условие (3) выполнено, тогда управление, которое назовем точным
u* = B+[(Aм - A)x + Bмuм - Df],
обеспечит асимптотические свойства ошибки адаптации:
. Действительно, подставляя (4) в уравнение (1), учитывая (3) и (2), получим уравнение ошибки адаптации
Однако по условию матрицы A, B и D неизвестны и внешние возмущения неизмеряемы, поэтому вместо (4) используется закон управления
,где
- оценки матриц A и B, доставляемые блоком текущей идентификации. Обновление параметров в законе управления производится циклически по управлению с логического блока. Блок текущей идентификации может быть построен на основе одного из известных алгоритмов идентификации. Таким образом, замкнутая адаптивная система управления описывается уравнениями (1), (2), (5) при условии (3), а также включает алгоритм текущей идентификации и алгоритм переключения режимов работы контура адаптации. В работах [1, 3, 4] указывается, что для достижения цели адаптации: с течением времени e _
0 - требуется отсутствие неизвестных возмущений, а также необходимо иметь асимптотические оценки
в конце цикла идентификации. Такое достаточно жесткое требование порождает ряд недостатков системы [3, 4]:- необходимость обеспечения процесса управления стойким возбуждающим входным сигналом порядка не менее n;
- невозможность точной оценки параметров ОУ в замкнутой системе управления на некоторых режимах, например, на режиме стабилизации, когда uм = 0, что объясняется линейной зависимостью компонент вектор-функций x(t) и u(t), где t - текущее время;
- большое влияние на качество идентификации и управления неконтролируемых внешних возмущений;
- невысокая скорость адаптации, поскольку параметры закона управления корректируются только в конце цикла идентификации. Следует также отметить, что затянутость по времени процесса оценивания неизвестных параметров ОУ обусловливает известное мнение о том, что указанная система на практике может обеспечить приемлемое качество управления только для линейных стационарных или квазистационарных ОУ. Целью изобретения является упрощение условий и сокращение времени для достижения цели адаптации замкнутой системы управления, а также расширение области применения системы на класс существенно нестационарных (нелинейных с текущей линеаризацией) объектов управления с неконтролируемыми внешними возмущениями. Для теоретического обоснования достижения цели рассмотрим вопрос адаптации в непрерывной постановке при отсутствии возмущений (Df
O). В качестве алгоритма текущей идентификации будем использовать алгоритм типа стохастической апроксимации, который в непрерывной постановке описывается следующим образом [5]:
,где
C = [A, B];
- ошибка идентификации; xтр = [xт,uт] - расширенный вектор состояния ОУ; Г - в общем случае переменная положительно определенная квадратная матрица размерностью (n + m), или скаляр; норма матрицы
- ограничена. Из теории идентификации известно, что алгоритм (6) обладает более простыми и лучшими свойствами сходимости к нулю
по сравнению со сходимостью оценок параметров. Действительно, если назначить функцию Ляпунова вида V =
т
, то ее производная на уравнении (6) имеет вид
Уравнение (7) показывает, что при ограниченных нормах
(это справедливо для подавляющего большинства прикладных задач) и при достаточно большой норме матрицы Г с течением времени
_
0 , причем без каких-либо дополнительных условий. Также можно указать, что уравнение (6) описывает динамическую систему с матрицей собственного движения xpxтpГ , которая имеет единственное ненулевое собственное число xТpГxp , равное собственной частоте системы, или собственной частоте алгоритма идентификации (
a) . В связи с указанным найдем зависимость ошибки адаптации от ошибки идентификации. Для этого вычтем из уравнения (1) уравнение (2), получим
Прибавляя и вычитая из правой части полученного Aмx, комбинируя слагаемые и учитывая (3), (4), найдем

Для поиска зависимости невязки B(u - u*) от
уравнение (5) с учетом равенств (3), (4), (6) и (1) запишем в виде
Последнее слагаемое вынесено за скобки в силу очевидного равенства
. Отсюда следует, что
Уравнение (9) показывает, что его выражение в квадратных скобках всегда ортогонально строкам матрицы
, или, согласно свойствам псевдообратной матрицы, - столбцам матрицы
[6]. В связи с этим общее решение уравнения (9) будет иметь видB(u-u*)-
= 
, (10), ,где
- матрица такая, что
;
- произвольный вектор соответствующей размерности. Уравнения (8) и (10) описывают искомый результат. Очевидно, наиболее важным является случай, когда в уравнении (10) невязка B(u - u*) не зависит от неопределенного член 
. Одним из возможных вариантов этого является случай, когда выполняется условие [7]
Для того чтобы доказать это утверждение, предположим, что rankB = k
min (n, m). Тогда матрицу B можно представить через скелетное разложение в виде [6]
,где
F и L - матрицы размерностью n
k и k
m соответственно такие, что rankF = rankL = k. В этом случае равенство (11) влечет за собой выполнения условия
, или, согласно свойствам псевдообратной матрицы,
. Последнее обуславливает то, что
, где Ek - единичная k
k матрица [6]. Следовательно, умножение уравнения (10) слева на матрицу
ограниченной нормы дает
. В свою очередь, частным к условию (11) является случай, когда столбцы матрицы B линейно зависимы со столбцами
, т.е. 
Действительно, в этом случае строки матрицы B+ линейно зависимы со строками матрицы
, и на основании (10) B+
= 0 . В результате умножение уравнения (10) слева на матрицу BB+
дает вместо (12)B(u-u*) = BB+
. . Таким образом, если выполнено хотя бы одно из условий: (11) или (13), то уравнение ошибки адаптации описывается простым линейным дифференциальным уравнением
,где
матрица K имеет ограниченную норму, т.е. при
_
0 достигается цель адаптации. Следует однако отметить, что для выполнения условия
_
0 требуется
, но последнее согласно свойствам уравнений (6) и (7) приводит к увеличению скорости изменения оценок, возрастанию норм
, что препятствует сходимости ошибки идентификации и может привести к возникновению высокочастотных резонансных явлений. Для устранения этого неблагоприятного факта примем во внимание, что, как правило, рабочие частоты ОУ находятся в низкочастотной области. Поэтому достаточно управление (5) пропускать через фильтр низких частот с частотой среза (
ф) меньшей, чем
a , но превышающей диапазон рабочих частот ОУ. Действительно, фильтрация управления соответствует устранению высокочастотной составляющей оценки
с сохранением ее низкочастотной части
. Последняя образует низкочастотную составляющую ошибки идентификации:
. Поскольку выбором матрицы Г обеспечено стремление к нулю ошибки идентификации, то стремится к нулю и указанная ее низкочастотная часть. Следовательно, в области рабочих частот ОУ будут наблюдаться асимптотические свойства ошибки адаптации. Из изложенного следует ряд выводов:- требование асимптотической точности оценок параметров ОУ является лишь частным случаем достижения цели адаптации;
- цель адаптации можно достигнуть, если наложить довольно слабые ограничения (11) или (13) на оценку матрицы эффективности управления объекта (если B - скаляр, то достаточно
; эти ограничения не основаны на собственных динамических свойствах ОУ и могут быть получены из небольшой априорной информации об управляемом объекте; для выполнения условия (11) или (13) в структурную схему системы целесообразно ввести блок априорной информации о матрице эффективности управления объекта; по сигналам с этого блока будет производиться коррекция текущей оценки
;- выбором матрицы Г алгоритма идентификации (6) можно всегда добиться требуемой скорости сходимости ошибки идентификации
, что дает, во-первых, увеличение скорости адаптации замкнутой системы, а, во-вторых, - возможность: организации непрерывной подстройки закона управления по текущим оценкам параметров ОУ, устранения цикличности работы контура адаптации, а следовательно, и устранения логического блока;- нет никаких дополнительных требований к входному сигналу ОУ, кроме u
0 , и поэтому адаптивная система управления может функционировать на фоне естественных управляющих сигналов;- возможно расширение области применения адаптивной системы на класс существенно нестационарных (нелинейных с текущей линеаризацией) ОУ, у которых скорость изменения параметров ограничена;
- в связи с тем, что качество адаптации явно не зависит от качества оценок, доставляемых идентификатором, возможно использование системы при воздействии на ОУ неконтролируемых внешних возмущений, ограниченных по норме; действительно, в этом случае ошибка идентификации будет иметь вид
, а уравнение (7) - соответственно
,остальные уравнения останутся прежними; в области рабочих частот ОУ норма матрицы
ограничена, и поэтому выбором матрицы Г всегда возможно в указанной области частот добиться сходимости
и e . Следует отметить, что если алгоритм идентификации дискретный, то требованиями сходимости
являются: во-первых, все собственные числа матрицы Гi должны находится в пределах
, а, во-вторых, период дискретизации алгоритма должен быть достаточно малым (i - текущий момент времени). Это следует из рассмотрения уравнения (6) в разностном виде
,где
- определяется дискретным алгоритмом идентификации. Умножим последнее равенство справа на xpi, получим
При достаточно малом шаге дискретизации
,и поэтому можно записать
i+1
i(1-xTpiГixpi). . Сходимость дискретной ошибки
будет иметь место, если выражение в круглых скобках последнего равенства будет по модулю меньше единицы, или 0 < xTpiГixpi< 2. . Поделив это неравенство на xTpixpi и используя отношение Релея [6], найдем указанные требования к матрице Гi. Для дискретной формы алгоритма
a= xTpiГixpi/H , где H - шаг дискретизации. Полученные выводы, в частности, подтверждаются численными исследованиями, результаты которых приведены в работе [7]. На чертеже представлена структурная схема дискретной адаптивной системы управления с идентификатором и неявной эталонной моделью. Структурная схема содержит сумматор 1, первый 2 и второй 3 регуляторы, фильтр 4 низких частот, объект 5 управления, блок 6 текущей идентификации, блок 7 априорной информации о матрице эффективности управления объект, блок 8 настройки регуляторов. Адаптивная система работает следующим образом. Задающее воздействие в виде [BмUм]t подается на первый вход сумматора 1. На второй вход сумматора поступает сигнал с выхода второго регулятора 3. Выход сумматора связан с первым входом первого регулятора 2, этот регулятор окончательно формирует управление в соответствии с зависимостью
Выход первого регулятора связан со входом фильтра 4 низких частот, пропускающего рабочие частоты ОУ. Выход фильтра связан со входом объекта 5 управления и с первым входом блока 6 текущей идентификации. Выход объекта управления связан с первым входом второго регулятора 3, преобразующего входной сигнал xi в виде
,и со вторым входом блока текущей идентификации. Выход блока 7 априорной информации о матрице эффективности управления объекта подключен к третьему входу блока текущей идентификации. Блок текущей идентификации по входным сигналам с объекта управления:
- формирует текущие оценки параметров ОУ. Вектор
может либо непосредственно измеряться, либо аналитически вычисляться в блоке текущей идентификации по текущим значениям x, например, на основе полиномиальной или тригономтрической аппроксимации на скользящем интервале /8/. Алгоритм текущей идентификации блока 6 относится к классу алгоритмов типа стохастической аппроксимации, в качестве которого можно использовать алгоритм, описанный в работе /9/
Здесь
a= H-1 - выбирается из условия
a>
ф . Для выполнения требований (11) или (13) на каждом шаге идентификации в блоке 6 производится коррекция оценки
. Такая коррекция должна быть с "минимальным" изменением исходной матрицы и может быть организована следующим образом. Блок 7 выдает в блок текущей идентификации информацию о матрице B0 размерностью n
m. Эта матрица учитывает априорную информацию о матрице эффективности управления объекта в виде соблюдения равенстваrank(BToB) = rankB, (14) ,
Предположим, что
,где
Gi - какая-то матрица размерностью m
m. Оценку
определим как
,где
i - минимальная по норме добавка до невырожденности матрицы
. Эта добавка может быть получена, например, на основе разложения квадратной матрицы
на треугольные сомножители [6] с минимальной коррекцией последовательной процедуры разложения с целью устранения нулевых диагональных элементов сомножителей. Полученные сомножители в дальнейшем перемножаются, формируя
. Скорректированная оценка будет иметь вид
. Тогда
,что следует из равенства (14) и утверждения о том, что умножение любой матрицы на невырожденную соответствующей размерности не изменяет ранга исходной матрицы /6/. Оценка
используется при формировании управления и заменяет оценку
для следующего шага алгоритма идентификации. Выход блока текущей идентификации, через который выдаются оценки
, связан с блоком 8 настройки регуляторов. Этот блок вычисляет
. Для реализации псевдообращения матриц можно использовать последовательный метод Гревилля [6]. Первый выход блока 8 связан со вторым входом первого регулятора, по нему передается информация о
. Второй выход блока 8 связан со вторым входом второго регулятора, по нему передается информация о матрице
. Литература:1. Справочник по теории автоматического управления./Под ред. А.А.Красовского. - М.: Наука, Гл. ред. физ. - мат. лит., 1987. - 712 с. (прототип). 2. Уткин В.Н. Скользящие режимы в задачах оптимизации и управления. - М. : Наука, 1981. 3. Изерман Р. Цифровые системы управления: Пер. с англ. - М.: Мир, 1984, 541 с. 4. Острем К.И. Адаптивное управление с обратной связью//ТИИЭР - 1987, N 2, т. 75, с. 4 - 45. 5. Цыпкин Я.З. Основы информационной теории идентификации. - М.: Наука. Гл. ред. фиг.-мат. лит., 1984. 320 с. 6. Гантмахер Ф.Р. Теория матриц. - М.: Наука, Гл. ред. физ.-мат. лит., 1988, с. 552. 7. Буков В.Н., Круглов С.П., Решетняк Е.П. Адаптируемость линейной динамической системы с идентификатором и эталонной моделью//Автоматика и телемеханика - 1994, N 3, с. 99 - 107. 8. Пашковский И.М., Леонов В.А., Поплавский Б.К. Летные испытания самолетов и обработка результатов испытаний. - М.: Машиностроение, с. 416, 1985. 9. Гроп Д. Методы идентификации систем: Пер. с англ. - М.: Мир, 1979, с. 302.
Формула изобретения
РИСУНКИ
Рисунок 1




















