Изобретение относится к системам автоматического управления динамическими объектами широкого класса с неизвестными переменными параметрами и неконтролируемыми возмущениями. Технический результат заключается в упрощении условий и сокращении времени для достижения цели адаптации замкнутой системы управления, а также в расширении области применения системы на класс существенно нестационарных (нелинейных с текущей линеаризацией) объектов управления с неконтролируемыми внешними возмущениями. Технический результат достигается за счет того, что система содержит сумматор, первый и второй регуляторы, фильтр низких частот, объект управления, блок текущей идентификации, блок априорной информации о матрице эффективности управления и блок настройки регуляторов. 1 ил.
Изобретение относится к системам автоматического управления динамическими объектами широкого класса с неизвестными переменными параметрами и неконтролируемыми возмущениями.
Прототипом изобретения является беспоисковая адаптивная система управления с непрямым адаптивным управлением и неявной эталонной моделью, описанная в работе [1, с. 492]. Структурная схема адаптивной системы управления для объектов с неконтролируемыми возмущениями включает в себя сумматор, два регулятора (один в прямой и один в обратной связи), объект управления и контур адаптации. Последний в свою очередь состоит из блока текущей идентификации, блока настройки регуляторов и логического блока, осуществляющего переключение работы контура адаптации с цикла идентификации на цикл настройки регуляторов и наоборот.
Рассмотрим построение такой системы управления для следующей задачи. Пусть объект управления (ОУ) описывается следующим матричным дифференциальным уравнением

, где x

R
n - непосредственно измеряемый вектор состояния ОУ; x

R
m - вектор управления (в дальнейшем - закон управления); f - вектор неконтролируемых внешних возмущений, ограниченный по норме; A, B и D - матрицы неизвестных параметров ОУ с соответствующими размерностями, в общем случае переменные;

- непосредственно измеряется или аналитически вычисляется по x.
Адаптивная система должна формировать такой закон управления, чтобы ОУ вел себя подобно эталонной модели, которая задана неявным образом в виде следующего дифференциального уравнения:

где x
м - вектор состояния модели; u
м - ограниченное по норме входное воздействие модели; размерности соответствуют уравнению (1); A
м и B
м - матрицы параметров модели в общем случае переменные, причем A
м - гурвицева матрица (вещественные части собственных ее чисел строго отрицательны).
Точный закон управления можно найти только тогда, когда выполнено условие полного соответствия моделей [2].
rankB = rank(B, A
м - A) = rank(B, B
м) = rank(B, D) или, что тождественно
BB
+(A
м - A) = A
м - A; BB
+B
м = B
м; BB
+D = D, (3)
где
B
+ - псевдообратная матрица к B. В дальнейшем будем считать, что условие (3) выполнено, тогда управление, которое назовем точным
u
* = B
+[(A
м - A)x + B
мu
м - Df],
обеспечит асимптотические свойства ошибки адаптации:

. Действительно, подставляя (4) в уравнение (1), учитывая (3) и (2), получим уравнение ошибки адаптации

Однако по условию матрицы A, B и D неизвестны и внешние возмущения неизмеряемы, поэтому вместо (4) используется закон управления

,
где

- оценки матриц A и B, доставляемые блоком текущей идентификации. Обновление параметров в законе управления производится циклически по управлению с логического блока. Блок текущей идентификации может быть построен на основе одного из известных алгоритмов идентификации.
Таким образом, замкнутая адаптивная система управления описывается уравнениями (1), (2), (5) при условии (3), а также включает алгоритм текущей идентификации и алгоритм переключения режимов работы контура адаптации.
В работах [1, 3, 4] указывается, что для достижения цели адаптации: с течением времени e _

0 - требуется отсутствие неизвестных возмущений, а также необходимо иметь асимптотические оценки

в конце цикла идентификации. Такое достаточно жесткое требование порождает ряд недостатков системы [3, 4]:
- необходимость обеспечения процесса управления стойким возбуждающим входным сигналом порядка не менее n;
- невозможность точной оценки параметров ОУ в замкнутой системе управления на некоторых режимах, например, на режиме стабилизации, когда u
м = 0, что объясняется линейной зависимостью компонент вектор-функций x(t) и u(t), где t - текущее время;
- большое влияние на качество идентификации и управления неконтролируемых внешних возмущений;
- невысокая скорость адаптации, поскольку параметры закона управления корректируются только в конце цикла идентификации.
Следует также отметить, что затянутость по времени процесса оценивания неизвестных параметров ОУ обусловливает известное мнение о том, что указанная система на практике может обеспечить приемлемое качество управления только для линейных стационарных или квазистационарных ОУ.
Целью изобретения является упрощение условий и сокращение времени для достижения цели адаптации замкнутой системы управления, а также расширение области применения системы на класс существенно нестационарных (нелинейных с текущей линеаризацией) объектов управления с неконтролируемыми внешними возмущениями.
Для теоретического обоснования достижения цели рассмотрим вопрос адаптации в непрерывной постановке при отсутствии возмущений (Df

O). В качестве алгоритма текущей идентификации будем использовать алгоритм типа стохастической апроксимации, который в непрерывной постановке описывается следующим образом [5]:

,
где
C = [A, B];

- ошибка идентификации; x
тр = [x
т,u
т] - расширенный вектор состояния ОУ; Г - в общем случае переменная положительно определенная квадратная матрица размерностью (n + m), или скаляр; норма матрицы

- ограничена. Из теории идентификации известно, что алгоритм (6) обладает более простыми и лучшими свойствами сходимости к нулю

по сравнению со сходимостью оценок параметров. Действительно, если назначить функцию Ляпунова вида V =
т
, то ее производная на уравнении (6) имеет вид

Уравнение (7) показывает, что при ограниченных нормах

(это справедливо для подавляющего большинства прикладных задач) и при достаточно большой норме матрицы Г с течением времени

_

0 , причем без каких-либо дополнительных условий. Также можно указать, что уравнение (6) описывает динамическую систему с матрицей собственного движения x
px
тpГ , которая имеет единственное ненулевое собственное число x
ТpГx
p , равное собственной частоте системы, или собственной частоте алгоритма идентификации (
a) .
В связи с указанным найдем зависимость ошибки адаптации от ошибки идентификации. Для этого вычтем из уравнения (1) уравнение (2), получим

Прибавляя и вычитая из правой части полученного A
мx, комбинируя слагаемые и учитывая (3), (4), найдем

Для поиска зависимости невязки B(u - u
*) от

уравнение (5) с учетом равенств (3), (4), (6) и (1) запишем в виде

Последнее слагаемое вынесено за скобки в силу очевидного равенства

. Отсюда следует, что

Уравнение (9) показывает, что его выражение в квадратных скобках всегда ортогонально строкам матрицы

, или, согласно свойствам псевдообратной матрицы, - столбцам матрицы

[6]. В связи с этим общее решение уравнения (9) будет иметь вид
B(u-u
*)-

=


, (10), ,
где

- матрица такая, что

;

- произвольный вектор соответствующей размерности. Уравнения (8) и (10) описывают искомый результат.
Очевидно, наиболее важным является случай, когда в уравнении (10) невязка B(u - u
*) не зависит от неопределенного член


. Одним из возможных вариантов этого является случай, когда выполняется условие [7]

Для того чтобы доказать это утверждение, предположим, что rankB = k

min (n, m). Тогда матрицу B можно представить через скелетное разложение в виде [6]

,
где
F и L - матрицы размерностью n

k и k

m соответственно такие, что rankF = rankL = k. В этом случае равенство (11) влечет за собой выполнения условия

, или, согласно свойствам псевдообратной матрицы,

. Последнее обуславливает то, что

, где E
k - единичная k

k матрица [6]. Следовательно, умножение уравнения (10) слева на матрицу

ограниченной нормы дает

.
В свою очередь, частным к условию (11) является случай, когда столбцы матрицы B линейно зависимы со столбцами

, т.е.

Действительно, в этом случае строки матрицы B
+ линейно зависимы со строками матрицы

, и на основании (10) B
+
= 0 . В результате умножение уравнения (10) слева на матрицу BB
+ 
дает вместо (12)
B(u-u
*) = BB
+
. .
Таким образом, если выполнено хотя бы одно из условий: (11) или (13), то уравнение ошибки адаптации описывается простым линейным дифференциальным уравнением

,
где
матрица K имеет ограниченную норму, т.е. при

_

0 достигается цель адаптации.
Следует однако отметить, что для выполнения условия

_

0 требуется

, но последнее согласно свойствам уравнений (6) и (7) приводит к увеличению скорости изменения оценок, возрастанию норм

, что препятствует сходимости ошибки идентификации и может привести к возникновению высокочастотных резонансных явлений. Для устранения этого неблагоприятного факта примем во внимание, что, как правило, рабочие частоты ОУ находятся в низкочастотной области. Поэтому достаточно управление (5) пропускать через фильтр низких частот с частотой среза (
ф) меньшей, чем
a , но превышающей диапазон рабочих частот ОУ. Действительно, фильтрация управления соответствует устранению высокочастотной составляющей оценки

с сохранением ее низкочастотной части

. Последняя образует низкочастотную составляющую ошибки идентификации:

. Поскольку выбором матрицы Г обеспечено стремление к нулю ошибки идентификации, то стремится к нулю и указанная ее низкочастотная часть. Следовательно, в области рабочих частот ОУ будут наблюдаться асимптотические свойства ошибки адаптации.
Из изложенного следует ряд выводов:
- требование асимптотической точности оценок параметров ОУ является лишь частным случаем достижения цели адаптации;
- цель адаптации можно достигнуть, если наложить довольно слабые ограничения (11) или (13) на оценку матрицы эффективности управления объекта (если B - скаляр, то достаточно

; эти ограничения не основаны на собственных динамических свойствах ОУ и могут быть получены из небольшой априорной информации об управляемом объекте; для выполнения условия (11) или (13) в структурную схему системы целесообразно ввести блок априорной информации о матрице эффективности управления объекта; по сигналам с этого блока будет производиться коррекция текущей оценки

;
- выбором матрицы Г алгоритма идентификации (6) можно всегда добиться требуемой скорости сходимости ошибки идентификации

, что дает, во-первых, увеличение скорости адаптации замкнутой системы, а, во-вторых, - возможность: организации непрерывной подстройки закона управления по текущим оценкам параметров ОУ, устранения цикличности работы контура адаптации, а следовательно, и устранения логического блока;
- нет никаких дополнительных требований к входному сигналу ОУ, кроме u

0 , и поэтому адаптивная система управления может функционировать на фоне естественных управляющих сигналов;
- возможно расширение области применения адаптивной системы на класс существенно нестационарных (нелинейных с текущей линеаризацией) ОУ, у которых скорость изменения параметров ограничена;
- в связи с тем, что качество адаптации явно не зависит от качества оценок, доставляемых идентификатором, возможно использование системы при воздействии на ОУ неконтролируемых внешних возмущений, ограниченных по норме; действительно, в этом случае ошибка идентификации будет иметь вид

, а уравнение (7) - соответственно

,
остальные уравнения останутся прежними; в области рабочих частот ОУ норма матрицы

ограничена, и поэтому выбором матрицы Г всегда возможно в указанной области частот добиться сходимости

и e .
Следует отметить, что если алгоритм идентификации дискретный, то требованиями сходимости

являются: во-первых, все собственные числа матрицы Г
i должны находится в пределах

, а, во-вторых, период дискретизации алгоритма должен быть достаточно малым (i - текущий момент времени). Это следует из рассмотрения уравнения (6) в разностном виде

,
где

- определяется дискретным алгоритмом идентификации. Умножим последнее равенство справа на x
pi, получим

При достаточно малом шаге дискретизации

,
и поэтому можно записать
i+1
i(1-x
TpiГ
ix
pi). . Сходимость дискретной ошибки

будет иметь место, если выражение в круглых скобках последнего равенства будет по модулю меньше единицы, или 0 < x
TpiГ
ix
pi< 2. . Поделив это неравенство на x
Tpix
pi и используя отношение Релея [6], найдем указанные требования к матрице Г
i. Для дискретной формы алгоритма
a= x
TpiГ
ix
pi/H , где H - шаг дискретизации.
Полученные выводы, в частности, подтверждаются численными исследованиями, результаты которых приведены в работе [7].
На чертеже представлена структурная схема дискретной адаптивной системы управления с идентификатором и неявной эталонной моделью.
Структурная схема содержит сумматор 1, первый 2 и второй 3 регуляторы, фильтр 4 низких частот, объект 5 управления, блок 6 текущей идентификации, блок 7 априорной информации о матрице эффективности управления объект, блок 8 настройки регуляторов.
Адаптивная система работает следующим образом.
Задающее воздействие в виде [B
мU
м]
t подается на первый вход сумматора 1. На второй вход сумматора поступает сигнал с выхода второго регулятора 3. Выход сумматора связан с первым входом первого регулятора 2, этот регулятор окончательно формирует управление в соответствии с зависимостью

Выход первого регулятора связан со входом фильтра 4 низких частот, пропускающего рабочие частоты ОУ. Выход фильтра связан со входом объекта 5 управления и с первым входом блока 6 текущей идентификации. Выход объекта управления связан с первым входом второго регулятора 3, преобразующего входной сигнал x
i в виде

,
и со вторым входом блока текущей идентификации. Выход блока 7 априорной информации о матрице эффективности управления объекта подключен к третьему входу блока текущей идентификации. Блок текущей идентификации по входным сигналам с объекта управления:

- формирует текущие оценки параметров ОУ. Вектор

может либо непосредственно измеряться, либо аналитически вычисляться в блоке текущей идентификации по текущим значениям x, например, на основе полиномиальной или тригономтрической аппроксимации на скользящем интервале /8/. Алгоритм текущей идентификации блока 6 относится к классу алгоритмов типа стохастической аппроксимации, в качестве которого можно использовать алгоритм, описанный в работе /9/

Здесь
a= H
-1 - выбирается из условия
a>
ф . Для выполнения требований (11) или (13) на каждом шаге идентификации в блоке 6 производится коррекция оценки

. Такая коррекция должна быть с "минимальным" изменением исходной матрицы и может быть организована следующим образом. Блок 7 выдает в блок текущей идентификации информацию о матрице B
0 размерностью n

m. Эта матрица учитывает априорную информацию о матрице эффективности управления объекта в виде соблюдения равенства
rank(B
ToB) = rankB, (14) ,
Предположим, что

,
где
G
i - какая-то матрица размерностью m

m. Оценку

определим как

,
где
i - минимальная по норме добавка до невырожденности матрицы

. Эта добавка может быть получена, например, на основе разложения квадратной матрицы

на треугольные сомножители [6] с минимальной коррекцией последовательной процедуры разложения с целью устранения нулевых диагональных элементов сомножителей. Полученные сомножители в дальнейшем перемножаются, формируя

. Скорректированная оценка будет иметь вид

. Тогда

,
что следует из равенства (14) и утверждения о том, что умножение любой матрицы на невырожденную соответствующей размерности не изменяет ранга исходной матрицы /6/. Оценка

используется при формировании управления и заменяет оценку

для следующего шага алгоритма идентификации.
Выход блока текущей идентификации, через который выдаются оценки

, связан с блоком 8 настройки регуляторов. Этот блок вычисляет

. Для реализации псевдообращения матриц можно использовать последовательный метод Гревилля [6]. Первый выход блока 8 связан со вторым входом первого регулятора, по нему передается информация о

. Второй выход блока 8 связан со вторым входом второго регулятора, по нему передается информация о матрице

.
Литература:
1. Справочник по теории автоматического управления./Под ред. А.А.Красовского. - М.: Наука, Гл. ред. физ. - мат. лит., 1987. - 712 с. (прототип).
2. Уткин В.Н. Скользящие режимы в задачах оптимизации и управления. - М. : Наука, 1981.
3. Изерман Р. Цифровые системы управления: Пер. с англ. - М.: Мир, 1984, 541 с.
4. Острем К.И. Адаптивное управление с обратной связью//ТИИЭР - 1987, N 2, т. 75, с. 4 - 45.
5. Цыпкин Я.З. Основы информационной теории идентификации. - М.: Наука. Гл. ред. фиг.-мат. лит., 1984. 320 с.
6. Гантмахер Ф.Р. Теория матриц. - М.: Наука, Гл. ред. физ.-мат. лит., 1988, с. 552.
7. Буков В.Н., Круглов С.П., Решетняк Е.П. Адаптируемость линейной динамической системы с идентификатором и эталонной моделью//Автоматика и телемеханика - 1994, N 3, с. 99 - 107.
8. Пашковский И.М., Леонов В.А., Поплавский Б.К. Летные испытания самолетов и обработка результатов испытаний. - М.: Машиностроение, с. 416, 1985.
9. Гроп Д. Методы идентификации систем: Пер. с англ. - М.: Мир, 1979, с. 302.
Формула изобретения
Адаптивная система управления с идентификатором и неявной эталонной моделью, содержащая объект управления и сумматор, первый вход которого подключен к задающему воздействию, а выход - к первому входу первого регулятора, выход объекта управления подключен к первому входу второго регулятора и к первому входу блока текущей идентификации, выход второго регулятора подключен к второму входу сумматора, выход блока текущей идентификации подключен к входу блока настройки регуляторов, первый выход которого подключен к второму входу первого регулятора, а второй выход - к второму входу второго регулятора, отличающаяся тем, что она дополнительно содержит фильтр низких частот, вход которого подключен к выходу первого регулятора, а выход подключен к входу объекта управления и к второму входу блока текущей идентификации, блок априорной информации о матрице эффективности управления объекта, выход которого подключен к третьему входу блока текущей идентификации.
РИСУНКИ
Рисунок 1