Система нейросетевого управления конкурирующими взаимосвязанными подсистемами

 

Предложенная система управления предназначена для регулирования объектом, состоящим из взаимосвязанными локальных объектов управления, при наличии конкуренции между ними.

Технический результат достигается за счет того, что в систему нейросетевого управления конкурирующими взаимосвязанными подсистемами, содержащую объект управления, который представлен взаимосвязанными первым локальным объектом управления и вторым локальным объектом управления, блок платежной матрицы игры, глобальный нейрорегулятор, первый локальный объект управления, второй локальный объект управления, первый локальный нейрорегулятор, второй локальный нейрорегулятор, первый блок суммирования, второй блок суммирования, при этом входы первого локального нейрорегулятора соединены с выходом первого локального объекта управления и с сигналом задания для первого локального объекта управления, входы второго локального нейрорегулятора соединены с выходом второго локального объекта управления и с сигналом задания для второго локального объекта управления, входы первого блока суммирования соединены с выходом первого локального нейрорегулятора и с выходным сигналом глобального нейрорегулятора для первого локального объекта управления, входы второго блока суммирования соединены с выходом второго локального нейрорегулятора и с выходным сигналом глобального нейрорегулятора для второго локального объекта управления, входы глобального нейрорегулятора соединены с выходным сигнал блока платежной матрицы игры для первого локального объекта управления и с выходным сигнал блока платежной матрицы игры для второго локального объекта управления, входы блока платежной матрицы игры соединены с выходом первого локального объекта управления и с выходом второго локального объекта управления, входы первого локального объекта управления соединены с выходом второго локального объекта управления и с выходом первого блока суммирования, входы второго локального объекта управления соединены с выходом первого локального объекта управления и с выходом второго блока суммирования, введены локальные нейрорегуляторы, управляющие каждый своим локальным объектом управления, и глобальный нейрорегулятор реализующий корректирующие управления для каждого локального объекта управления с учетом конкуренции и взаимосвязей между локальными объектами управления.

Полезная модель относиться к системам управления и предназначена для регулирования объектом, состоящим из взаимосвязанными локальных объектов управления, при наличии конкуренции между ними.

Уровень полезной модели известен из способа автоматической конфигурации системы управления процессом и системы управления процессом (патент RU 2372636 С2, опубл. 10.11.2006).

Недостатком известного устройства является то что, устройство управления не осуществляет раздельное регулирование подчиненными устройствами.

Наиболее близким по технической сущности к заявляемой полезной модели является адаптивная система управления (патент RU 2007121876 А, опубл. 20.12.2008).

Недостатком данного устройства является то что, не учитываются внутренние взаимосвязи, которыми может обладать объект управления при реализации регулирования.

Заявляемая полезная модель направлена на повышение качества управления. Технический результат, достигаемый в процессе решения поставленной задачи, заключается в достижении заданных показателей качества регулирования при наличии конкуренции между локальными объектами управления входящими в систему управления.

Это достигается за счет реализацией глобальным нейрорегулятором управления корректирующего локальные управления, вырабатываемые каждым локальным нейрорегулятором для своего локального объекта управления.

Указанный технический результат достигается системой нейросетевого управления конкурирующими взаимосвязанными подсистемами, изображенной на фиг.1, которая содержит блок платежной матрицы игры 1, глобальный нейрорегулятор 2, первый локальный объект управления 3, второй локальный объект управления 4, первый локальный нейрорегулятор 5, второй локальный нейрорегулятор 6, первый блок суммирования 7, второй блок суммирования 8, при этом входы первого локального нейрорегулятора соединены с выходом первого локального объекта управления и с сигналом задания для первого локального объекта управления, входы второго локального нейрорегулятора соединены с выходом второго локального объекта управления и с сигналом задания для второго локального объекта управления, входы первого блока суммирования соединены с выходом первого локального нейрорегулятора и с выходным сигналом глобального нейрорегулятора для первого локального объекта управления, входы второго блока суммирования соединены с выходом второго локального нейрорегулятора и с выходным сигналом глобального нейрорегулятора для второго локального объекта управления, входы глобального нейрорегулятора соединены с выходным сигнал блока платежной матрицы игры для первого локального объекта управления и с выходным сигнал блока платежной матрицы игры для второго локального объекта управления, входы блока платежной матрицы игры соединены с выходом первого локального объекта управления и с выходом второго локального объекта управления, входы первого локального объекта управления соединены с выходом второго локального объекта управления и с выходом первого блока суммирования, входы второго локального объекта управления соединены с выходом первого локального объекта управления и с выходом второго блока суммирования.

На фиг.1 для сигналов введены следующие обозначения:

U1 - сигнал задания для первого локального объекта управления 3

U2 - сигнал задания для второго локального объекта управления 4

Y1 - выходной сигнал первого локального объекта управления 3

Y2 - выходной сигнал второго локального объекта управления 4

W1 - выходной сигнал блока платежной матрицы игры для первого

локального объекта управления 3

W2 - выходной сигнал блока платежной матрицы игры для второго

локального объекта управления 4

XL1 - выходной сигнал первого локального нейрорегулятора 5

XL2 - выходной сигнал второго локального нейрорегулятора 6

XG1 - выходной сигнал глобального нейрорегулятора для первого

локального объекта управления 3

XG2 - выходной сигнал глобального нейрорегулятора для второго

локального объекта управления 4

X1 - входной сигнал первого локального объекта управления 3

Х2 - входной сигнал второго локального объекта управления 4

Первая локальная подсистема включает в себя первый локальный объект управления 3, первый локальный нейрорегулятор 5, первый блок суммирования 7.

Вторая локальная подсистема включает в себя второй локальный объект управления 4, второй локальный нейрорегулятор 6, второй блок суммирования 8.

В блоке платежной матрицы игры 1 происходит вычисление сигналов Wl, W2. Сигнал W1 определяет выигрыш первой локальной подсистемы управления при реализации стратегии управления первого локального нейрорегулятора 5 в отношении первого локального объекта управления 3 с учетом влияния выходного сигнала второго локального объекта управления 4. Сигнал W2 определяет выигрыш второй локальной подсистемы управления при реализации стратегии управления второго локального нейрорегулятора 6 в отношении второго локального объекта управления 4 с учетом влияния выходного сигнала первого локального объекта управления 3. Вычисление сигналов W1 и W2 происходит на основании платежной матрицы игры, которая задается в виде экспертных данных или функциональной зависимости.

Первый локальный нейрорегулятор 5 представляет собой нейронную сеть - трехслойный персептрон с сигмоидальными функциями активации для всех нейронов скрытого и выходного слоев. Нейроны входного слоя выполняют только распределительные функции для входных сигналов. Размерность входного слоя - n определяется суммой размерностей сигналов U1,Y1. Размерность выходного слоя сети - m определяется размерностью сигнала X1. Количество нейронов в скрытом слое изначально принимается эмпирически согласно выражению - 2(n+m). Если в процессе обучения требуемое качество управления не достигается, то количество нейронов в скрытом слое увеличивается. Методом обучения трехслойного персептрона первого локального нейрорегулятора является генетический алгоритм.

Второй локальный нейрорегулятор 6 представляет собой нейронную сеть - трехслойный персептрон с сигмоидальными функциями активации для всех нейронов скрытого и выходного слоев. Нейроны входного слоя выполняют только распределительные функции для входных сигналов. Размерность входного слоя - n определяется суммой размерностей сигналов U2,Y2. Размерность выходного слоя сети - m определяется размерностью сигнала Х2. Количество нейронов в скрытом слое изначально принимается эмпирически согласно выражению - 2(n+m). Если в процессе обучения требуемое качество управления не достигается, то количество нейронов в скрытом слое увеличивается. Методом обучения трехслойного персептрона второго локального нейрорегулятора является генетический алгоритм.

На фиг.2 изображена схема включения нейронной сети первого локального нейрорегулятора 5 в систему управления для обучения, которая содержит первый локальный нейрорегулятор регулятор 5, первый локальный объект управления 3, эталонную модель 11, алгоритм обучения 9, третий блок суммирования 10, четвертый блок суммирования 12. Нейронная сеть первого локального нейрорегулятора 5 настраивается таким образом, что бы минимизировать среднеквадратичную ошибку регулирования между выходным сигналом эталонной модели 11 и выходным сигналом первого локального объекта управления 3 с заданной точностью. Эталонная модель 11 представляет платежную матрицу игры, вычисляющую стратегию, которая должна быть достигнута настройкой весовых коэффициентов нейронной сети первого локального нейрорегулятора 5, обеспечивающую максимальный выигрыш первой локальной подсистемы при наихудших условиях конкуренции. В процессе обучения сигнал U1 представляет собой множество ступенчатых и гармонических сигналов чередующихся случайным образом.

На фиг.2 дополнительно введены обозначения:

Е1 - сигнал рассогласования

H1 - выходной сигнал эталонной модели 11

M1 - сигнал для изменения весовых коэффициентов нейронной сети первого локального нейрорегулятора 5

На фиг.3 изображена схема включения нейронной сети второго локального нейрорегулятора 6 в систему управления для обучения, которая содержит второй локальный нейрорегулятор регулятор 6, второй локальный объект управления 4, эталонную модель 15, алгоритм обучения 13, пятый блок суммирования 14, шестой блок суммирования 16. Нейронная сеть второго локального нейрорегулятора 6 настраивается таким образом, что бы минимизировать среднеквадратичную ошибку регулирования между выходным сигналом эталонной модели 15 и выходным сигналом второго локального объекта управления 4 с заданной точностью. Эталонная модель 15 представляет платежную матрицу игры, вычисляющую стратегию, которая должна быть достигнута настройкой весовых коэффициентов нейронной сети второго локального нейрорегулятора 6, обеспечивающую максимальный выигрыш второй локальной подсистемы при наихудших условиях конкуренции. В процессе обучения сигнал U2 представляет собой множество ступенчатых и гармонических сигналов чередующихся случайным образом.

На фиг.3 дополнительно введены обозначения:

Е2 - сигнал рассогласования

Н2 - выходной сигнал эталонной модели 15

М2 - сигнал для изменения весовых коэффициентов нейронной сети второго локального нейрорегулятора 6

Глобальный нейрорегулятор 2 представляет собой нейронную сеть -трехслойный персептрон с сигмоидальными функциями активации для всех нейронов скрытого и выходного слоев. Нейроны входного слоя выполняют только распределительные функции для входных сигналов. Размерность входного слоя - n определяется размерностью сигналов W1 и W2. Размерность выходного слоя сети - m определяется суммой размерностей сигналов XI и Х2. Количество нейронов в скрытом слое изначально принимается эмпирически согласно выражению - 2(n+m). Если в процессе обучения требуемое качество управления не достигается, то количество нейронов в скрытом слое увеличивается. Методом обучения трехслойного персептрона глобального нейрорегулятора является генетический алгоритм.

На фиг.4 изображена схема включения нейронной сети глобального нейрорегулятора 2 в систему управления для обучения, которая содержит блок платежной матрицы игры 1, глобальный нейрорегулятор 2, первый локальный объект управления 3, второй локальный объект управления 4, первый блок суммирования 7, второй блок суммирования 8 алгоритм обучения 17. Нейронная сеть глобального нейрорегулятора 2 настраивается таким образом, что бы общий выигрыш системы управления был максимальным. В процессе обучения сигнал U представляет собой множество ступенчатых и гармонических сигналов чередующихся случайным образом.

На фиг.4 дополнительно введены обозначения:

U - сигнал задания для всей системы

М3-сигнал для изменения весовых коэффициентов нейронной сети глобального нейрорегулятора 2

Качество управления достигается за счет того, что нейронная сеть глобального нейрорегулятора может быть настроена так, что корректирует выходные сигналы локальных нейрорегуляторов таким образом, что общий выигрыш системы был максимальным при наличии взаимосвязей между локальными объектами управления и конкуренции между ними посредством взаимовлияния.

Устройство работает следующим образом. Определяется платежная матрица игры, которая задается в блоке платежной матрицы игры. Выполняется задание эталонных моделей и настройка матриц весовых коэффициентов нейронных сетей локальных нейрорегуляторов. Происходит настройка матрицы весовых коэффициентов глобального нейрорегулятора. После выполнения настроек происходит отработка управляющих сигналов U1 и U2 каждым локальным нейрорегулятором.

В процессе работы выполняется анализ выходных сигналов локальных объектов управления блоком платежной матрицы игры, в результате чего формируется выходной сигнал глобального нейрорегулятора, который корректирует выходные сигналы локальных нейрорегуляторов. Работа продолжается до тех пор, пока не будет полностью отработаны заданные управления U1 и U2.

Предложенное устройство может быть реализовано программно-аппаратным способом на основе промышленной базы.

Система нейросетевого управления конкурирующими взаимосвязанными подсистемами, содержащая объект управления, отличающаяся тем, что объект управления представлен взаимосвязанными первым локальным объектом управления и вторым локальным объектом управления и дополнительно содержит блок платежной матрицы игры, глобальный нейрорегулятор, первый локальный нейрорегулятор, второй локальный нейрорегулятор, первый блок суммирования, второй блок суммирования, при этом входы первого локального нейрорегулятора соединены с выходом первого локального объекта управления и с сигналом задания для первого локального объекта управления, входы второго локального нейрорегулятора соединены с выходом второго локального объекта управления и с сигналом задания для второго локального объекта управления, входы первого блока суммирования соединены с выходом первого локального нейрорегулятора и с выходным сигналом глобального нейрорегулятора для первого локального объекта управления, входы второго блока суммирования соединены с выходом второго локального нейрорегулятора и с выходным сигналом глобального нейрорегулятора для второго локального объекта управления, входы глобального нейрорегулятора соединены с выходным сигнал блока платежной матрицы игры для первого локального объекта управления и с выходным сигналом блока платежной матрицы игры для второго локального объекта управления, входы блока платежной матрицы игры соединены с выходом первого локального объекта управления и с выходом второго локального объекта управления, входы первого локального объекта управления соединены с выходом второго локального объекта управления и с выходом первого блока суммирования, входы второго локального объекта управления соединены с выходом первого локального объекта управления и с выходом второго блока суммирования.



 

Наверх