Устройство для умножения трех матриц

Авторы патента:

G06F15/347 - Цифровые компьютеры вообще (конструктивные элементы G06F 1/00-G06F 13/00); оборудование для обработки данных вообще (нейронные сети для обработки данных изображений G06T)

Изобретение относится к вычислительной технике и может быть использовано в высокопроизводительных специализированных вычислительных машинах и устройствах обработки сигналов. Цель изобретения - сокращение объема оборудования устройства. Цель достигается тем, что устройство содержит вычислительных модулей (m-фиксированное число 2 m ), причем основу оборудования каждого вычислительного модуля составляют умножитель и сумматор. В основу работы устройства положена параллельно-поточная организация вычислений. 4 ил., 2 табл.

Известно устройство для перемножения трех матриц F_IxP x C_PxQ x D_QxJ, содержащее Р вычислительных модулей первого типа и Р вычислительных модулей второго типа, причем каждый вычислительный модуль первого типа содержит три регистра, два триггера, умножитель, сумматор, две группы элементов И, две группы элементов ИЛИ, элемент И и узел задержки, а каждый вычислительный модуль второго типа содержит три регистра, два триггера, умножитель, сумматор, шесть групп элементов И, три группы элементов ИЛИ и узел задержки.

Недостатком этого устройства является большой объем оборудования.

К наиболее близким по технической сущности к предлагаемому изобретению относится устройство для перемножения трех матриц F_IxP x C_PxQ x D_QxJ, содержащее I + J + P + Q - 2 вычислительных модулей, причем каждый вычислительный модуль содержит четыре регистра, два узла задержки, три триггера, умножитель, сумматор, восемь групп элементов И, четыре группы элементов ИЛИ, два элемента И и два элемента НЕ.

Недостатком такого устройства является большой объем оборудования (содержит I + J + P + Q - 2 вычислительных модулей).

Цель изобретения - сокращение объема оборудования устройства.

Цель достигается тем, что устройство для перемножения трех матриц A_IxP, X_PxQ, D_QxJ, где I, J, P и Q - размерности матриц (фиг.1), содержит m(2

J) вычислительных модулей 5, P(Q+I)-2m параллельных n-разрядных регистров 6(n-разрядность чисел), P(Q + I) - 2m параллельных трехразрядных регистров 7, две группы элементов ИЛИ 8 и 9, причем первый информационный вход 1 устройства подключен к первому информационному входу вычислительного модуля 5₁, второй информационный вход 2 и настроечный вход 3 устройства подключены соответственно к первым входам групп элементов ИЛИ 8 и 9, выходы которых подключены соответственно ко второму информационному входу и настроечному входу вычислительного модуля 5₁, первый и второй информационные выходы, настроечный выход 5_i-го вычислительного модуля (i =

) подключены соответственно к первому и второму информационному входу, настроечному входу 5(_i ₊ ₁)-го вычислительного модуля, первый информационный выход 5_m-го вычислительного модуля является выходом 10 устройства, второй информационный выход 5_m-го вычислительного модуля подключен к информационному входу параллельного n-разрядного регистра 6₁, выход 6_i-го регистра (i =

) подключен к информационному входу 6_(i+ ₁₎-го регистра, выход 6_(P(Q ₊ _I) _- _2m-го регистра подключен ко второму входу группы элементов ИЛИ 8, настроечный выход 5_m-го вычислительного модуля подключен к информационному входу трехразрядного параллельного регистра 7₁, выход 7_i-го регистра (i =

) подключен к информационному входу 7_(i+1)-го регистра, выход 7_(P(Q ₊ _I) _- _2m)-го регистра подключен ко второму входу группы элементов ИЛИ 9, синхровход устройства подключен к синхровходам всех вычислительных модулей 5_iрегистров 6_i, 7_i. На фиг. 1 представлена структурная схема устройства для перемножения трех матриц; на фиг.2 - структурная схема устройства для I = 2, J = 4, P = 3, Q = 3 и m=2; на фиг.3 - схема вычислительного модуля 5; на фиг.4 - временная диаграмма работы вычислительного модуля в пределах одного такта.

Устройство для перемножения трех матриц (фиг.1) содержит первый 1 и второй 2 информационные входы, настроечный вход 3, синхровход 4, вычислительные модули 5_i, n-разрядные параллельные регистры 6_iтрехразрядные параллельные регистры 7_i, группы элементов ИЛИ 8, 9 и выход 10.

Вычислительный модуль 5 (фиг.3) содержит первый 11 и второй 12 информационные входы, настроечный вход 13, регистры 14-18, умножитель 19, сумматор 20, триггеры 21-33, группы элементов И 34-46, группы элементов ИЛИ 47-51, элементы И 52-59, элементы НЕ 60-62, первый 63 и второй 64 информационные выходы, настроечный выход 65 и синхровход 66.

В основу работы устройства для перемножения матриц A = {a_ip} , X {x_pq} , D = {d_qj} i=

, j =

, =

, q =

положен следующий алгоритм B= {b_pj} = X

D, b_pj=

x_pq

d_qj Y= { y_ij} = A

B, y_ij=

a_ip

d_pj который представляется рекуррентными соотношениями: P =

, j =

, q =

b(p,j,0) = x_pod_oj, b(p,j,q) = b(p,j,q-1) + x_pq

d_qj , b_pj= b(p,j,Q-1); i =

, j =

, p =

y(i,j,0) = a_io

b_oj, y(i,j,p) = y(i,j,p-1)+ a_ip

b_pj , y_ij = y(i,j, P-1).

Число m выбирается фиксированным, m =

Предполагается, что число J_m = J/m - целое. Если J_m не целое, то J выбирается таким, чтобы

J/m

, где

- ближайшее сверху целое. При этом матрица D дополняется нулевыми столбцами.

Вычислительный модуль 5 работает в семи режимах (фиг.3), которые задаются значениями управляющих сигналов

, подаваемыми соответственно на настроечные входы 13₁, 13₂ и 13₃.

Во всех режимах работы значение b, подаваемое на вход 12, выдается на выход 64 с задержкой на два такта. Управляющие сигналы

выдаются соответственно на выходы 65₁, 65₂ и 65₃ с задержкой на два такта. Информация, записанная в регистр 18_i-й ((i =

)

), на очередном такте переписывается в 18_i+1-й регистр. Управляющий сигнал

_i^tобеспечивает запись информации в регистр на t-м такте, а управляющий сигнал

_i^t - на (t + 1)-м такте.

В первом режиме работы подаются управляющие сигналы (

)= (0, 1, 1). При этом формируются сигналы

₁ = 1 и

₁ = 1. Сигнал

₁открывает группу элементов И 40 и элемент 59. Элемент а, подаваемый на вход 11, через группы элементов И 40 и ИЛИ 49 подается на информационный вход регистра 17. Элемент записывается в регистр 17 по заднему фронту тактового импульса, проходящего через элемент И 59 на синхровход регистра 17. На первом такте сигнал

₁ открывает группу элементов И 35, элемент а с выхода регистра 14 через группы элементов И 35 и ИЛИ 48 подается на первый вход умножителя 19, на его второй вход подается элемент b (с выхода регистра 15), на выходе умножителя 19 формируется значение а

b. Временная диаграмма работы в пределах одного такта приведена на фиг.4.

Во втором режиме работы (

) = =(0,0,1) формируется сигнал

₂= 1. Сигнал

₂ открывает группы элементов И 34 и 38. Значение а с выхода регистра 14 через группы элементов И 34 и ИЛИ 47 подается на выход 63. Содержимое регистра 17 через группы элементов И 38 и ИЛИ 48 подается на первый вход умножителя 19, на второй вход которого подается значение b с выхода регистра 15. На выходе умножителя 19 формируется значение <Рег.17> х b.

В третьем режиме работы (

) = =(0,1,0). Формируются сигналы

₃ = 1 и

₃= =1. По сигналу

₃ в регистр 17 записывается элемент а. Сигнал

₃ открывает группы элементов И 35 и 46. На выходе умножителя 19 формируется значение а^. b, на выходе сумматора 20 - значение <Рег.18р >+ a ^.b.

В четвертом режиме работы (

) = =(0,0,0). Формируется сигнал

₄ = 1. Сигнал

₄ открывает группы элементов И 34, 38 и 46. Значение а с выхода регистра 14 через группы элементов И 34 и ИЛИ 47 подается на выход 63. На выходе умножителя 19 формируется значение <Рег.17> x b, на выходе сумматора 20 - значение <Рег.8р> + <Рег.17 > ^.b.

В пятом режиме работы (

) = =(1,0,1). Формируются сигналы

₅ = 1 и

₅ = =1. Сигнал

₅ открывает группу элементов И 45. Содержимое регистра 18р через группы элементов И 45 и ИЛИ 50 записывается в регистр 18₁. Сигнал

₅ открывает группы элементов И 34, 41 и элемент И 59. Значение а с выхода регистра 14 подается на выход 63. На выходе умножителя 19 формируется значение <18>^. b, которое подается через группу элементов И 41 и ИЛИ 49 на информационный вход регистра 17 для записи на следующем такте.

В шестом режиме работы (

) = =(1,0,0). Формируются сигналы

₆ = 1 и

₆ =1. Сигнал

₆ открывает группу элементов И 45. В регистр 18₁ записывается содержимое регистра 18р. Сигнал

₆ открывает группы элементов И 34, 37, 39, 44 и элемент И 59. На выход 63 подается значение а. На выходе сумматора 20 формируется значение< Рег.17 >+ <Рег.18> ^. b, которое через группы элементов И 39 и ИЛИ 49 подается на информационный вход регистра 17 для записи на следующем такте.

В седьмом режиме (

) = (1,1,0). Формируются сигналы

₇=1 и

₇ = 1. Сигнал

₇ открывает группу элементов И 45 и в регистр 18₁ записывается содержимое регистра 18р. Сигнал

₇ открывает группы элементов И 36, 37, 39, 44 и элемент И 59. Содержимое регистра 17 через группы элементов И 36 и ИЛИ 47 подается на выход 63. На выходе сумматора 20 формируется значение <Рег. 17 >+ <Рег.18> ^. b, которое подается через группы элементов И 39 и ИЛИ 49 на информационный вход регистра 17 для записи на следующем такте.

Рассмотрим работу устройства (фиг.1)
Управляющие сигналы

_ig = (

) , i =

, j=

представляются в виде матрицы

и подаются на вход 3 в моменты времени
t

= i P +j.

На вход 1 подаются элементы d_qj в моменты времени
t

= (l-1) P (Q+I)+

++Pq, где j =

+ (l-1)m,

, l =

На вход 2 подаются элементы x_pq, a_ip в моменты времени
t

= p + Pq , t

= p+ P(Q+I-i-1).

На выходе 10 формируются элементы y_i _, ₊ _(l _-1 ₎ _m в моменты времени t = y_i,p+(l-1)m = =lP(Q + I) + m +

- P^. i - 2.

На фиг. 2 приведена структура устройства с входным и выходным потоками данных для I = 2, J = 4, P = 3, Q = 3 и m = 2. Значения на входах и выходах состояния регистров вычислительных модулей 5₁ (табл. 1) и 5₂ (табл.2), состояния регистров 7 и 8 приведены в таблице, которая является временной диаграммой работы устройства.

Таким образом, предлагаемое устройство содержит меньший объем оборудования по сравнению с прототипом, т.е. предлагаемое устройство содержит m вычислительных модулей, а прототип - J вычислительных модулей (m

J).

Формула изобретения

УСТРОЙСТВО ДЛЯ УМНОЖЕНИЯ ТРЕХ МАТРИЦ, каждая размерностью 1

P, P

Q, Q

соответственно, содержащее m(2

) вычислительных модулей, причем первый информационный вход устройства подключен к первому информационному входу первого вычислительного модуля, первый и второй информационные выходы и настроечный выход i-го вычислительного модуля (i =

) подключены соответственно к первому и второму информационным входам и настроечному входу (i+1)-го вычислительного модуля, первый информационный выход m-го вычислительного модуля является выходом устройства, синхровход которого подключен к синхровходам всех вычислительных модулей, отличающееся тем, что, с целью сокращения объема оборудования, в него введены две группы элементов ИЛИ, [P(Q+I)-2m] параллельных n-разрядных регистров и [P(Q+I)-2m] параллельных трехразрядных регистров (n - разрядность чисел), причем второй информационный вход устройства подключен к первым входам элементов ИЛИ первой группы, выходы которых подключены к второму информационному входу первого вычислительного модуля, второй информационный выход m-го вычислительного модуля подключен к информационному входу первого параллельного n-разрядного регистра, выход j-го параллельного n-разрядного регистра (j = 1

подключен к информационному входу (j+1)-го параллельного n-разрядного регистра, выходы разрядов [P(Q+I)-2m]-го параллельного n-рязрядного регистра подключены к вторым входам элементов ИЛИ первой группы, настроечный вход устройства подключен к первым входам элементов ИЛИ второй группы, выходы которых подключены к настроечному входу первого вычислительного модуля, настроечный выход m-го вычислительного модуля подключен к информационному входу первого параллельного трехразрядного регистра, выход j-го параллельного трехразрядного регистра подключен к информационному входу (j+1)-го параллельного трехразрядного регистра, выход [P(Q+I)-2m]-го параллельного трехразрядного регистра подключен к вторым входам элементов ИЛИ второй группы, синхровход устройства подключен к синхровходам всех регистров, причем каждый вычислительный модуль обладает возможностью реализации функций
u ^j+2 =

^j ;
v ^j+2 =

^j ;
w ^j+2 =

^j ;
A^j+1 =

c^j =

d^j-1 =

f^j-2 =

e^j-1 =

B ^j+2 = b ^j ;

₁^j+1 =

₁^j = (

^j,

^j) = (0, 1, 1);

₂^j+1 =

₂^j = (

^j,

^j) = (0, 0, 1);

₃^j+1 =

₃^j = (

^j,

^j) = (0, 1, 0);

₄^j+1 =

₄^j = (

^j,

^j) = (0, 0, 0);

₅^j+1 =

₅^j = (

^j,

^j) = (1, 0, 1);

₆^j+1 =

₆^j = (

^j,

^j) = (1, 0, 0);

₇^j+1 =

₇^j = (

^j,

^j) = (1, 1, 0),
где

^j,

^j - значения соответственно на первом, втором и третьем разрядах настроечного входа вычислительного модуля на j-м такте;
u^j, v^j, w^j - значения соответственно на первом, втором и третьем разрядах настроечного выхода вычислительного модуля на j-м такте;
a^j, b^j - значения соответственно на первом и втором информационных входах вычислительного модуля на j-м такте;
A^j, B^j - значения соответственно на первом и втором информационных выходах вычислительного модуля на j-м такте.

РИСУНКИ

Рисунок 1, Рисунок 2, Рисунок 3, Рисунок 4, Рисунок 5, Рисунок 6, Рисунок 7, Рисунок 8, Рисунок 9, Рисунок 10

Устройство для выполнения дискретных ортогональных преобразований // 2024931

Изобретение относится к вычислительной технике, в частности к цифровой обработке радио-, гидро- и звуколокационных сигналов, и может быть применено при построении быстродействующих Фурье-процессоров

Вычислительное устройство кромонова для анализа надежности банка // 2024930

Изобретение относится к вычислительной технике и может быть использовано для анализа деятельности коммерческих и других субъектов, а также объектов со множеством отчетных и других показателей

Устройство для моделирования систем массового обслуживания // 2024929

Изобретение относится к специализированным средствам вычислительной техники

Эвм // 2024928

Изобретение относится к вычислительной технике и может быть использовано при разработке персональных бытовых ЭВМ, игровых автоматов и других средств вычислительной техники, построенных на основе микропроцессоров и осуществляющих индикацию информации на телевизионном мониторе или приемнике

Микропроцессор // 2024927

Изобретение относится к вычислительной технике, в частности к микропроцессорам, поддерживающим языки высокого уровня

Устройство для оценки линейного размещения элементов // 2024058

Изобретение относится к цифровой вычислительной технике и предназначено для использования в процессе автоматизированного проектирования электронных средств при выполнении процедур размещения

Устройство для исследования сетей петри // 2024057

Изобретение относится к вычислительной технике, может быть использовано для исследования сетей Петри и позволяет расположить разрешенные в сети переходы в порядке их срабатывания во времени

Устройство для сглаживания импульсной помехи // 2024056

Устройство для моделирования процесса обслуживания заявок с различными приоритетами // 2024055

Изобретение относится к вычислительной технике и может быть использовано при аппаратурном исследовании систем массового обслуживания

Вычислительное устройство с чередующимся обслуживанием нескольких командных потоков // 2101759

Изобретение относится к вычислительной технике и может быть использовано в электронной цифровой вычислительной машине

Способ проведения электронной игры и система для его осуществления // 2105586

Изобретение относится к электронным играм

Управляемая от эвм телекоммуникационная установка // 2106008

Микроэвм // 2108619

Изобретение относится к области микропроцессорной техники, в частности, может применяться для реализации обмена информацией

Цифровой компьютер с возможностью параллельного выполнения двух и более команд // 2109333

Изобретение относится к области цифровой вычислительной техники и предназначено для обработки двух или больше компьютерных команд параллельно

Параллельный процессор с перепрограммируемой структурой // 2110088

Изобретение относится к области вычислительной техники и предназначено для создания высокоскоростных систем обработки больших потоков данных в реальном режиме времени

Схемное устройство для параллельной обработки двух или более команд в цифровом компьютере // 2111531

Изобретение относится к цифровым компьютерным системам и предназначено для обработки двух и более команд параллельно

Многопроцессорная векторная эвм // 2113010

Изобретение относится к вычислительной технике, точнее к построению многопроцессорных векторных ЭВМ

Вычислитель с перепрограммируемой архитектурой // 2115161

Изобретение относится к вычислительной технике и может найти применение в автоматизированных системах управления АСУ индустриального и специального назначения

Способ и устройство изготовления выкроек предметов одежды // 2120219

Изобретение относится к изготовлению выкроек, в частности таких выкроек, которые должны использоваться при изготовлении предметов одежды