Вычислительный модуль

 

Полезная модель относится к области вычислительной техники, в частности, к вычислительным устройствам с перестраиваемой архитектурой, использующим программируемые логические интегральные схемы (ПЛИС), и может быть использована в качестве базового модуля в многопроцессорных вычислительных системах, предназначенных для решения трудоемких задач и обработки больших информационных массивов и потоков, с использованием распараллеливания и конвейеризации вычислительных процессов. Задача, на решение которой направлена предлагаемая полезная модель, заключается в увеличении скорости обмена информацией вычислительных ПЛИС через внешние порты. Технический результат достигается за счет того, что в вычислительный модуль, содержащий два внешних порта блока для обмена информацией, коммутатор PCI-Express, интерфейсную и N вычислительных ПЛИС, каждая из которых содержит высокоскоростной последовательный интерфейс PCI-Express, причем порты коммутатора PCI-Express соединены с внешними портами блока и с интерфейсами PCI-Express интерфейсной ПЛИС и N вычислительных ПЛИС, дополнительно введен кольцевой высокоскоростной последовательный канал обмена информацией между интерфейсной ПЛИС и N вычислительными ПЛИС, организованный на базе двух дополнительных независимых высокоскоростных последовательных портов обмена информацией, введенных у интерфейсной ПЛИС и каждой из N вычислительных ПЛИС. 1 ил.

Полезная модель относится к области вычислительной техники, в частности, к вычислительным устройствам с перестраиваемой архитектурой, использующим программируемые логические интегральные схемы (ПЛИС), и может быть использована в качестве базового модуля в многопроцессорных вычислительных системах, предназначенных для решения трудоемких задач и обработки больших информационных массивов и потоков, с использованием распараллеливания и конвейеризации вычислительных процессов.

Известно вычислительное устройство (http://www.dinigroup.com/new/DNV6F6PCIe.php), содержащее внешний порт устройства для обмена информацией, интерфейсную ПЛИС и N вычислительных ПЛИС, каждая из которых содержит высокоскоростной последовательный интерфейс PCI-Express и по два независимых высокоскоростных последовательных канала обмена информацией.

Недостатком данного устройства является ограничение числа вычислительных ПЛИС взаимодействующих с интерфейсной ПЛИС при обеспечении высокой скорости обмена информацией и отсутствие возможности взаимодействия между собой вычислительных ПЛИС, расположенных не в непосредственной близости друг от друга.

Причинами, препятствующими достижению технического результата, является ограниченное число доступных контактов как у интерфейсной ПЛИС, так и у вычислительных ПЛИС, обеспечивающих высокоскоростное взаимодействие между ПЛИС.

Наиболее близким устройством того же назначения, к заявленной полезной модели, по совокупности признаков является, принятый за прототип реконфигурируемый вычислительный блок (Современные технологии автоматизации, 3, 2013, с. 70-72, рис. 3, http://www.cta.ru/) содержащий два внешних порта блока для обмена информацией, коммутатор PCI-Express, интерфейсную и N вычислительных ПЛИС, каждая из которых содержит высокоскоростной последовательный интерфейс PCI-Express, причем порты коммутатора PCI-Express соединены с внешними портами блока и с интерфейсами PCI-Express ПЛИС.

Недостатком данного блока является недостаточно высокая скорость обмена информацией вычислительных ПЛИС по внешним портам.

Причинами, препятствующими достижению технического результата, является большой уровень накладных расходов на арбитраж и установку взаимодействия, а также последовательный характер обслуживания вычислительных ПЛИС через внешние порты. Максимальная скорость обмена V max для каждой из вычислительных ПЛИС по внешним портам определяется накладными расходами и количеством вычислительных ПЛИС, как Vmax=0.5*Vin_max/N, где N - число вычислительных ПЛИС, Vin_max - максимальная скорость обмена внешнего порта, а коэффициент 0.5 с большой степенью точности учитывает все накладные расходы при N>1.

Задача, на решение которой направлена предлагаемая полезная модель, заключается в увеличении скорости обмена информацией вычислительных ПЛИС через внешние порты.

Для решения данной задачи в вычислительный модуль, содержащий два внешних порта блока для обмена информацией, коммутатор PCI-Express, интерфейсную и N вычислительных ПЛИС, каждая из которых содержит высокоскоростной последовательный интерфейс PCI-Express, причем порты коммутатора PCI-Express соединены с внешними портами блока и с интерфейсами PCI-Express интерфейсной ПЛИС и N вычислительных ПЛИС, дополнительно введен кольцевой высокоскоростной последовательный канал обмена информацией между интерфейсной ПЛИС и N вычислительными ПЛИС, организованный на базе двух дополнительных независимых высокоскоростных последовательных портов обмена информацией, введенных у интерфейсной ПЛИС и каждой из N вычислительных ПЛИС.

На фиг. 1 приведена схема предлагаемого вычислительного модуля.

На фиг. 1 приняты следующие обозначения: коммутатор PCI-Express 1, интерфейсная ПЛИС 2, группа из N вычислительных ПЛИС 3 1 32, , 3N, где N количество вычислительных ПЛИС, высокоскоростной входной порт последовательного интерфейс PCI-Express 4, высокоскоростной последовательный интерфейс PCI-Express 5 между коммутатором 1 и интерфейсной ПЛИС 2, группа из N высокоскоростных последовательных интерфейсов PCI-Express 61, 6 2, , 6N между коммутатором 1 и вьгчислительными ПЛИС 31, 32, , 3N, кольцевой высокоскоростной последовательный канал 7 обмена информацией между интерфейсной ПЛИС 2 и вычислительными ПЛИС 31, 32, , 3N, высокоскоростной выходной порт последовательного интерфейса PCI-Express 8.

Коммутатор PCI-Express 1 предназначен для организации обмена информацией с интерфейсной ПЛИС 2 и вычислительными ПЛИС 31, 32, , 3N по входному порту 4, подключения дополнительного оборудования по выходному порту 8 и организации взаимодействия вычислительных ПЛИС 31, 32, , 3N между собой по интерфейсам PCI-Express 61, 62, , 6N· Коммутатор PCI-Express 1 содержит N+3 высокоскоростных порта, которые соединены с входным портом 4, с интерфейсной ПЛИС 2 по интерфейсу PCI-Express 5, с N вычислительными ПЛИС 31, 32, , 3N по N интерфейсам PCI-Express 61 , 62, , 6N и выходным портом 8.

Интерфейсная ПЛИС 2 предназначена для организации обмена информацией вычислительных 31, 32, , 3N ПЛИС по кольцевому высокоскоростному последовательному каналу 7 и входному порту 4 посредством ресурсов высокоскоростного последовательного интерфейса PCI-Express 5, а также организации конфигурирования вычислительных ПЛИС 31, 32 , , 3N. (на фиг. 1 связи не показаны).

Вычислительные ПЛИС 31, 32, , 3N предназначены для аппаратной реализации трудоемких алгоритмов вычислительных задач и осуществляют высокопроизводительную обработку поступающих входных данных.

Вычислительный модуль работает следующим образом. По высокоскоростному входному последовательному интерфейсу PCI-Express 4 осуществляется инициализация портов коммутатора PCI-Express 1, высокоскоростного последовательного интерфейса PCI-Express 5 интерфейсной ПЛИС 2, конфигурирование вычислительных ПЛИС 31, 32, , 3N рабочими проектами и инициализация их высокоскоростных последовательных интерфейсов PCI-Express., Далее в зависимости от алгоритмов выполняемых задач, осуществляется высокоскоростной обмен информацией по входному порту 4 и портом PCI-Express 5 интерфейсной ПЛИС 2 и портами 61, 62, , 6N вычислительных ПЛИС 31, 3 2, , 3N а также выходным портом 8. Высокоскоростной выходной порт 8 последовательного интерфейса PCI-Express предназначен для расширения вычислительного ресурса, например, за счет подключения аналогичных блоков.

Предлагаемый вычислительный модуль поддерживает следующие системы обмена данными:

- обмен индивидуальными данными по входному порту 4 непосредственно с вычислительными ПЛИС 31, 32, , 3N через коммутатор PCI-Express 1 с максимальной скоростью обмена V1max=0.5*Vin_max/N;

- обмен индивидуальными данными по входному порту 4 с вычислительными ПЛИС 31, 32, , 3N через коммутатор PCI-Express 1, интерфейсную ПЛИС 2 и кольцевой высокоскоростной последовательный канал обмена информацией 7 с максимальной скоростью обмена V2max =1.0*Vin_max/N при условии, что скорость передачи информации по кольцевому каналу не меньше Vin_max;

- обмен индивидуальными данными между парами вычислительных ПЛИС 31, 32, , 3N через коммутатор PCI-Express 1 внутри вычислительного модуля с максимальной скоростью обмена V3max=1.0*V in_max*N/2;

- обмен индивидуальными данными между парами вычислительных ПЛИС 31, 32 , , 3N через коммутатор PCI-Express 1 и внешний порт 8 между другими вычислительными модулями с максимальной скоростью обмена V4max=0.5*Vin_max/N

- передача в вычислительные ПЛИС 31, 3 2, , 3N одного и того же входного потока информации по входному порту 4 через коммутатор PCI-Express 1, интерфейсную ПЛИС 2 и кольцевой высокоскоростной последовательный канал обмена информацией 7 с максимальной скоростью потока V5max =1.0*Vin_max*(1+1/N)/2, при условии равенства потоков входной и выходной информации вычислительных ПЛИС, или V5 max=1.0*Vin_max, при условии, когда выходной поток информации вычислительных ПЛИС 31, 32 , , 3N значительно меньше входного.

В соответствии с этим ожидаемая скорость обмена информацией вычислительных ПЛИС 31, 32, , 3N через входной порт 4 будет находиться в диапазоне от (0.5*Vin_max/N) до (1.0*Vin_max *(1+1/N)/2, в зависимости от текущего соотношения различных способов обмена вычислительных ПЛИС 31, 32, , 3N по входному порту.

Предлагаемый вычислительный блок может быть выполнен на следующих элементах: коммутатор PCI-Express 1 на базе микросхемы коммутатора РЕХ8648 фирмы PLX Technology, интерфейсная ПЛИС 2 - микросхеме фирмы Xilinx типа XC6VLX75T-1FFG784C, вычислительные ПЛИС 31 , 32, , 3N - микросхемах фирмы Xilinx типа ХС7К325Т-1FFG900C

Таким образом, вышеизложенные сведения позволяют сделать вывод, что предлагаемый вычислительный блок позволяет увеличить скорость обмена информацией вычислительных ПЛИС по входному порту, а также расширить функциональные (архитектурные) возможности вычислительного блока за счет возможности организации взаимодействия вычислительных ПЛИС между собой как через коммутатор PCI-Express, так и с использованием ресурсов кольцевого высокоскоростного последовательного канала обмена информацией.

Вычислительный модуль, содержащий два внешних порта блока для обмена информацией, коммутатор PCI-Express, интерфейсную и N вычислительных ПЛИС, каждая из которых содержит высокоскоростной последовательный интерфейс PCI-Express, причем порты коммутатора PCI-Express соединены с внешними портами блока и высокоскоростными последовательными интерфейсами PCI-Express интерфейсной ПЛИС и N вычислительных ПЛИС, отличающийся тем, что в него дополнительно введен кольцевой высокоскоростной последовательный канал обмена информацией между интерфейсной ПЛИС и N вычислительными ПЛИС, организованный на базе двух дополнительных независимых высокоскоростных последовательных портов обмена информацией, введенных у интерфейсной ПЛИС и каждой N вычислительных ПЛИС.



 

Наверх