Механизм поиска с двумерной линейно расширяемой параллельной архитектурой

Авторы патента:

G06F17/30 - информационный поиск; структуры баз данных для этой цели

Изобретение относится к поисковым системам. Технический результат заключается в расширении функциональных возможностей. Первая система обработки данных, реализующая механизм поиска с двумерной линейно-расширяемой параллельной архитектурой, содержит устройства обработки данных, которые образуют множества узлов (N), соединенных в сети, причем что первое множество узлов содержит а узлов (Nal,...,Naa) распределения, второе множество узлов содержит b узлов (Nbl,...,Nbb) поиска, третье множество узлов содержит g узлов (Ngl,...,Ngg) индексирования, при этом каждый из узлов (Nb) поиска выполнен с возможностью содержания программного обеспечения поиска, узлы (Ng) индексирования обычно выполнены с возможностью генерирования индексов i для программного обеспечения поиска и необязательно с возможностью генерирования зависящих от разделения множеств dp, k данных для узлов (Nb) поиска. Вторая система обработки дополнительно содержит четвертое множество узлов, содержащее е узлов (Ndl,...,Nde) сбора. 2 с. и 19 з.п.ф-лы, 9 ил.

Текст описания в факсимильном виде (см. графическую часть).

Формула изобретения

1. Система обработки данных, реализующая механизм поиска с двумерной линейно расширяемой параллельной архитектурой, для поиска совокупности текстовых документов D, причем документы могут быть разделены на ряд разделов d₁, d₂...,d_n, совокупность документов D предварительно обрабатывается в системе фильтрации текста так, что получается предварительно обработанная совокупность D_p документов и соответствующие предварительно обработанные разделы d_p1, d_p2,...,d_pn, при этом индекс I может быть сгенерирован из совокупности D документов так, что для каждого предыдущего предварительно обработанного раздела d_p1, d_p2...,d_pn получается соответствующий индекс i₁, i₂,...,i_n, кроме того, поиск раздела d совокупности D документов происходит с зависящим от разделения множеством d_p,k данных, содержащая устройства обработки данных, которые образуют множества узлов (N), соединенных в сети, отличающаяся тем, что первое множество узлов содержит а узлов (N

₁...,N

_a) распределения, второе множество узлов содержит b узлов (N

₁,...,N

_b) поиска, третье множество узлов содержит g узлов (N

₁,...,N

_g) индексирования, причем узлы (N

) распределения соединены в многоуровневой конфигурации в сети, узлы (N

) поиска сгруппированы в

столбцов (S), которые соединены параллельно в сети между узлами (N

) распределения и узлами (N

) индексирования, узлы (N

) распределения выполнены с возможностью обработки запросов поиска и ответов поиска, причем запросы поиска распределяются далее во все узлы (N

) поиска, а ответы поиска возвращаются в узлы (N

) распределения и там объединяются в конечный результат поиска, при этом каждый из узлов (N

) поиска выполнен с возможностью содержания программного обеспечения поиска, узлы (N

) индексирования обычно выполнены с возможностью генерирования индексов i для программного обеспечения поиска и необязательно с возможностью генерирования зависящих от разделения множеств d_p,kданных для узлов (N

) поиска, каждый из которых содержит модуль процессора поиска, число

столбцов (S) узлов поиска расширяется на число n разделов d, таким образом, реализуя расширение объема данных, а число b/

узлов (N

) поиска в каждом столбце (S

) узлов поиска расширяется на оцененную или ожидаемую нагрузку графика, таким образом, реализуя расширение производительности, посредством чего в любом случае поиск совокупности D документов происходит с помощью каждого из столбцов (S) узла (N

) поиска, содержащего одно из зависящих от разделения множеств d_p,k данных и все узлы (N

) поиска в столбце (S

) узлов (N

) поиска содержат одинаковые зависящие от разделения множества d_p,k данных.

2. Система по п.1, отличающаяся тем, что многоуровневая конфигурация узлов (N

) распределения в сети обеспечена с помощью иерархических древовидных структур.

3. Система по п.2, отличающаяся тем, что иерархические древовидные структуры являются двоичными древовидными структурами.

4. Система по п.1, отличающаяся тем, что каждый из узлов (N

) поиска содержит модуль программного обеспечения (ПО) поиска.

5. Система по п.4, отличающаяся тем, что, по меньшей мере, некоторый из узлов (N

) поиска содержит, по меньшей мере, один модуль (М) специализированного процессора поиска, причем каждый модуль (М) специализированного процессора поиска реализован с помощью одной или нескольких микросхем поиска по шаблону (МПШ) специализированного процессора поиска, каждая из которых выполнена с возможностью параллельной обработки ряда q запросов поиска.

6. Система по п.5, отличающаяся тем, что микросхемы (МПШ) специализированного процессора поиска предусмотрены в модулях (М) процессора поиска в у группах (G) процессоров, каждая с z микросхемами (МПШ) процессоров поиска, и соединена с памятью (ОЗУ) и выполнена с возможностью приема данных из памяти (ОЗУ), выделенной для группы (G) процессоров.

7. Система по п.1, отличающаяся тем, что увеличение числа разделов d при расширении объема данных сопровождается соответствующим увеличением числа узлов (N

) распределения и необязательно также увеличением числа узлов (N

) индексирования.

8. Система по п.1, отличающаяся тем, что каждый из узлов (N

) поиска содержит только модуль программного обеспечения (ПО), а зависящее от разделения множество данных содержит только индекс i_k.

9. Система по п.1, отличающаяся тем, что один или несколько узлов поиска содержат модуль программного обеспечения (ПО) поиска и один или несколько модулей (М) специализированного процессора поиска, а зависящее от разделения множество d_p,k данных содержит как предварительно обработанный раздел d_p, так и соответствующий индекс i_k.

10. Система по п.1, отличающаяся тем, что каждое из отдельных множеств узлов (N

, N

) реализовано посредством одной или нескольких рабочих станций, соединенных в сети передачи данных.

11. Система обработки данных, реализующая механизм поиска с двумерной линейно расширяемой параллельной архитектурой, для поиска совокупности текстовых документов D, причем документы могут быть разделены на ряд разделов d₁, d₂,...,d_n, совокупность документов D предварительно обрабатывается в системе фильтрации текста так, что получается предварительно обработанная совокупность D_p документов и соответствующие предварительно обработанные разделы d_p1, d_p2,...,d_pn, при этом индекс I может быть сгенерирован из совокупности D документов так, что для каждого предыдущего предварительно обработанного раздела d_p1, d_p2,...,d_pn, получается соответствующий индекс i₁, i₂, i_n, кроме того, поиск раздела d совокупности D документов происходит с зависящим от разделения множеством d_p,k данных, содержащая устройства обработки данных, которые образуют множества узлов (N), соединенных в сети, отличающаяся тем, что первое множество узлов содержит а узлов (N

₁,...,N

_a) распределения, второе множество узлов содержит b узлов (N

₁,...,N

₂) поиска, третье множество узлов содержит g узлов (N

₁,...,N

_g) индексирования и четвертое множество узлов содержит е узлов (N

₁,...,N

_e) сбора, причем узлы (N

) распределения соединены в многоуровневой конфигурации в сети, узлы (N

) поиска сгруппированы в

столбцов (S), которые соединены параллельно в сети между узлами (N

) распределения и узлами (N

) индексирования, узлы (N

) поиска, при этом каждый из узлов (N

) поиска выполнен с возможностью содержания программного обеспечения поиска, узлы (N

) поиска, каждый из которых содержит модуль процессора поиска, при этом узлы (N

) сбора соединяются в многоуровневой конфигурации в сети подобно конфигурации узлов (N

) распределения и выполнены с возможностью сбора ответов на запросы поиска и вывода из них конечного результата, таким образом, освобождая узлы распределения от этой задачи, число

узлов (N

) поиска в каждом столбце (S

) поиска, содержащего одно из зависящих от разделения множеств d_p,k данных и все узлы (N

) поиска в столбце (S

) узлов (N

) поиска содержат одинаковые зависящие от разделения множества d_p,k данных.

12. Система по п.11, отличающаяся тем, что многоуровневая конфигурация узлов (N

) распределения и узлов (N

) сбора в сети обеспечены с помощью иерархических древовидных структур.

13. Система по п.12, отличающаяся тем, что многоуровневая конфигурация узлов (N

) сбора является зеркальным отображением многоуровневой конфигурации узлов (N

) распределения.

14. Система по п.12, отличающаяся тем, что иерархические древовидные структуры являются двоичными древовидными структурами.

15. Система по п.11, отличающаяся тем, что каждый из узлов (N

) поиска содержит модуль программного обеспечения (ПО) поиска.

16. Система по п.15, отличающаяся тем, что, по меньшей мере, некоторый из узлов (N

17. Система по п.16, отличающаяся тем, что микросхемы (МПШ) специализированного процессора поиска предусмотрены в модулях (М) процессора поиска в у группах (G) процессоров, каждая с z микросхемами (МПШ) процессоров поиска, и соединена с памятью (ОЗУ) и выполнена с возможностью приема данных из памяти (ОЗУ), выделенной для группы (G) процессоров.

18. Система по п.11, отличающаяся тем, что увеличение числа разделов d при расширении объема данных сопровождается соответствующим увеличением числа узлов (N

) распределения и также числа узлов (N

) сбора и необязательно также увеличением числа узлов (N

) индексирования.

19. Система по п.11, отличающаяся тем, что каждый из узлов (N

20. Система по п.11, отличающаяся тем, что один или несколько узлов поиска содержат модуль программного обеспечения (ПО) поиска и один или несколько модулей (М) специализированного процессора поиска, а зависящее от разделения множество d_p,k данных содержит как предварительно обработанный раздел d_p, так и соответствующий индекс i_k.

21. Система по п.11, отличающаяся тем, что каждое из отдельных множеств узлов (N

, N

) реализовано посредством одной или нескольких рабочих станций, соединенных в сети передачи данных.

РИСУНКИ

Рисунок 1, Рисунок 2, Рисунок 3, Рисунок 4, Рисунок 5, Рисунок 6, Рисунок 7, Рисунок 8, Рисунок 9, Рисунок 10, Рисунок 11, Рисунок 12, Рисунок 13, Рисунок 14, Рисунок 15, Рисунок 16, Рисунок 17, Рисунок 18, Рисунок 19, Рисунок 20, Рисунок 21, Рисунок 22, Рисунок 23, Рисунок 24, Рисунок 25, Рисунок 26, Рисунок 27, Рисунок 28, Рисунок 29, Рисунок 30

Изобретение относится к системам для поиска, распределения и использования учебных материалов

Способ идентификации товаров на принадлежность к объектам экспортного контроля // 2225031

Изобретение относится к способам идентификации объектов экспертных исследований и может быть использовано при идентификации товаров на принадлежность к объектам экспортного контроля

Управление данными развлекательной системы // 2225029

Изобретение относится к развлекательным компьютерным системам

Устройство поиска вхождения образца // 2223539

Изобретение относится к средствам информатики и вычислительной технике и может быть использовано для решения задач по упорядочению слов текстов

Устройство сортировки слов // 2223538

Изобретение относится к средствам информатики и вычислительной техники и может быть использовано для решения задач по упорядочению слов текстов

Справочная правовая система хранения и поиска данных // 2223537

Изобретение относится к информационно-поисковым системам, которые имеют тематические базы данных и базы данных законодательных документов

Система передачи и контроля документов // 2222045

Изобретение относится к системе создания сообщений для электронной почты

Параллельная система поиска произвольных вхождений // 2220448

Изобретение относится к техническим средствам информатики и вычислительной техники и может быть использовано для решения задач по составлению словарей, справочников, а также созданию баз данных

Устройство для управления распределением данных в информационной сети клиент-сервер // 2218595

Изобретение относится к вычислительной технике, в частности к устройствам для управления распределением данных в информационной сети клиент - сервер

Способ идентификации динамических структур с изменяемыми параметрами // 2217792

Изобретение относится к вычислительной технике и может быть использовано при построении автоматизированных банков данных, хранилищ информации и систем искусственного интеллекта

Способ определения рейтинга услуг и система для определения рейтинга // 2231114

Изобретение относится к автоматизированным электронным системам по обслуживанию абонентов для определения рейтингов услуг предприятий общественного питания

Способ и устройство для управления доступом к интернету в компьютерной системе и считываемый компьютером носитель информации для хранения компьютерной программы // 2231115

Изобретение относится к способу и устройству для управления просмотром интернет-сайтов

Способ и устройство для быстрого и произвольного доступа к записям переменного размера, сохраненным в памяти в секционированном формате // 2233472

Изобретение относится к системам мобильной телефонной связи

Устройство и способ выполнения высокоскоростного поиска маршрутов протокола интернет и управления таблицами маршрутизации/пересылки // 2233473

Изобретение относится к способам маршрутизации для пересылки пакетов по месту назначения в сети Интернет и может быть использовано, в частности, при выполнении высокоскоростного поиска IP (протокол Интернет) маршрута и при управлении таблицей маршрутизации или пересылки

Способ и устройство для централизованного сбора географически распределенных данных // 2235358

Изобретение относится к способу и устройству для централизованного сбора графически распределенных данных, в частности к интерактивному способу сбора данных

Способ поиска и выборки информации с повышенной релевантностью // 2236699

Изобретение относится к средствам поиска и идентификации документов по их описаниям, находящимся в различных базах данных и информационных ресурсах с различными стандартами формирования документов

Система управления распределением данных в информационной сети гас "выборы" // 2239229

Изобретение относится к вычислительной технике, в частности к системам управления распределения данных в информационной сети Государственной автоматизированной системы “Выборы”

Система предоставления данных и сервер для хранения и предоставления данных // 2240596

Изобретение относится к средствам, обеспечивающим пользователей сети данными о различного рода человеческой деятельности и ее результатах

Устройство для управления поиском текстовых документов в информационной базе данных // 2241253

Изобретение относится к вычислительной технике

Способ и система обеспечения доступа к информации в сети с использованием функций псевдонима сообщения, имеющей теневые функции обратного вызова // 2245578

Изобретение относится к способу и системам осуществления доступа к сетевой информации и формирования команд сетевых серверов