Система автоматизированного упорядочения неструктурированного информационного потока входных данных

 

Полезная модель относится к техническим средствам информатики и вычислительной техники и может быть использовано для решения задач автоматизированного сравнения и анализа на основе преобразования неструктурированного потока входных данных в объектную форму, хранения и поддержания информационного массива данных в активном состоянии непосредственно при подготовке и их использовании, в том числе и децентрализовано. Технические результаты: одновременный перевод поступающих данных с иностранных языков на родной язык пользователя системы; защита от несанкционированного использования системой заинтересованных лиц, не имеющих доступ пользователя; идентификация пользователя; контроль и анализ в процессе работы пользователя; создание собственного идентифицирующего сертификата пользователя и уровень доступа в систему; возможность упорядочения неструктурированных или слабо структурированных данных, в том числе и децентрализовано; автоматическая или полуавтоматическая отбраковка информации, не представляющей интереса для пользователя. Система включает в себя, устройство пользователя, соединенное с устройством централизованного управления, в состав которого, входят устройство регистрации пользователя системы, блок декодирования, блок кодирования, устройство управления процессом операции, устройство хранения, классификации и поиска упорядоченных данных, устройство формирования и хранения данных по пользователям системы, регистрации упорядоченных данных и устройство контроля и анализа операции, устройство хранения, классификации и поиска упорядоченных данных содержит блок управления, устройство автоматизированного упорядочения данных, блок памяти упорядоченных данных и блок формирования поиска объекта данных, устройство автоматизированного упорядочения данных содержит блок управления, блок распознавания кодировок, блок кодировок и правил распознавания, блок корреляционных зависимостей конструкций языков или диалектов, блок хранения заимствованных библиотек, блок информационно-логической обработки объекта в объектную форму, блок настроек и сценариев классификации распознавания объектов.

Область техники

Полезная модель относится к техническим средствам информатики и вычислительной техники и может быть использовано для решения задач автоматизированного сравнения и анализа на основе преобразования неструктурированного потока входных данных в объектную форму, хранения и поддержания информационного массива данных в активном состоянии непосредственно при подготовке и их использовании, в том числе и децентрализовано.

Уровень техники

Известно «Устройство обработки информации для информационного поиска», патент РФ №2096825, oп. 20.11.1997, МПК G 06 F 17/00, в котором содержатся блок сопряжения с памятью, блок ввода-вывода, буферная память ввода-вывода, блок управления, буферная память, блок отображения, входы-выходы которых соединены через магистральную шину друг с другом, память исходного массива, выход которой соединен со входом блока сопряжения с памятью, наборное поле, выход которого соединен со входом блока ввода-вывода, блок синтеза текстовых фрагментов, блок структурного анализа текстового фрагмента, блок символьной обработки текстового фрагмента, блок корректировки словаря словосочетаний, блок синтеза первичного словаря, блок фильтрации первичного словаря, блок синтеза вторичных словарей, блок анализа вторичных словарей, блок синтеза архивной карточки, блок архивации текстовых фрагментов, блок корректировки системных словарей, память архивной карточки, входы - выходы которых соединены через магистральную шину друг с другом, вход блока отображения соединен с выходом блока ввода - вывода.

К недостаткам устройства можно отнести то, что оно не позволяет провести непосредственные преобразования поступающей в него информационных потоков в единый унифицированный формат таким образом, чтобы в дальнейшем информационные потоки можно было подвергнуть автоматизированному анализу, независимо от первоначальных

форм представления, с помощью ограниченного набора стандартных процедур, в том числе децентрализовано; не предусматривает возможности одновременного перевода поступающих данных с иностранных языков на родной язык пользователя, что становится особенно актуальным в условиях расширения доступа к ресурсам сети Internet; не предусматривает защиты от несанкционированного использования системой заинтересованных лиц, не имеющих доступ пользователя; не позволяет осуществлять контроль и анализ в процессе работы пользователя из-за отсутствия соответствующих функциональных устройств; не предусматривает возможности идентификации пользователя; не предусматривает создания собственного идентифицирующего сертификата пользователя и уровень доступа в систему; не позволяет осуществлять возможность упорядочения неструктурированных (слабо структурированных) данных, таких, как таблица, интервью, справочник, графическое изображение, звуковая информация, видеоинформация и т.д.); не предусматривает автоматическую или полуавтоматическую отбраковку информации, не представляющей интереса для пользователя, из контура дальнейшей обработки.

Известна система, позволяющая реализовать «Способ упорядочения данных, представленных в текстовых информационных блоках данных», патент РФ №2210809, oп. 20.08.2003, по МПК G 06 F 17/28, ориентированный на анализ исходных текстов, в которой содержатся блок преобразования исходного текста в совокупность взаимосвязанных объектов на основе таблицы настроек, содержащей знания о структуре исследуемой системы в виде совокупности образующих ее классов, включающих определенный набор атрибутов, в том числе взаимосвязи и отношения между объектами заданных классов, блок установленных для каждого атрибута правил распознавания атрибута в тексте, буферная память ввода-вывода, блок управления, буферная память, блок отображения, входы-выходы которых соединены через магистральную шину друг с другом, память исходного массива, выход которой соединен со входом блока сопряжения с памятью, блок структурного анализа текстового фрагмента, блок символьной обработки текстового фрагмента, блок синтеза архивной карточки,

блок архивации текстовых фрагментов, память архивной карточки, входы-выходы которых соединены через магистральную шину друг с другом, вход блока отображения соединен с выходом блока ввода-вывода.

К недостаткам системы можно отнести то, что она не позволяет провести непосредственные преобразования поступающей в нее информационных потоков в единый унифицированный формат таким образом, чтобы в дальнейшем информационные потоки можно было подвергнуть автоматизированному анализу, независимо от первоначальных форм представления, с помощью ограниченного набора стандартных процедур, в том числе децентрализовано; не предусматривает возможности одновременного перевода поступающих данных с иностранных языков на родной язык пользователя, что становится особенно актуальным в условиях расширения доступа к ресурсам сети Internet; не предусматривает защиты от несанкционированного использования системой заинтересованных лиц, не имеющих доступ пользователя; не позволяет осуществлять контроль и анализ в процессе работы пользователя из-за отсутствия соответствующих функциональных устройств; не предусматривает возможности идентификации пользователя; не предусматривает создания собственного идентифицирующего сертификата пользователя и уровень доступа в систему; не позволяет осуществлять возможность упорядочения неструктурированных (слабо структурированных) данных, таких, как таблица, интервью, справочник, графическое изображение, звуковая информация, видеоинформация и т.д.); не предусматривает автоматическую или полуавтоматическую отбраковку информации, не представляющей интереса для пользователя, из контура дальнейшей обработки.

Наиболее близким аналогом к заявляемой полезной модели является «Система для управления совершением сделок с результатами интеллектуальной деятельности (РИД)», патент РФ на полезную модель №34773, oп. 10.12.2003, по МПК G 06 F 17/60.

Система для управления совершением сделок с результатами интеллектуальной деятельности (РИД), включающая в себя, устройство управления банка, устройство управления покупателя,

устройство продавца, соединенные посредством канала связи с устройством централизованного управления и устройством хранения и проверки сертификатов, соединенном, устройством централизованного управления, в состав которого, входят блок регистрации участников системы, блок формирования и хранения базы данных по операциям, совершаемым между участниками системы, блок формирования и хранения базы данных по заключенным между участниками системы договорам, блок управления данными, касающихся проведения финансовых операций, блок контроля и анализа процесса совершения сделки между участниками системы, блок управления процессом совершения сделки, блок формирования и хранения базы данных по участникам системы, блок формирования и хранения базы данных услуг, блок анализа финансово-хозяйственной деятельности участников системы, соединенное с упомянутым блоком контроля и анализа процесса совершения сделки между участниками системы, блок анализа финансово-хозяйственной деятельности участников системы, соединенное с блоком контроля и анализа процесса совершения сделки между участниками системы, блок управления документооборотом, при этом блок регистрации участников системы соединен с блоком формирования и хранения базы данных по участникам системы и с входом и выходом устройства централизованного управления, с которыми также соединен блок управления процессом совершения сделки, который, в свою очередь, соединен с блоком управления документооборотом, с блоком управления данными, касающимися проведения финансовых операций, с блоком формирования и хранения базы данных услуг, с блоком контроля и анализа процесса совершения сделки между участниками системы, соединенным с выходом устройства централизованного управления, с блоком формирования и хранения базы данных по участникам системы и с блоком формирования и хранения базы данных по операциям, совершаемым между участниками системы, который, в свою очередь соединен с блоком формирования и хранения базы данных по заключенным между участниками системы договорам, при этом система содержит, устройство управления эксперта, устройство управления наблюдателя, устройство управления администратора, каждое из которых, соединено

посредством канала связи с устройством централизованного управления и устройством хранения и проверки сертификатов, соединенным с устройством централизованного управления, в состав которого входят блок управления процессом администрирования системы, блок управления штрафными санкциями, блок управления процессом классификации и блок формирования, хранения, классификации и поиска РИД, а также формирования, хранения и поиска услуг в сфере оборота РИД, причем упомянутый блок управления процессом администрирования системы соединен с блоком регистрации участников, с блоком формирования и хранения данных по участникам системы, который соединен с блоком управления процессом совершения сделки, при этом упомянутый блок управления процессом администрирования системы, блок управления штрафными санкциями, блок управления процессом классификации соединены с блоком декодирования и блоком кодирования, а также с блоком управления процессом совершения сделки, блоком формирования и хранения базы данных операций, блоком формирования и хранения данных по участникам системы, блоком контроля и анализа процесса совершения сделки, блоком управления проведения финансовых операций, блоком управления документооборотом, блоком формирования и хранения базы данных по заключенным договорам и блоком анализа финансово-хозяйственной деятельности.

К недостаткам системы можно отнести то, что она не позволяет провести непосредственные преобразования поступающей в нее информационных потоков в единый унифицированный формат таким образом, чтобы в дальнейшем информационные потоки можно было подвергнуть автоматизированному анализу, независимо от первоначальных форм представления, с помощью ограниченного набора стандартных процедур, в том числе децентрализовано; не предусматривает возможности одновременного перевода поступающих данных с иностранных языков на родной язык пользователя, что становится особенно актуальным в условиях расширения доступа к ресурсам сети Internet; не предусматривает защиты от несанкционированного использования системой заинтересованных лиц, не имеющих доступ пользователя; не позволяет осуществлять контроль и анализ в процессе

работы пользователя из-за отсутствия соответствующих функциональных устройств; не предусматривает возможности идентификации пользователя; не предусматривает создания собственного идентифицирующего сертификата пользователя и уровень доступа в систему; не позволяет осуществлять возможность упорядочения неструктурированных (слабо структурированных) данных, таких, как таблица, интервью, справочник, графическое изображение, звуковая информация, видеоинформация и т.д.); не предусматривает автоматическую или полуавтоматическую отбраковку информации, не представляющей интереса для пользователя, из контура дальнейшей обработки.

Сущность полезной модели

Современный уровень развития инструментального обеспечения информационно-аналитических подразделений, например, групп, компаний и т.п., выявил ряд проблем, возникающих в их деятельности, основными из которых являются следующие.

1) Сбор, обобщение и систематизация больших объемов данных, поступающих из различных информационных источников разных видов представления.

2) Поддержание в актуальном состоянии имеющихся информационных массивов (баз данных, информационных и информационно-поисковых систем).

3) Архивирование и обмен данными при подготовке и выполнении информационно-аналитических работ в условиях отсутствия типовых (или унифицированных) систем каталогизации.

Использование большого количества информационных источников приводит к необходимости форматного преобразования данных, которые являются необходимым исходным материалом для выполнения информационно-аналитических работ. Это требует введения дополнительного этапа преобразования входного информационного потока к требуемому виду, обеспечивающему возможности актуализации информационных массивов и выполнения информационно-аналитических работ.

Актуализация информационных массивов в настоящее время вопрос наиболее ресурсоемкий, требующий комплексного решения

вопросов снижения временных потерь при регистрации поступающих данных, поиске и выборке необходимых данных, технической организации информационных хранилищ, обеспечения сохранности данных и ряда других, взаимоувязанных в общей технологической последовательности информационно-аналитической деятельности.

Актуальность рассмотренных выше проблем значительно возрастает для коллективов малой численности, когда не обеспечивается возможность удовлетворительного решения совокупности проблем.

Существующие системы автоматизированного анализа неформализованных текстов основываются на:

- способах поиска данных по заданным пользователем поисковым контекстам с использованием логических связок между контекстами;

- методах частотного анализа повторяемости слов;

- методах грамматического анализа текстов, основанных на синтаксическом и семантическом разборе предложений.

Однако грамматический анализ текстов эффективен тогда, когда исходный текст составлен по правилам контекстно-свободных грамматик (КС-грамматик) или грамматик определенных правил (ОК-грамматик). В текстах, основанных на правилах контекстно-зависимых грамматик, каковыми являются подавляющее большинство реально используемых человеком документов, эти методы оказываются неэффективными. Методы частотного анализа дают возможность сделать интегральную оценку текста (дать представление, о чем идет речь), но не позволяют дать детальной картины структуры и взаимосвязей объектов. Большей универсальностью обладают методы контекстного поиска, однако они, как правило, узко специализированы и каждый раз требуют настройки на конкретный поисковый образ (либо необходимо обеспечить хранение группы настроек).

Задача, на решение которой направлена полезная модель, заключается в создании оперативной, эффективной и надежной системы автоматизированного упорядочения неструктурированного информационного потока входных данных, которая позволяет стандартизировать и унифицировать поток входных данных в целях последующего автоматизированного сравнения и анализа на основе преобразования неструктурированного потока входных данных в объектную форму,

хранения и поддержания информационного массива данных в активном состоянии непосредственно при подготовке и их использовании, в том числе и децентрализовано.

Технические результаты полезной модели:

- одновременный перевод поступающих данных с иностранных языков на родной язык пользователя или пользователей системы;

- защита от несанкционированного использования системой заинтересованных лиц, не имеющих доступ пользователя;

- идентификация пользователя;

- контроль и анализ в процессе работы пользователя;

- создание собственного идентифицирующего сертификата пользователя и уровень доступа в систему;

- возможность упорядочения неструктурированных (слабо структурированных) данных, таких, как таблица, интервью, справочник, графическое изображение, звуковая информация, видеоинформация и т.д.), в том числе и децентрализовано;

- автоматическая или полуавтоматическая отбраковка информации, не представляющей интереса для пользователя, из контура дальнейшей обработки.

Технические результаты достигаются тем, что упорядочение слабо структурированного информационно-неоднородного потока входных данных осуществляется системой, которая включает в себя, по меньшей мере, одно устройство пользователя, соединенное посредством канала связи с устройством централизованного управления, в состав которого, входят устройство регистрации пользователя системы, блок декодирования, блок кодирования, устройство управления процессом операции, устройство хранения, классификации и поиска упорядоченных данных, устройство формирования и хранения данных по пользователям системы, регистрации упорядоченных данных и устройство контроля и анализа операции, причем упомянутое устройство регистрации пользователя системы соединено с выходом упомянутого блока декодирования и выходом упомянутого блока кодирования, упомянутое устройство управления процессом операции соединено с выходом упомянутого блока декодирования и входом упомянутого блока кодирования, а так же с упомянутым устройством

хранения, классификации и поиска упорядоченных данных, упомянутые устройство управления процессом операции, устройство формирования и хранения данных по участникам системы, устройство регистрации упорядоченных данных и устройство контроля и анализа операции соединены между собой, упомянутое устройство контроля и анализа операции соединено с входом упомянутого блока кодирования, упомянутое устройство хранения, классификации и поиска упорядоченных данных содержит блок управления, устройство автоматизированного упорядочения данных, блок памяти упорядоченных данных и блок формирования поиска объекта данных, причем упомянутый блок памяти упорядоченных данных соединен с входом упомянутого устройства автоматизированного упорядочения данных и упомянутым блоком формирования поиска объекта данных, упомянутый блок памяти упорядоченных данных соединен с упомянутым устройством автоматизированного упорядочения данных и с упомянутым блоком формирования поиска объекта данных, упомянутое устройство автоматизированного упорядочения данных содержит блок управления, блок распознавания кодировок, блок кодировок и правил распознавания, по меньшей мере, один блок корреляционных зависимостей конструкций языков или диалектов, по меньшей мере, один блок хранения заимствованных библиотек, блок информационно-логической обработки объекта в объектную форму, блок настроек и сценариев классификации распознавания объектов, причем упомянутый блок распознавания кодировок соединен, по меньшей мере, с одним упомянутым блоком корреляционных зависимостей конструкций языков или диалектов, с упомянутым блоком кодировок и правил распознавания и выходом упомянутого блока управления, упомянутый блок информационно-логической обработки объекта в объектную форму соединен с упомянутым блоком настроек и сценариев классификации распознавания объектов, с выходом упомянутого блока распознавания кодировок и входом упомянутого блока управления, упомянутые, по меньшей мере, один упомянутый блок корреляционных зависимостей конструкций языков или диалектов и, по меньшей мере, один упомянутый блок хранения заимствованных библиотек соединены между собой. При этом генерируемый в процессе анализа входных данных

объект содержит только свое уникальное имя, но в процессе анализа входного информационного потока может дополняться структурными элементами, необходимость введения которых будет определяться целями выполняемой работы и той информацией, которая содержится во входных данных. Более того, генерируемые информационные объекты в рассматриваемом случае наследуют один из возможных типов объектов (в рамках принятой системы каталогизации), обеспечивая тем самым унификацию структурного определения объекта, создавая информационное поле системы, причем наследуемая структура не обязательно должна быть жесткой, напротив, целесообразно обеспечить более полный ее полиморфизм, что в значительной степени позволяет облегчить упорядочение слабоструктурированного входного информационного потока, отличающегося информационной неоднородностью. Кроме того, структурный полиморфизм обеспечивает учет индивидуальных особенностей анализируемого информационного объекта, а также возможности инкапсуляции других объектов, в том числе созданных другими исполнителями, которые вводят дополнительные структурные элементы в уже существующие объекты и закрепляют за ними информационные фрагменты непосредственно в процессе анализа входного информационного потока.

Технические результаты могут достигаться тем, что устройство хранения и проверки сертификатов, которое содержит блок декодирования, блок кодирования, блок управления, блок памяти для хранения информации о каждом пользователе системы, блок контроля и блок памяти для хранения действующих и аннулированных сертификатов, причем, упомянутый блок управления соединен с упомянутым блоком памяти для хранения информации о каждом пользователе системы, упомянутым блоком памяти для хранения действующих и аннулированных сертификатов и упомянутым блоком контроля, а так же с выходом упомянутого блока декодирования и входом упомянутого блока кодирования.

Технические результаты могут достигаться тем, что, по меньшей мере, одно устройство управления пользователя, которое содержит блок декодирования, блок идентификации, блок кодирования, блок формирования электронной цифровой подписи (ЭЦП), блок

управления, блок формирования запроса пользователя, блок формирования ответа пользователя, причем упомянутый блок идентификации соединен с выходом упомянутого блока декодирования и входом упомянутого блока управления, упомянутый блок формирования ЭЦП соединен с выходом упомянутого блока управления, с входом упомянутого блока кодирования и выходом упомянутого блока формирования сигнала исполнения операции, упомянутый блок управления соединен с упомянутым блоком формирования запроса пользователя и упомянутым блоком формирования ответа пользователя.

Технические результаты могут достигаться тем, что устройство регистрации пользователя системы, которое содержит блок декодирования, блок кодирования, блок управления, блок регистрации сертификатов и блок регистрации пользователя системы, причем упомянутый блок управления соединен с упомянутым блоком регистрации сертификатов и упомянутым блоком регистрации пользователя системы, а так же с выходом упомянутого блока декодирования и входом блока кодирования.

Технические результаты могут достигаться тем, что устройство управления процессом операции содержит соединенные между собой блок управления и блок формирования сценариев прохождения операции.

Технические результаты могут достигаться тем, что устройство формирования и хранения данных по пользователям системы содержит блок управления, блок памяти для хранения реквизитов пользователя системы и блок памяти для хранения уровня доступа пользователя системы, причем упомянутый блок управления соединен с упомянутыми блоком памяти для хранения реквизитов пользователя системы и упомянутым блоком памяти для хранения уровня доступа пользователя системы.

Технические результаты могут достигаться тем, что устройство регистрации упорядоченных данных содержит блок управления, блок регистрации документов и блок памяти для хранения промежуточных документов, причем упомянутый блок управления соединен с упомянутым блоком регистрации документов и упомянутым блоком памяти для хранения промежуточных документов.

Технические результаты могут достигаться тем, что устройство контроля и анализа операции содержит блок управления и блок оповещения пользователя системы, причем выходы упомянутых блоков соединены между собой, дополнительный выход упомянутого блока управления соединен с упомянутым блоком оповещения пользователя системы.

При этом автоматизация работ, связанных с упорядочением слабо структурированного информационно-неоднородного потока входных данных, где принятая информационная и ссылочная организация объектов в системе объединяются данные в информационные кластеры и система реализует механизм использования ранее накопленных знаний, содержащихся в других объектах. Объекты, данные в которых модифицируются независимо, ссылаются на другие объекты и образуют кластеры данных или информационные поля, что делает доступными все данные кластера, в который входит выбранный объект вне зависимости от того, какой объект кластера будет выбран системой первым. Система автоматизирует упорядочение слабо структурированного информационно-неоднородного потока входных данных, где каждый информационный объект содержит собственные данные и ссылки на другие объекты. Вся информация об объекте находится в самом объекте или в объектах, для которых определены ссылки, что позволяет отказаться от анализа информационно-ссылочной структуры внутри информационного поля. Система также модифицирует информационную и ссылочную организацию: устанавливает ссылочные отношения между объектами различных кластеров, приводя к незамедлительному объединению данных, принадлежащих этим кластерам. Изменения становятся доступными для всех объектов, содержащих ссылку на модифицируемый объект, сразу, как только они происходят. Последнее является наиболее эффективным инструментом использования ранее накопленных знаний.

Краткое описание чертежей

Работа системы поясняется чертежами, на которых представлены возможные реализации системы.

На фиг.1 представлена функциональная схема системы автоматизированного упорядочения неструктурированного информационного

потока входных данных.

На фиг.2 представлена функциональная схема устройства хранения и проверки сертификатов.

На фиг.3 представлена функциональная схема устройства управления пользователя.

На фиг.4 представлена функциональная схема устройства централизованного управления.

На фиг.5 представлена функциональная схема устройства регистрации участников системы.

На фиг.6 представлена функциональная схема устройства управления процессом операции.

На фиг.7 представлена функциональная схема устройства формирования и хранения данных по участникам системы.

На фиг.8 представлена функциональная схема устройства регистрации упорядочения данных.

На фиг.9 представлена функциональная схема блока контроля и анализа операций между участниками системы.

На фиг.10 представлена функциональная схема устройства хранения классификации и поиска упорядоченных данных.

На фиг.11 представлена функциональная схема блока устройства автоматизированного упорядочения данных.

Подробное описание полезной модели

Система автоматизированного упорядочения неструктурированного информационного потока входных данных содержит устройство управления пользователя 1. устройство хранения и проверки сертификатов 2, устройство централизованного управления 3.

В состав системы может одновременно входить несколько устройств управления пользователя 1, каждое из которых, соединено посредством канала связи с устройством централизованного управления 3, и устройством хранения и проверки сертификатов 2. (фиг.1)

Устройство хранения и проверки сертификатов 2 (фиг.2) содержит блок декодирования 4, блок кодирования 5, блок управления 6, блок контроля 8, блок памяти для хранения информации о пользователе системы 7, блок памяти для хранения действующих и

аннулированных сертификатов 9. При этом блок кодирования 5 и блок декодирования 4 соединены с блоком управления 6, который в свою очередь соединен с блоком контроля 8, с блоком памяти для хранения информации о пользователях системы 7 и с блоком памяти для хранения действующих и аннулированных сертификатов 9.

Устройство управления пользователя 1 (фиг.3) содержит блок декодирования 10, блок идентификации 11, блок кодирования 12, блок формирования ЭЦП 13, блок управления 14, блок формирования запроса пользователя 15, блок формирования ответа пользователя 16 и блок формирования сигнала исполнения сделки 17. При этом блок управления 14 соединен через блок идентификации 11 с блоком декодирования 10 и через блок формирования ЭЦП 13 с блоком кодирования 12, а так же с блоком формирования запроса пользователя 15, с блоком формирования ответа пользователя 16. Блок формирования ЭЦП 13 соединен с блоком формирования сигнала исполнения сделки 17.

Устройство централизованного управления 3 (фиг.4), содержит устройство регистрации пользователя системы 21, блока декодирования 20, блока кодирования 26, устройство управления процессом операции 22, устройством хранения, классификации и поиска упорядоченных данных 27, устройство формирования и хранения данных по пользователям системы 23, регистрации упорядоченных данных 24 и устройство контроля и анализа операции 25, устройство регистрации пользователя системы 21 соединено с выходом блока декодирования 20 и выходом блока кодирования 26, устройство управления процессом операции 22 соединено с выходом блока декодирования 20 и входом блока кодирования 20, а так же с устройством хранения, классификации и поиска упорядоченных данных 27, устройство управления процессом операции 22, устройство формирования и хранения данных по пользователям системы 23, устройство регистрации упорядоченных данных 24 и устройство контроля и анализа операции 25 соединены между собой, устройство контроля и анализа операции 25 соединено с входом блока кодирования 26, устройство хранения, классификации и поиска упорядоченных данных 27 содержит блок управления 43, устройство автоматизированного

упорядочения данных 44, блок памяти упорядоченных данных 45 и блок формирования поиска объекта данных 46, блок памяти упорядоченных данных 45 соединен с входом устройства автоматизированного упорядочения данных 44 и блоком формирования поиска объекта данных 46, блок памяти упорядоченных данных 45 соединен с устройством автоматизированного упорядочения данных 44 и с блоком формирования поиска объекта данных 46, устройство автоматизированного упорядочения данных 44 содержит блок управления 47, блок распознавания кодировок 48, блок кодировок и правил распознавания 49, по меньшей мере, один блок корреляционных зависимостей конструкций языков или диалектов 50, по меньшей мере, один блок хранения заимствованных библиотек 51, блок информационно-логической обработки объекта в объектную форму 52, блок настроек и сценариев классификации распознавания объектов 53, причем блок распознавания кодировок 48 соединен с блоком корреляционных зависимостей конструкций языков или диалектов 50, с блоком кодировок и правил распознавания 49 и выходом блока управления 47, блок информационно-логической обработки объекта в объектную форму 52 соединен с блоком настроек и сценариев классификации распознавания объектов 53, с выходом блока распознавания кодировок 48 и входом блока управления 47, блок корреляционных зависимостей конструкций языков или диалектов 50 и блок хранения заимствованных библиотек 51 соединены между собой.

Устройство регистрации пользователя системы 21, содержит блок декодирования 28, блок кодирования 29, блок управления 30, блок регистрации сертификатов 31 и блок регистрации пользователя систем 32. Блок управления 30 соединен с блоком регистрации сертификатов 31 и блоком регистрации пользователя системы 32, а так же с выходом блока декодирования 28 и входом блока кодирования 29.

Устройство управления процессом операции 22 содержит соединенные между собой блок управления 33 и блок формирования сценариев прохождения операции 34.

Устройство формирования и хранения данных по пользователям системы 23 содержит блок управления 35, блок памяти для хранения

реквизитов пользователя системы 36 и блок памяти для хранения уровня доступа пользователя системы 37. Блок управления 35 соединен с блоком памяти для хранения реквизитов пользователя системы 36 и блоком памяти для хранения уровня доступа пользователя системы 37.

Устройство регистрации упорядоченных данных 24 содержит блок управления 38, блок регистрации документов 39 и блок памяти для хранения промежуточных документов 40. Блок управления 38 соединен с блоком регистрации документов 39 и блоком памяти для хранения промежуточных документов 40.

Устройство контроля и анализа операции 25 содержит блок управления 41 и блок оповещения пользователей системы 42. Выходы блоков соединены между собой, дополнительный выход блока управления 41 соединен с блоком оповещения участников системы 42.

Для того чтобы активизировать систему пользователь должен зарегистрироваться. Для этого он должен передать в электронном виде в устройство центрального управления 3 свои реквизиты (например, номер рабочего места, и т.д.) и при желании дополнительно идентифицирующие его личность данные, например отпечатки пальцев, изображение сетчатки глаза, образец голоса и т.п. Эти данные будут записаны соответственно в блок памяти для хранения реквизитов участников системы 36 и в блок памяти для хранения уровня доступа участников системы 37. С помощью соответствующего программного обеспечения пользователь генерирует собственный сертификат, который содержит следующую информацию: код ключа, дата выдачи сертификата и срок его действия, данные об организации, выдавшей соответствующее программное обеспечение, предназначенное для генерации сертификата, наименование лица (пользователя системы), на чье имя формируется сертификат, класс, соответствующий уровню доступа, разрешенного для данного пользователя в системе. Полученный таким образом сертификат пользователь передает в закодированном электронном виде на вход устройства хранения и проверки сертификатов 2, с которого информация через блок декодирования 4 поступает в блок управления 6, входящее в состав устройства хранения и проверки сертификатов 2. (В случае,

когда в состав электронной системы входит устройство для генерации сертификатов (на фиг. не показано), сертификат может быть получен в результате работы данного устройства.) Блок управления 6 распознает тип поступившего запроса как сертификат.

В системе, например, используются следующие типы запросов:

- сертификат;

- идентификатор пользователя;

- запрос пользователя с ЭЦП для упорядочения неструктурированного информационного потока входных данных для дальнейшего использования в системе в объектной форме для дальнейшего использования в системе;

- запрос участника с ЭЦП для поиска и использования зарегистрированного в системе объекта (объектов) информации;

Определив поступившие данные как новый сертификат, блок управления 6, входящий в состав устройства хранения и проверки сертификатов 2, пересылает их в закодированном виде в устройство регистрации участников системы 21, где после декодирования они поступают в блок управления 30, входящее в состав устройства регистрации участников системы 21, который в свою очередь передает их в блок регистрации участников системы 32, который фиксирует, что данный пользователь получил определенный сертификат, и в зависимости от типа пользователя (пользователь, пользователь высшей квалификации, администратор) присваивает ему уровень доступа, блок регистрации сертификатов 31 фиксирует, что данный сертификат выдан и присваивает сертификату определенный идентификатор (пароль) участника системы. По мере использования системы участником системы уровень доступа может изменяться в зависимости от выполняемых участником информационно-аналитических операций. устройство регистрации участников системы 21 передает данные, представляющие собой сертификат и соответствующий ему идентификатор, для хранения в блок памяти для хранения действующих и аннулированных сертификатов 9, а данные о начальном уровне доступа, присвоенные владельцу сертификата, передает для хранения в блок памяти для хранения уровня доступа участников системы 37. После

регистрации в системе пользователь получает статус участника системы.

Договор участника о регистрации в системе (с предоставлением начального уровня доступа в системе) может быть заключен в электронном и/или бумажном виде.

Подключение пользователя к системе.

Процедура авторизации производится указанным далее способом.

По обращению участника системы, например, пользователя переданного с устройства управления пользователя 1 в устройство централизованного управления 3, происходит подключение устройства управления пользователя 1 к устройству централизованного управления 3. Для подключения устройства управления пользователя 1 к устройству централизованного управления 3 участник системы вводит в устройство управления пользователя 1 свой идентификационный номер (пароль) либо с клавиатуры, либо с помощью пластиковой карточки, либо других носителей информации, который блок кодирования 5 кодирует и передает по каналам связи, на вход устройства хранения и проверки сертификатов 1. С входа устройства хранения и проверки сертификатов 1 данные, представляющие собой зашифрованный пароль, поступают в блок управления 6, входящее в состав устройства хранения и проверки сертификатов 2. Указанный блок управления 6 распознает тип поступившего запроса как пароль участника системы и передает эти данные в блок контроля 8, который проверяет наличие действующего сертификата, соответствующего полученному паролю, для чего блок контроля 10 выделяет из данных, формирующих пароль, номер соответствующего паролю сертификата, и по этому номеру формирует запрос, который посылает в блок памяти для хранения действующих и аннулированных сертификатов 9. Если в блоке памяти для хранения действующих и аннулированных сертификатов 9 сертификат под запрашиваемым номером среди действующих сертификатов не обнаружен, то блок контроля 8 формирует команду об отключении пользователя от системы и посылает ее в блок управления 6, входящее в состав устройства хранения и проверки сертификатов 2, в случае положительного результата

поиска блок контроля 10 проверяет соответствие пароля найденному сертификату, если результат сравнения окажется отрицательным, то блок контроля 8 формирует команду об отключении пользователя от системы и посылает ее в блок управления 6, входящее в состав устройства хранения и проверки сертификатов 2, в обратном случае блок контроля 8 формирует команду, разрешающую пользователю работать с системой в соответствии с имеющимся у него уровнем доступа, и посылает ее в блок управления 6, входящее в состав устройства хранения и проверки сертификатов 2.

Обработка обращения пользователя к системе для упорядочения неструктурированного информационного потока входных данных для дальнейшего использования в системе в объектной форме

После прохождения процедуры авторизации, пользователь формирует с помощью блока формирования запроса 15 запрос. Из блока формирования запроса 15 запрос поступает в блок формирования ЭЦП пользователя 13, затем в блок кодирования 12 и далее передается по каналам связи, на устройство хранения и проверки сертификатов 2, в котором он поступает через блок декодирования 4 в блок управления 6, входящий в состав устройства хранения и проверки сертификатов 2. Блок управления 6, входящий в состав устройства хранения и проверки сертификатов 2, распознает тип запроса, выделяет из данных, соответствующих запросу, данные, идентифицирующие участника системы (например, ЭЦП), пересылает последние в блок контроля 8, которое проверяет соответствие этих данных сертификату зарегистрированного участника системы. В случае положительного результата проверки блок контроля 8 формирует команду, по которой блок управления 6, входящий в состав устройства хранения и проверки сертификатов 2, пересылает данные, соответствующие поступившему запросу, через блок кодирования 5 на вход 18 устройства централизованного управления 3.

Со входа 18 устройства централизованного управления 3 указанные данные через блок декодирования 20 поступают в блок управления процессом операции 22. В зависимости от типа запроса блок управления 33, входящий в состав блока управления процессом операции 22, формирует соответствующие типу запроса команды

и пересылает их и поступившие неструктурированные данные в соответствующие блоки и устройства. Как отмечалось выше, в данном случае пользователь обратился к системе для упорядочения неструктурированного информационного потока входных данных для дальнейшего использования в системе в объектной форме.

Указанный блок управления 33 формирует команду о начале упорядочения неструктурированного информационного потока входных данных и передает сформированную команду в блок управления 43, который входит в состав устройства хранения классификации и поиска упорядоченных данных 27. Указанный блок управления 43 передает полученную команду и исходную неформализованную информацию в устройство управления 47, которое входит в устройство автоматизированного упорядочения данных 44.

Перед началом обработки исходных неформализованных данных формируются:

- таблица дешифровки исходных текстов;

- лингвистические словари языков, понимаемых системой;

- список настроек;

- хранилище информации, содержащее объекты с уникальными общепринятыми текстовыми идентификаторами на одном или нескольких естественных языках.;

- хранилище информации, содержащее объекты заимствованных библиотек

Таблица дешифровки блока кодировок и правил распознавания 49 представляет собой совокупность строк, в каждой из которых задан идентификатор кодировки, признаки его распознавания и правила декодирования. В блоке кодировок и правил распознавания 49 предусмотрена возможность автоматической или полуавтоматической отбраковке информации, не представляющей интереса для пользователя, из контура дальнейшей обработки

Лингвистические словари блока корреляционных зависимостей конструкций языков или диалектов 50 представляют собой единую базу данных, организованную в виде различных языковых миров. Мир языка в рамках базы данных представляет собой список относящихся

к этому языку слов, основ слов, словоформ и выражений, связанных, в том числе, ассоциативными связями через корреляционные зависимости с соответствующими конструкциями других естественных языков, поддерживаемых системой. Каждая запись базы данных, описывающая одну языковую конструкцию, содержит идентификатор языка или диалекта, к которому она относится. При необходимости с ней связывается процедура, описывающая правила использования конструкции в тексте и ее взаимоотношения с другими конструкциями языка.

В перечень блока корреляционных зависимостей конструкций языков или диалектов 50, например, может входить SGML (Стандартный обобщенный язык разметки (СОЯР)), который обеспечивает основные функции пословной текстовой обработки, требующиеся авторам и редакторам, и он предпочтительно используется в сочетании с программным пакетом Inter Cap (Аннаполисе шт. Мериленд) для создания графических изображений. Указанный международный стандартный язык разметки для описания структуры документов в электронной форме создает тексты с применением меток («тегов»). СОЯР предназначен для удовлетворения требований в широком диапазоне задач обработки документов и обмена информацией. Метки СОЯР дают возможность описывать документы в аспектах их содержания (текст, изображения и т.д.) и логической структуры (главы, параграфы, рисунки, таблицы и т.д.). В случае более крупных и более сложных документов в электронной форме этот язык также предоставляет возможность описывать физическую организацию документа в виде файлов. Язык СОЯР рассчитан на то, что бы получить возможность описания документов любого рода - простых или сложных, длинных или коротких - в таком виде, какой не зависит ни от системы, ни от ее практического применения. Эта независимость позволяет обмениваться документами между разными системами для разных применений без искажения смысла или потери информации.

Язык СОЯР - это язык разметки, т.е. язык для «маркировки» или аннотирования текста посредством кодированной информации, добавляемой к обычной текстовой информации, передаваемой конкретным отрывком текста. В большинстве случаев это выполняется в

форме последовательностей символов в разных местах по всей протяженности электронного документа. Каждая такая последовательность отличима от окружающего ее текста с помощью особых знаков, которые ее начинают и заканчивают. Программные средства могут проверить правильность внесенной в текст разметки путем обследования меток СОЯР по запросу. Эта разметка обобщена в том смысле, что она не является специфичной для какой либо конкретной системы или задачи. Более подробную информацию о метках СОЯР можно почерпнуть из Международного стандарта МОС (ISO) 8879 «Обработка информации - Текстовые и конторские системы - Стандартный обобщенный язык разметки (SMGL) N ISO 8879 - 1986 (Е).

Благодаря использованию меток СОЯР возможна реализация следующих задач:

а) разделение документов на отрывки или доступные для перевода единицы. Программные средства описываемой системы используют как знаки препинания, так и метки СОЯР для распознавания доступных для перевода единиц в исходном введенном тексте (так, например метка СОЯР необходима для распознавания заголовков разделов);

б) отгораживание (изоляция) текстовых единиц, не требующих упорядочения. Хотя вся организация основана на предположении того, что все слова и предложения будут в рамках заданного ограниченного языка, этого никогда нельзя ожидать заранее в полной степени, например, в том, что касается фамилий и адресов, либо классов словаря, которые невозможно (или весьма трудно) классифицировать с исчерпывающей точностью (например, номер деталей или сигналы неисправности поступающие от оборудования). В начале и в конце таких элементов текста можно поставить метки СОЯР, чтобы показать системе, что они исключаются из проверки;

в) распознавание содержания документа (например, номеров деталей) как это уже указывалось (п.б.);

г) обеспечение возможности распознавание частей предложения (например, выделенных отрывков);

д) оказание помощи в переводе таблиц (клетка за клеткой) путем обозначения структуры текста. Эта задача подобна пп.а.;

ж) оказание помощи процессу грамматического и синтаксического разбора с помощью п.п.б, в, г, и д;

и) оказание помощи в устранении неоднозначности путем предоставления средств для ввода невидимых меток в исходный текст для указания на правильную интерпретацию неоднозначного предложения;

к) оказание помощи в переводе валют и математических позиций или единиц путем обозначения особых видов текста требующих специальной обработки;

л) предоставление средств отметки части текста как переводимой. Иными словами, подтверждение того, что данный текст прошел описываемые операции системы и представляет собой лишенный неоднозначности текст без конечного редактирования.

Блок хранения «заимствованных» библиотек 51 содержит «заимствованные» позиции (отдельные файлы, графических изображений, таблиц, звуковой информации и видеоинформации, которые хранятся в библиотеках «заимствования». Виды таких библиотек включает в себя библиотеку «заимствования» графики, библиотеку «заимствования» таблиц, библиотеку «заимствования» звуковой информации, библиотеку «заимствования» видеоинформации. «Заимствованной позицией (например, графика) является та информация, к которой в информационном элементе содержится «отсылка». Содержание «заимствованной» информации отображается на используемом пользователем инструменте, но в файле информационного элемента на нее лишь «указывается». «Заимствованные» позиции отличаются от информационных элементов тем, что они не являются «отдельно стоящими» (т.е. сами по себе они не несут достаточной информации для того, чтобы выразить существенную информацию). Каждая «заимствованная» позиция сама по себе является отдельным файлом, например информационным элементом. «Заимствованная» позиция вводится в память только один раз. Если такая позиция используется в отдельных информационных элементах, в информационный элемент вводятся лишь «отсылки к исходной заимствованной позиции, это позволяет сократить требуемый объем памяти на диске. Когда исходная позиция изменяется, автоматически изменяются и все информационные элементы,

содержащие «отсылки» к этой позиции.

Список настроек блока настроек и сценариев классификации распознавания объектов 53 содержит в формализованном виде:

- перечень типов (классов) данных, образующих предмет изучения со стороны пользователя;

- перечень параметров каждого типа данных, а также их взаимосвязей и отношений;

- совокупность соотносимых с каждым типом данных и параметром алгоритмических процедур, отвечающих за:

- распознавание в исходном тексте соответствующего параметра и его границ, а по совокупности границ всех параметров и с учетом дополнительных знаний - границ объекта в исходном тексте;

- выбор значений параметров из исходного текста и перенесение их в формализованный объект хранилища информации.

Хранилище информации представляет собой накопленный ранее по интересующей пользователя тематике структурированный информационный массив и используется для идентификации в исходном тексте собственных имен, а также для перевода на родной язык пользователя значений тех параметров объекта, которые используют многоязычное соответствие. Многоязычное соответствие может быть реализовано с помощью:

- атрибута многозначности параметра (в этом случае указывается значение параметра на языке оригинала и всех его переводов на языки, поддерживаемые системой);

- взаимосвязанного объекта точно такой же структуры, но содержащего сведения на другом языке, с выделением отдельного параметра "используемый язык" для каждого объекта;

- с помощью специальных разделителей в поле значения параметра, совместно используемом различными языками.

Исходный файл или совокупность файлов неструктурированного информационного потока входных данных поступают на обработку в кодировке и на языках народов мира, на которые произведена настройка системы и которым она обучена.

Блок распознавания кодировок 48 осуществляет:

- распознавание собственно кодировки текста, поступающего на вход вычислительной системы;

- распознавание языка, на котором составлен текст (включая возможные варианты: блоки текста составлены на различных языках, или тексты включают в себя фрагменты фраз или понятия на других языках, а также математические формулы, графические изображения, таблицы, звуковую информацию, видеоинформацию.

Для распознавания используются:

- таблица дешифровки

- лингвистические словари языков, понимаемых системой, со списками правил употребления в тексте соответствующих языковых конструкций;

- «заимствованные» библиотеки.

Таблица дешифровки автоматически определяет тип кодировки. Для этого используются описанные в строках таблицы правила распознавания кодировки.

Если в какой-либо строке таблицы правило распознавания явно не выражено или не может быть однозначно определено, но при этом правила дешифровки определены (они должны быть известны для конкретной кодировки всегда, иначе наличие строки в таблице дешифровки теряет смысл), то осуществляется пробная дешифровка в промежуточный файл, который затем подвергается статистической обработке на предмет выявления специальных символов (пробелов, точек, запятых и т.д.), их подсчета и соотнесения с объемом текста. Производится сопоставление полученных значений со статистическими значениями, на основании чего делается предварительный вывод о корректности дешифровки. Окончательный вывод делается после выделения из текста, записанного в промежуточный файл, грамматических основ и сопоставления их с объектами лингвистических словарей.

Для этого промежуточный файл пословно сравнивается с содержимым словарей (начиная со словаря родного языка пользователя) с использованием соответствующих данному языку правил семантического анализа в блоке корреляционных зависимостей конструкций языков или диалектов 50. Вывод о принадлежности текста языку

делается на основании соотношения количества идентифицированных слов и общего количества слов в тексте. Неидентифицированные слова и фрагменты распознанного текста отбираются и последовательно проверяются по другим словарям, начиная со словаря английских слов. Вывод о принадлежности слов нераспознанных фрагментов тому или иному языку делается по относительному соотношению идентифицированных слов к общему количеству слов во фрагменте текста. Неидентифицированные фрагменты, которые идентифицированы блоком распознавания кодировок 48, как графическое изображение, таблицы, звуковая информация или видеоизображение, разносятся в виде «заимствованной» позиции с «отсылкой» к информационному элементу (распознанному тексту) в виде отдельного файла в «заимствованные библиотеки» блока хранения «заимствованных» библиотек 51.

3. В результате раскодировки и распознавания языка текста формируется внутренний промежуточный файл с маркерами, определяющими однозначное соответствие фрагментов текста языкам или диалектам. Перевод текста или его фрагментов при этом не выполняется.

Сформированный таким образом файл поступает на вход блока информационно-логической обработки в объектную форму 52, который осуществляет формализацию содержащейся в нем информации путем создания совокупности взаимосвязанных объектов (в частном случае это может быть всего один объект, а при отсутствии в тексте значимых для пользователя данных объекты вообще не генерируются). При этом в уместных случаях (для текстовых данных) выполняется перевод значений свойств с языка оригинала на родной язык пользователя.

Контролирует процесс преобразования управляющая программа, которая осуществляет:

- распознавание типов форм представления информации в исходном файле (текст, таблица, интервью, справочник, графическое изображение, звуковая информация, видеоинформация и т.д.) и маркировку фрагментов объекта, соответствующих той или иной его форме;

- настройку процедур уровня типа данных на соответствующую структуру исходного объекта путем передачи этим процедурам необходимой информации;

- поочередный вызов процедур уровня типа данных для формирования объектов соответствующих типов.

4. Распознавание форм представления информации в исходном тексте выполняется с помощью атрибутов, присущих этим формам (например, для табличных форм характерно регулярное чередование определенных символов, это же справедливо для текста в форме интервью; текст в форме справочников имеет свои закономерности -использование имен собственных, чередований последовательностей цифр, обозначающих номера телефонов и др.), с привлечением к анализу содержимого хранилища информации (что особенно может быть полезным при анализе справочников). Границы, соответствующие различным формам текста, помечаются, что дает возможность в дальнейшем вызывать для их обработки адекватные процедуры анализа.

5. Преобразование информации в объектную форму осуществляется с помощью списка настроек (фиг.1, блок 6). Управляющая программа инициализирует список, поочередно просматривая описания типов данных. При этом для каждого типа активизируется процедура уровня типа данных, в задачи которой входит:

- формирование прообраза формализованного объекта, структура которого описывается данным типом (классом) данных;

- определение порядка вызова и активизация тех процедур уровня параметра, обеспечивающих распознавание параметров в исходном файле, которые соответствуют использованным в тексте языкам и структуре информации в файле (неструктурированный текстовый файл, табличный файл, графический файл и т.д.);

- определение границ объекта в тексте на основании результатов работы методов уровня параметра, а при необходимости и с помощью дополнительных процедур;

- идентификация формируемого объекта с данными, накопленными в хранилище информации (хранилище информации (фиг.1, блок 5) позволяет идентифицировать объекты, имеющие собственные

имена, а также понятийный аппарат изучаемой предметной области).

Методы уровня класса, формирующие объекты, функционируют таким образом, что учитывают возможность описания в исходном неформализованном тексте нескольких объектов одного класса с различными возможностями пересечения и вложенности описаний.

6. Активизированный метод уровня класса производит требуемую классификацию на основе настроек и сценариев классификации, хранящихся в блоке настроек и сценариев классификации распознавания объектов 53 в определенном порядке просматривает перечень параметров своего класса и для каждого параметра активизирует соответствующий метод распознавания параметра в исходном тексте. Выбор метода зависит от используемых в тексте языков и его структуры (неформализованный текст, таблица, интервью, графика и т.д.). Классификация может включать, например, поиск вхождений ключевых слов в объекте. Результатом классификации, например, является указание принадлежности данного объекта некоторому классу описаний согласно принятой в системе классификации.

Вызванный метод уровня параметра по идентифицирующим признакам определяет наличие и местонахождение описания параметра в исходном тексте, границы его описания с учетом контекстной зависимости, а также возможности описания параметра в исходном тексте с помощью нескольких разнесенных фрагментов. Идентифицированные значения параметра переносятся в формируемый объект с приведением их к внутреннему формату системы. Для параметров, значения которых заданы на языках, являющихся для пользователя иностранными, метод уровня параметра активизирует процедуру перевода значения на родной язык путем обращения к соответствующему лингвистическому словарю, а также к хранилищу информации для анализа имеющихся значений одноименных параметров накопленных объектов данного класса на языке оригинала и их сопоставления с анализируемым значением. При обнаружении требуемого значения выбирается его перевод и переносится в качестве значения для рассматриваемого параметра (свойства) формируемого объекта.

В процессе перевода учитывается возможность сохранения в формируемом объекте значения свойства на языке оригинала (как

правило, это относится к технологическим терминам и их аббревиатурам).

Описанное относится к содержательным свойствам объекта, т.е. к свойствам, имеющим числовое или текстовое значение или мультимедийное отображение. Свойства, описывающие структурные взаимоотношения и взаимосвязи, идентифицируют «заимствованную» позицию, передают управление соответствующему методу его формирования, а после возврата управления обеспечивают установление между объектами соответствующих ссылок.

В результате выполнения процедур, описанных выше для всех классов, описанных в списке настроек, на выходе блока преобразования информационно-логической обработки в объектную форму 52 формируется совокупность взаимосвязанных объектов со структурой, стандартизированной в рамках хранилища информации, к которым могут быть применены типовые методы обработки и анализа с использованием средств вычислительной техники и разным уровнем доступа. Исходные данные могут быть заархивированы, созданы резервные копии, перенесены на различные записывающие устройства.

Блок управления 43, который входит в состав устройства хранения, классификации и поиска упорядоченных данных 27 формирует команду о завершении процедуры автоматического упорядочения неструктурированного информационного потока входных данных, и передает структурированные, упорядоченные и классифицированные в соответствии с тематической направленности данные информационного объекта в блок памяти хранения упорядоченных данных 45, входящий в устройство хранения, классификации и поиска упорядоченных данных 27.

Одновременно с передачей упорядоченных данных блок управления 43 формирует команду в блок управления 33, входящий в состав блока управления процессом операции 22. Блок формирования сценария прохождения операции 34 посылает команду в устройство регистрации упорядоченных данных 24. Блок управления 38 формирует команду и передает в блок регистрации документов 39, где упорядоченному объекту присваивает регистрационный номер сформированного объекта с указанием даты создания объекта и автора

данного объекта (например, указывается идентификатор участника, в данном случае идентификатор пользователя) и сообщает его в блок памяти для хранения промежуточных документов 40. Затем блок управления 38 передает управляющую команду об использовании системой вновь сформированного объекта и присвоенный ему регистрационный номер.

Блок управления 33, входящий в состав блока управления процессом операции 22, будет осуществлять взаимодействие с другими блоками и устройствами, входящими в состав системы, и управлять их работой. Указанный блок управления 33 пересылает сформированную команду о регистрации в блок формирования сценария прохождения операции 34. В результате блок формирования сценария прохождения операции 34 в определенные моменты времени, заданные сформированным сценарием, осуществляет управление работой устройства централизованного управления 3 в соответствии с типом операции.

Блок управления 33, входящий в состав блока управления процессом операций 22 соответствии с выполняемым сценарием формирует в блоке управления 41 блока контроля и анализа операций между участниками системы 25 и передает команду, оповещающую о том, что в системе зарегистрирован новый объект. Блок управления 41 в ответ на поступившую команду направляет команду в блок оповещения участников системы 42, в соответствии с которой блок оповещения участников системы 42 формирует сообщение для пользователя с определенным уровнем доступа и посылает это сообщение в блок кодирования 26 и далее в блок формирования ответа пользователя 16, входящий в состав устройства управления пользователя 1.

Обработка обращения к системе участника для поиска и использования зарегистрированного в системе объекта (объектов) информации.

По обращению участника системы, например, пользователя переданного с устройства управления пользователя 1 в устройство централизованного управления 3, происходит подключение устройства управления пользователя 1 к устройству централизованного управления 3. Для подключения устройства управления пользователя

1 к устройству централизованного управления 3 участник системы вводит в устройство управления пользователя 1 свой идентификационный номер (пароль) либо с клавиатуры, либо с помощью пластиковой карточки, либо других носителей информации, который блок кодирования 12 кодирует и передает по каналам связи, на вход устройства хранения и проверки сертификатов 2. С входа устройства хранения и проверки сертификатов 2 данные, представляющие собой зашифрованный пароль, поступают в блок управления 6, входящее в состав устройства хранения и проверки сертификатов 2. Указанный блок управления 6 распознает тип поступившего запроса как пароль участника системы и передает эти данные в блок контроля 8, который проверяет наличие действующего сертификата, соответствующего полученному паролю, для чего блок контроля 8 выделяет из данных, формирующих пароль, номер соответствующего паролю сертификата, и по этому номеру формирует запрос, который посылает в блок памяти для хранения действующих и аннулированных сертификатов 9. Если в блоке памяти для хранения действующих и аннулированных сертификатов 9 сертификат под запрашиваемым номером среди действующих сертификатов не обнаружен, то блок контроля 8 формирует команду об отключении пользователя от системы и посылает ее в блок управления 6, входящее в состав устройства хранения и проверки сертификатов 2, в случае положительного результата поиска блок контроля 8 проверяет соответствие пароля найденному сертификату, если результат сравнения окажется отрицательным, то блок контроля 8 формирует команду об отключении пользователя от системы и посылает ее в блок управления 6, входящее в состав устройства хранения и проверки сертификатов 2, в обратном случае блок контроля 8 формирует команду, разрешающую пользователю работать с системой в соответствии с имеющимся у него уровнем доступа, и посылает ее в блок управления 6, входящее в состав устройства хранения и проверки сертификатов 2.

После прохождения процедуры авторизации, пользователь формирует с помощью блока формирования запроса 15 запрос. Из блока формирования запроса 15 запрос поступает в блок формирования ЭЦП пользователя 13, затем в блок кодирования 12 и далее передается

по каналам связи, на устройство хранения и проверки сертификатов 2, в котором он поступает через блок декодирования 4 в блок управления 6, входящий в состав устройства хранения и проверки сертификатов 2. Блок управления 6, входящий в состав устройства хранения и проверки сертификатов 2, распознает тип запроса, выделяет из данных, соответствующих запросу, данные, идентифицирующие участника системы (например, ЭЦП), пересылает последние в блок контроля 8, которое проверяет соответствие этих данных сертификату зарегистрированного участника системы. В случае положительного результата проверки блок контроля 8 формирует команду, по которой блок управления 6, входящий в состав устройства хранения и проверки сертификатов 2, пересылает данные, соответствующие поступившему запросу, через блок кодирования 5 на вход 18 устройства централизованного управления 3.

Со входа 18 устройства централизованного управления 3 указанные данные через блок декодирования 20 поступают в блок управления процессом операции 22 В зависимости от типа запроса блок управления 33, входящий в состав блока управления процессом операции 22, формирует соответствующие типу запроса команду и пересылает ее в соответствующие блоки и устройства. Как отмечалось выше, в данном случае пользователь обратился к системе для поиска и использования упорядоченного структурированного объекта (объектов) информации.

Получив подобный запрос, указанный блок управления 33 передает запрос о текущем уровне доступа участника в блок управления 35, входящий в состав блока формирования и хранения данных по участникам системы 23. Указанный блок управления 35 в соответствии с поступившей командой определяет уровень доступа пользователя, на основе информации, хранящейся в блоке памяти для хранения уровня доступа участников 96 и передает ответ о текущем уровне доступа покупателя в блок управления 33.

Указанный блок управления 33 формирует команду о подключении базы данных упорядоченных объектов информации, хранящейся в устройстве хранения, классификации и поиска упорядоченных данных 27, и передает сформированную команду, в которой указаны, в частности,

права доступа пользователя, в блок управления 43, который входит в состав устройства хранения классификации и поиска упорядоченных данных 27.

Указанный блок управления 43 формирует команду по выборке объекта (объектов) из базы данных, и с учетом прав доступа пользователя извлекает искомый объект (объекты) из блока памяти упорядоченных данных 45, входящий в состав устройства хранения классификации и поиска упорядоченных данных 27.

Блок управления 43 во взаимодействии с блоком формирования поиска объекта данных 46 производит выборку элементов из сформированного списка объектов, указанных участником. Блок управления 43 формирует список объектов, которые желает использовать участник системы, и пересылает его в блок управления 33, входящий в состав блока управления процессом операций 22.

Указанный блок управления 33, определив тип поступившего запроса (в данном случае - это запрос на поиск зарегистрированных в системе объекта (объектов), формирует соответствующую типу запроса команду и пересылает ее в блок формирования сценария прохождения операции 34, указанный блок посылает команду в блок регистрации документов 39. Получив соответствующую команду, блок регистрации документов 39, который присваивает сформированному запросу регистрационный номер и сообщает его в блок формирования сценария прохождения операции 34. После чего блок формирования сценария прохождения операции 34 передает запрос и регистрационный номер на хранение в блок памяти для хранения копий промежуточных документов 40. Определив по типу запроса тип запроса (в рассматриваемом примере - это поиск зарегистрированного в системе объекта (объектов), блок управления процессом операций 38 формирует ответ на запрос, представленный в виде набора команд, в соответствии с которыми и с заданными параметрами (параметры могут быть заданы как по умолчанию, так и непосредственно участниками системы) блок управления 33, входящий в состав блока управления процессом операций 22, будет осуществлять взаимодействие с другими блоками и устройствами, входящими в состав системы, и управлять их работой. В результате блок формирования сценария прохождения операции 34 в определенные моменты времени, заданные

сформированным сценарием, осуществляет управление работой устройства централизованного управления 3 в соответствии с типом запроса.

Блок управления 33, входящий в состав блока управления процессом операций 22 в соответствии с выполняемым сценарием формирует в блоке управления 41 блока контроля и анализа операций между участниками системы 25 и передает команду, оповещающую о том, что из системе был изъят зарегистрированный объект. Блок управления 41 в ответ на поступившую команду направляет команду в блок оповещения участников системы 42, в соответствии с которой блок оповещения участников системы 42 формирует сообщение для пользователя с определенным уровнем доступа и посылает это сообщение в блок кодирования 26 и далее в блок формирования ответа пользователя 16, входящий в состав устройства управления пользователя 1.

В системе в качестве устройств памяти используются устройство памяти персонального компьютера, в качестве устройств управления используются процессорные блоки персонального компьютера. Все остальные операции с функциональными устройствами и блоками осуществляет программное обеспечение персональных компьютеров.

Промышленная применимость

Заявленная система может быть изготовлена из промышленно выпускаемых комплектующих известными способами. Данная полезная модель может найти применение в любых системах связанных с обработкой больших, разнородных потоков данных.

Хотя полезная модель описана посредством примеров ее выполнения, объем правовой охраны не ограничивается этими примерами, а определяется формулой полезной модели с учетом возможных эквивалентов.

Литература

1. Международный стандарт МОС (ISO) 8879 «Обработка информации - Текстовые и конторские системы - Стандартный обобщенный язык разметки (SMGL) N ISO 8879 - 1986 гг.

1. Система автоматизированного упорядочения неструктурированного информационного потока входных данных, включающая в себя, по меньшей мере, одно устройство пользователя, соединенное посредством канала связи с устройством централизованного управления, в состав которого входят устройство регистрации пользователя системы, блок декодирования, блока кодирования, устройство управления процессом операции, устройством хранения, классификации и поиска упорядоченных данных, устройство формирования и хранения данных по пользователям системы, регистрации упорядоченных данных и устройство контроля и анализа операции, причем упомянутое устройство регистрации пользователя системы соединено с выходом упомянутого блока декодирования и выходом упомянутого блока кодирования, упомянутое устройство управления процессом операции соединено с выходом упомянутого блока декодирования и входом упомянутого блока кодирования, а также с упомянутым устройством хранения, классификации и поиска упорядоченных данных, упомянутые устройство управления процессом операции, устройство формирования и хранения данных по участникам системы, устройство регистрации упорядоченных данных и устройство контроля и анализа операции соединены между собой, упомянутое устройство контроля и анализа операции соединено с входом упомянутого блока кодирования, упомянутое устройство хранения, классификации и поиска упорядоченных данных содержит блок управления, устройство автоматизированного упорядочения данных, блок памяти упорядоченных данных и блок формирования поиска объекта данных, причем упомянутый блок памяти упорядоченных данных соединен с входом упомянутого устройства автоматизированного упорядочения данных и упомянутым блоком формирования поиска объекта данных, упомянутый блок памяти упорядоченных данных соединен с упомянутым устройством автоматизированного упорядочения данных и с упомянутым блоком формирования поиска объекта данных, упомянутое устройство автоматизированного упорядочения данных содержит блок управления, блок распознавания кодировок, блок кодировок и правил распознавания, по меньшей мере, один блок корреляционных зависимостей конструкций языков или диалектов, по меньшей мере, один блок хранения заимствованных библиотек, блок информационно-логической обработки объекта в объектную форму, блок настроек и сценариев классификации распознавания объектов, причем упомянутый блок распознавания кодировок соединен, по меньшей мере, с одним упомянутым блоком корреляционных зависимостей конструкций языков или диалектов, с упомянутым блоком кодировок и правил распознавания и выходом упомянутого блока управления, упомянутый блок информационно-логической обработки объекта в объектную форму соединен с упомянутым блоком настроек и сценариев классификации распознавания объектов, с выходом упомянутого блока распознавания кодировок и входом упомянутого блока управления, упомянутые, по меньшей мере, один упомянутый блок корреляционных зависимостей конструкций языков или диалектов и, по меньшей мере, один упомянутый блок хранения заимствованных библиотек соединены между собой.

2. Система автоматизированного упорядочения неструктурированного информационного потока входных данных по п.1, отличающаяся тем, что устройство хранения и проверки сертификатов, которое содержит блок декодирования, блок кодирования, блок управления, блок памяти для хранения информации о пользователе системы, блок контроля и блок памяти для хранения действующих и аннулированных сертификатов, причем упомянутый блок управления соединен с упомянутым блоком памяти для хранения информации о пользователе системы, упомянутым блоком памяти для хранения действующих и аннулированных сертификатов и упомянутым блоком контроля, а также с выходом упомянутого блока декодирования и входом упомянутого блока кодирования.

3. Система автоматизированного упорядочения неструктурированного информационного потока входных данных по п.1, отличающаяся тем, что, по меньшей мере, одно устройство управления пользователя, которое содержит блок декодирования, блок идентификации, блок кодирования, блок формирования электронной цифровой подписи, блок управления, блок формирования запроса пользователя, блок формирования ответа пользователя, причем упомянутый блок идентификации соединен с выходом упомянутого блока декодирования и входом упомянутого блока управления, упомянутый блок формирования электронной цифровой подписи соединен с выходом упомянутого блока управления, с входом упомянутого блока кодирования и выходом упомянутого блока формирования сигнала исполнения операции, упомянутый блок управления соединен с упомянутым блоком формирования запроса пользователя и упомянутым блоком формирования ответа пользователя.

4. Система автоматизированного упорядочения неструктурированного информационного потока входных данных по п.1, отличающаяся тем, что устройство регистрации пользователя системы, которое содержит блок декодирования, блок кодирования, блок управления, блок регистрации сертификатов и блок регистрации пользователя системы, причем упомянутый блок управления соединен с упомянутым блоком регистрации сертификатов и упомянутым блоком регистрации пользователя системы, а также с выходом упомянутого блока декодирования и входом блока кодирования.

5. Система автоматизированного упорядочения неструктурированного информационного потока входных данных по п.1, отличающаяся тем, что устройство управления процессом операции содержит соединенные между собой блок управления и блок формирования сценариев прохождения операции.

6. Система автоматизированного упорядочения неструктурированного информационного потока входных данных по п.1, отличающаяся тем, что устройство формирования и хранения данных по пользователям системы содержит блок управления, блок памяти для хранения реквизитов пользователя системы и блок памяти для хранения уровня доступа пользователя системы, причем упомянутый блок управления соединен с упомянутыми блоком памяти для хранения реквизитов пользователя системы и упомянутым блоком памяти для хранения уровня доступа пользователя системы.

7. Система автоматизированного упорядочения неструктурированного информационного потока входных данных по п.1, отличающаяся тем, что устройство регистрации упорядоченных данных содержит блок управления, блок регистрации документов и блок памяти для хранения промежуточных документов, причем упомянутый блок управления соединен с упомянутым блоком регистрации документов и упомянутым блоком памяти для хранения промежуточных документов.

8. Система автоматизированного упорядочения неструктурированного информационного потока входных данных по п.1, отличающаяся тем, что устройство контроля и анализа операции содержит блок управления и блок оповещения пользователя системы, причем выходы упомянутых блоков соединены между собой, дополнительный выход упомянутого блока управления соединен с упомянутым блоком оповещения пользователя системы.



 

Похожие патенты:

Автоматизированная система квалифицированной цифровой электронной подписи документов относится к устройствам обработки данных для специального применения и может быть использована в структуре электронного документооборота заказчик-исполнитель, в частности, при реализации документооборота в области рекламы
Наверх