Автоматизированная система интеллектуального обезличивания персональных данных в тексте документа

 

Полезная модель относится к специализированным устройствам вычислительной техники и может быть использована для автоматизированного интеллектуального редактирования документов, например, для обезличивания судебных решений путем исключения из них персональных данных физических лиц и другой конфиденциальной информации. Требуемый технический результат, заключающийся в расширении функциональных возможностей, достигается в устройстве, содержащем блок выделения отселектированной информации, блок отображения, блок селекции адресов документов в базе данных, блок селекции шаблонов обезличивания документов, блок формирования сигналов считывания и записи базы данных, блок приема записей базы данных, и блок управления. 1 н.п.ф., 8 ил.

Полезная модель относится к специализированным устройствам вычислительной техники и может быть использована для автоматизированного интеллектуального редактирования документов, например, для обезличивания судебных решений путем исключения из них персональных данных физических лиц и другой конфиденциальной информации.

Одной из задач обеспечения доступа населения к информации о деятельности судов является размещение (публикация) в сети Интернет текстов судебных актов, вынесенных судами общей юрисдикции (приговоров по уголовным делам, решений по гражданским делам, определений, постановлений и др.), обеспечивая, при этом своевременность и полноту публикуемых данных. Основное требование, которое при этом должно соблюдаться, это обеспечение конфиденциальности информации о персональных данных лиц, упоминаемых в судебных документах, которое может быть достигнуто обезличиванием, т.е. заменой в документах персональных данных и другой конфиденциальной информации обозначениями, которые не позволят их идентифицировать.

Известно устройство, содержащее узел выбора кандидатов, который выбирает заранее заданное число типов кандидатов бумажного документа на основе признака плотности и признаков направления для каждого блока, полученного равномерным разделением входного изображения, и эталонных изображений, а также узел подробного оценивания, который адаптивно разделяет входное изображение на блоки согласно признакам эталонного изображения, соответствующего каждому типу бумажных документов, выбранного узлом выбора кандидатов, и выполняет подробное оценивание на основе значений соответствия между соответствующими блоками разделенного входного изображения и каждого из эталонных изображений [RU 2449376, С2, G07D 7/2, 27.04.2012].

Недостатком устройства является относительно узкие функциональные возможности.

Известно также устройство устройства защиты конфиденциальной информации, записанной на документе, а также документ, снабженный упомянутым устройством защиты конфиденциальной информации, содержащий окно, структурно ослабленные области, которые выполнены вблизи от окна, при этом, первый элемент, образующий носитель указанной информации, закреплен на первой стороне документа на уровне окна посредством сильного клея, второй элемент является прозрачным и размещен на другой стороне документа на уровне окна, второй элемент прикреплен к первому элементу посредством сильного клея, документ включает сменный элемент маскирования информации, покрывающий второй элемент, чтобы скрыть информацию, нанесенную на первый элемент и фиксирующий второй элемент посредством клеящего вещества надежного соединения, указанный сменный элемент маскирования имеет такие размеры, что закрывает предварительно ослабленные области, которые прикреплены посредством сильного клея [RU 2442695, С2, B42D 15/00, 27.07.2010].

Известное устройство защиты конфиденциальной информации обладают относительно высокой сложностью и ограниченным применением, поскольку и документ обеспечивает необратимое, невосстанавливаемое и немаскируемое разрушение документа при считывании информации, что исключает его повторное использование.

Кроме того, известно устройство, содержащее блок ввода, регистрации, обработки информации, идентифицирующей физическое лицо в идентификационной базе данных (БД1), блок ввода, регистрации, обработки обезличенной информации физического лица в обезличенной базе данных (БД2), при этом, обе базы содержат устройства считывания информации с внешнего носителя, система ИСПДн1 разделена на ИСПДн1 и ИСПДн2, а БД1 и БД2 размещены в указанных системах соответственно, причем внешний носитель содержит персональный обезличенный идентификатор физического лица, соответствующий единственному физическому лицу, БД1 и БД2 содержат указанный идентификатор физического лица, при этом внешний носитель содержит внутренние и/или внешние идентифицирующие элементы, кроме того, физическое лицо имеет, по меньшей мере, один внешний носитель с одним персональным обезличенным идентификатором [RU 103414, U8, G07F 17/40, 10.04.2011].

Недостатком устройства является относительно узкие функциональные возможности.

Наиболее близким по технической сущности к предложенному является устройство, содержащее память исходного массива, блок символьной обработки текста, наборное поле, блок отображения, блок ввода-вывода, буферную память ввода-вывода, блок структурного анализа текста, блок управления, блок синтеза архивной карточки, память архивных карточек, магистральную шину, а также долговременную память, блок выделения служебной (отселектированной) информации, блок хранения и корректировки стоп-словаря, блок квазиморфологического анализа, блок формирования инвертированного индекса основ слов, блок формирования связанных основ слов, блок формирования признаков отбора предложений для архивной карточки, блок отбора предложений для архивной карточки и счетчик знаков в аннотации текста с соответствующими связями [RU 2386167, C1, G07F 17/30, 10.04.2010].

Недостатком наиболее близкого технического решения является относительно узкие функциональные возможности, обусловленные, в частности, тем, что, хотя устройство и позволяет выделить в документе требуемые слова и словосочетания, но не производят обезличивание документа путем исключения из него персональных данных и конфиденциальной информации.

Требуемый технический результат заключается в расширении функциональных возможностей, путем обеспечения обезличивания документа путем исключения из него персональных данных и конфиденциальной информации.

Требуемый технический результат достигается путем расширения арсенала технических средств, обеспечивающих указанные дополнительные технические возможности устройства.

Этот требуемый технический результат достигается тем, что, в устройство, содержащее блок выделения отселектированной информации и блок отображения, введены блок селекции адресов документов в базе данных, блок селекции шаблонов обезличивания документов, блок формирования сигналов считывания и записи базы данных, блок приема записей базы данных, и блок управления, при этом, блок отображения выполнен с возможностью формирования обезличенных документов, блок управления выполнен с возможностью управления сканированием документов, первый и второй входы блока селекции адресов документов в базе данных являются, соответственно, первым информационным входом и первым синхронизирующим входом устройства, первый вход блока выделения отселектированной информации является управляющим входом устройства, первый и второй входы блока приема записей базы данных являются, соответственно, вторым информационным входом и вторым синхронизирующим входом устройства, первый, второй и третий выходы блока формирования сигналов считывания и записи базы данных, являются, соответственно, адресным выходом и первым и вторым синхронизирующими выходами устройства, первый выход блока селекции адресов документов в базе данных соединен с первым входом блока формирования сигналов считывания и записи базы данных, второй выход блока селекции адресов документов в базе данных соединен со вторым входом блока формирования сигналов считывания и записи базы данных и с первым входом блока селекции шаблонов обезличивания документов, третий и четвертый выходы блока селекции адресов документов в базе данных соединены, соответственно, со вторым и с третьим входами блока селекции шаблонов обезличивания документов, первый выход которого соединен с первым входом блока управления, а второй выход - соединен со вторым входом блока выделения отселектированной информации, первый выход блока приема записей базы данных соединен с третьим входом блока выделения отселектированной информации и с первым ходом блока отображения, второй выход блока приема записей базы данных соединен с третьим входом блока формирования сигналов считывания и записи базы данных, первый выход блока управления соединен со вторым входом блока отображения и с третьим входом блока приема записей базы данных, второй выход - соединен с четвертым входом блока выделения отселектированной информации, а третий выход - соединен с четвертым входом блока приема записей базы данных, первый выход блока выделения отселектированной информации соединен с третьим входом блока отображения и со вторым входом блока управления, второй выход блока выделения отселектированной информации соединен с четвертым входом блока отображения и с третьим входом блока управления, а второй выход блока селекции шаблонов обезличивания документов соединен с четвертым входом блока приема записей базы данных.

На чертеже представлены:

на фиг.1 - функциональная схема автоматизированной системы интеллектуального обезличивания персональных данных в тексте документа;

на фиг.2 - блока селекции адресов документов в базе данных;

на фиг.3 - блока селекции шаблонов обезличивания документов;

на фиг.4 - блока формирования сигналов считывания и записи базы данных;

на фиг.5 - блока приема записей базы данных;

на фиг.6 - блока выделения отселектированной информации;

на фиг.7 - блока управления;

на фиг.8 - блока отображения.

Автоматизированная система интеллектуального обезличивания персональных данных в тексте документа (фиг.1) содержит блок 1 селекции адресов документов в базе данных, блок 2 селекции шаблонов обезличивания документов, блок 3 формирования сигналов считывания и записи базы данных, блок 4 приема записей базы данных, блок 5 выделения отселектированной информации, блок 6 управления и блок 7 отображения.

В автоматизированной системе интеллектуального обезличивания персональных данных в тексте документа блок 7 отображения выполнен с возможностью формирования обезличенных, выходных документов, а блок 6 управления выполнен с возможностью управления сканированием документов.

Кроме того, в автоматизированной системе интеллектуального обезличивания персональных данных в тексте документа первый 8 и второй 9 входы блока 1 селекции адресов документов в базе данных являются, соответственно, первым информационным входом и первым синхронизирующим входом автоматизированной системы интеллектуального обезличивания персональных данных в тексте документа, первый вход 10 блока 5 выделения отселектированной информации является управляющим входом автоматизированной системы интеллектуального обезличивания персональных данных в тексте документа, первый 11 и второй 12 входы блока 4 приема записей базы данных являются, соответственно, вторым информационным входом и вторым синхронизирующим входом автоматизированной системы интеллектуального обезличивания персональных данных в тексте документа, первый 13, второй 14 и третий 15 выходы блока 3 формирования сигналов считывания и записи базы данных, являются, соответственно, адресным выходом и первым и вторым синхронизирующими выходами автоматизированной системы интеллектуального обезличивания персональных данных в тексте документа.

Кроме того, в автоматизированной системе интеллектуального обезличивания персональных данных в тексте документа первый выход блока 1 селекции адресов документов в базе данных соединен с первым входом блока 3 формирования сигналов считывания и записи базы данных, второй выход блока 1 селекции адресов документов в базе данных соединен со вторым входом блока 3 формирования сигналов считывания и записи базы данных и с первым входом блока 2 селекции шаблонов обезличивания документов, третий и четвертый выходы блока 1 селекции адресов документов в базе данных соединены, соответственно, со вторым и с третьим входами блока 2 селекции шаблонов обезличивания документов, первый выход которого соединен с первым входом блока 6 управления, а второй выход - соединен со вторым входом блока 5 выделения отселектированной информации, первый выход блока 4 приема записей базы данных соединен с третьим входом блока 5 выделения отселектированной информации и с первым ходом блока отображения, второй выход блока 4 приема записей базы данных соединен с третьим входом блока 3 формирования сигналов считывания и записи базы данных, первый выход блока 6 управления соединен со вторым входом блока 7 отображения и с третьим входом блока приема записей базы данных, второй выход блока 6 управления соединен с четвертым входом блока выделения отселектированной информации, а третий выход блока 6 управления соединен с четвертым входом блока 4 приема записей базы данных, первый выход блока 5 выделения отселектированной информации соединен с третьим входом блока 7 отображения и со вторым входом блока 6 управления, второй выход блока 5 выделения отселектированной информации соединен с четвертым входом блока 7 отображения и с третьим входом блока управления, а второй выход блока 2 селекции шаблонов обезличивания документов соединен с четвертым входом блока 4 приема записей базы данных.

Блок 1 селекции адресов документов в базе данных (фиг.2) содержит регистр 16, дешифратор 17, блок 18 памяти, элементы И 19-21, элементы задержки 22, 23.

Блок 2 селекции шаблонов обезличивания документов (фиг.3) содержит дешифратор 24, элементы И 25-7, блок 28 памяти, регистр 29.

Блок 3 формирования сигналов считывания и записи базы данных (фиг.4) содержит счетчик 30, элементы задержки 31, 32.

Блок 4 приема записей базы данных (фиг.5) содержит регистр 33 сдвига, дешифратор 34 и элемент И 35.

Блок 5 выделения отселектированной информации (фиг.6) содержит компаратор 36, элемент ИЛИ 37.

Блок 6 управления (фиг.7) содержит генератор 38 импульсов, счетчик 39, компаратор 40, триггер 41, элемент И 42, элемент ИЛИ 43.

Блок 7 отображения (фиг.8) содержит триггер 44, элемент И 45, регистр 46 сдвига.

Работает автоматизированная система интеллектуального обезличивания персональных данных в тексте документа следующим образом.

Предварительно задаются идентификаторы исходного текстового документа, хранящегося в базе данных, и шаблона, который должен быть использован для обезличивания исходного тестового документа.

Коды идентификаторов исходного текстового документа и шаблона подаются на информационный вход 8 и по синхроимпульсу с входа 9 записываются в регистр 16 блока 1. Идентификатор исходного текстового документа расшифровывается дешифратором 17, который открывает по соответствующему выходу один из элементов И 19-21. Допустим, таким элементом является элемент И 19.

Параллельно с этим синхронизирующий импульс с входа 9 задерживается на время занесения идентификатора в регистр 16 элементом задержки 22 и далее поступает на входы элементов И 19-21. Поскольку открытым по одному входу будет только элемент И 19, то, пройдя этот элемент, синхроимпульс, во-первых, поступает на вход считывания фиксированной ячейки памяти блока 18 памяти, где хранится адрес зоны памяти базы данных, в которой хранится исходный текстовый документ. Код адреса зоны памяти поступает на выход блока 1 и далее на вход блока 3.

Во-вторых, синхроимпульс поступает на вход блока 3, фиксируя в счетчике 30 адрес текстового документа в базе данных.

Одновременно с этим синхроимпульс задерживается элементом задержки 31 на время срабатывания счетчика 30 и используется для перевода работы базы данных, построенной на основе сервера базы данных, в режим выдачи исходного текстового документа и его занесения в регистр 33 сдвига блока 4.

Параллельно этому идентификатор шаблона также расшифровывается дешифратором 17 и с выхода блока 1 поступает в дешифратор 24 блока 2, который расшифровывает идентификатор шаблона и открывает по одному из входов один из элементов И 25-27. Допустим таким элементом является элемент И 27. Учитывая, что по одному входу будет открыт только один элемент И, то, пройдя только его, синхроимпульс поступит на вход считывания фиксированной ячейки памяти блока 28 памяти, в котором хранятся параметры шаблона, и считывает их на информационный вход регистра 29, в который шаблон записывается по синхроимпульсу.

С выхода регистра 33 сдвига первое кодовое слово исходного текстового документа подается на вход блока 5, куда поступает также кодовое слово шаблона.

Процесс обезличивания исходного текстового документа производится по команде «пуск», подаваемого на управляющий вход 10 (первый вход блока 5), который через элемент ИЛИ 37 поступает на синхронизирующий вход компаратора 36, сравнивающего слова исходного текстового документа с кодовым словом шаблона. Если кодовое слово исходного тестового документа не совпадает с кодовым словом шаблона, то компаратор 36 формирует сигнал, который, во-первых, поступает в блок 7, что позволяет не изменять соответствующее кодовое слово исходного текстового документа, во-вторых, сигнал поступает на установочный вход триггера 44, подтверждая его исходного состояние. В-третьих, сигнал поступает в блок 6 и через элемент ИЛИ 43 поступает в блок 4 на вход элемента И 35, другой вход которого подключен к выходу дешифратора 34, на вход которого поступает код исходного тестового документа с выхода регистра 33 сдвига. До тех пор пока в регистре 33 будет находится код исходного текстового документа, на выходе дешифратора 34 будет формироваться низкий потенциал, блокирующий работу элемента И 35.

Как только в результате сдвига кода исходного текстового документа регистр 33 будет обнулен, на выходе дешифратора 34 будет сформирован высокий потенциал, открывающий элемент И 35, что позволяет фиксировать время прекращения процедуры обработки исходного текстового документа.

С выхода элемента И 42 блока 6 синхронизатрующий1 импульс поступает на единичный вход триггера 41, устанавливая его в единичное состояние, при котором триггер 41 открывает по одному входу элемент И 42, к другому входу которого подключен генератор 38. Каждый импульс генератора 38 проходит через элемент И 42 и далее поступает на синхронизирующий вход компаратора 40, на один информационный вход которого подается код числа разрядов в кодовом слове шаблона, а на другой информационный вход - код показания счетчика 39. Если в данный момент времени показания счетчика 39 нулевые, то компаратор 40 формирует на своем выходе импульс. Который поступает на вход счетчика 39 и увеличивает его оказания на единицу.

С выхода компаратора 40 импульс поступает на управляющий вход регистра 33 сдвига и на пройдя в блоке 7 элемент И 45 сдвинет кодовое слово в регистре 46 на число разрядов шаблона.

Если в результате сравнения входных кодов будет обнаружено полное совпадение кодового слова исходного текстового документа и кодового слова шаблона, то компаратор 36 сформирует импульс на другом своем выходе. Этот сигнал устанавливает в единичное состояние триггер 44, который блокирует работу элемента И 45.

Описанный процесс продолжается, пока все кодовые слова исходного текстового документа не пройдут сравнения с выбранным шаблоном, что будет зафиксировано дешифратором 34 после окончания сдвига исходного и обнуления всех разрядов регистра 33 блока 4.

В этот момент времени очередной синхронизирующий импульс из блока 6 через блок 4 поступает в блок 3 на вход счетчика 30 формируя, тем самым, адрес записи обезличенного исходного текстового документа в базе данных системы. Этот же синхронизирующий импульс обеспечивает запись содержимого блока 7 по указанному адресу в базу данных (сервер базы данных).

После этого система готова к очередному циклу обработки исходных текстовых документов.

Таким образом, благодаря созданию дополнительного арсенала технических средств обеспечивается расширение функциональных возможностей системы, поскольку обеспечивается не только выделение в исходном текстовом документе требуемых слов, но производится обезличивание документа путем исключения из него персональных данных и конфиденциальной информации.

Автоматизированная система интеллектуального обезличивания персональных данных в тексте документа, содержащая блок выделения отселектированной информации и блок отображения, отличающаяся тем, что введены блок селекции адресов документов в базе данных, блок селекции шаблонов обезличивания документов, блок формирования сигналов считывания и записи базы данных, блок приема записей базы данных и блок управления, при этом первый и второй входы блока селекции адресов документов в базе данных являются соответственно первым информационным входом и первым синхронизирующим входом автоматизированной системы интеллектуального обезличивания персональных данных в тексте документа, первый вход блока выделения отселектированной информации является управляющим входом автоматизированной системы интеллектуального обезличивания персональных данных в тексте документа, первый и второй входы блока приема записей базы данных являются соответственно вторым информационным входом и вторым синхронизирующим входом автоматизированной системы интеллектуального обезличивания персональных данных в тексте документа, первый, второй и третий выходы блока формирования сигналов считывания и записи базы данных являются соответственно адресным выходом и первым и вторым синхронизирующими выходами автоматизированной системы интеллектуального обезличивания персональных данных в тексте документа, первый выход блока селекции адресов документов в базе данных соединен с первым входом блока формирования сигналов считывания и записи базы данных, второй выход блока селекции адресов документов в базе данных соединен со вторым входом блока формирования сигналов считывания и записи базы данных и с первым входом блока селекции шаблонов обезличивания документов, третий и четвертый выходы блока селекции адресов документов в базе данных соединены соответственно со вторым и с третьим входами блока селекции шаблонов обезличивания документов, первый выход которого соединен с первым входом блока управления, а второй выход соединен со вторым входом блока выделения отселектированной информации, первый выход блока приема записей базы данных соединен с третьим входом блока выделения отселектированной информации и с первым ходом блока отображения, второй выход блока приема записей базы данных соединен с третьим входом блока формирования сигналов считывания и записи базы данных, первый выход блока управления соединен со вторым входом блока отображения и с третьим входом блока приема записей базы данных, второй выход соединен с четвертым входом блока выделения отселектированной информации, а третий выход соединен с четвертым входом блока приема записей базы данных, первый выход блока выделения отселектированной информации соединен с третьим входом блока отображения и со вторым входом блока управления, второй выход блока выделения отселектированной информации соединен с четвертым входом блока отображения и с третьим входом блока управления, а второй выход блока селекции шаблонов обезличивания документов соединен с четвертым входом блока приема записей базы данных.



 

Похожие патенты:

Полезная модель относится к автоматизированным системам управления многоуровневыми иерархическими территориально распределенными системами юридически значимого электронного документооборота, которые могут быть использованы для подготовки и представления отчетности в контролирующие органы
Наверх