Система адаптивного распознавания символов

 

Изобретение относится к технической кибернетике, в частности, к системе адаптивного распознавания символов текстовых документов. Цель изобретения - повышение надежности распознавания символов путем использования процедуры их кластеризации. Технический результат достигается тем, что система содержит блок представления эталонов символов, блок формирования циклов наложения образов, первый селектор признаков наложения, первый селектор ошибок наложения, второй селектор ошибок наложения, второй селектор признаков наложения, блок измерения параметров наложения, блок задания сдвигов символов, блок идентификации символов. 6 ил.

Изобретение относится к технической кибернетике, в частности, к системам адаптивного распознавания символов текстовых документов.

Системы оптического распознавания текстов (OCR), преобразующие графический образ документа в текстовый формат, используют в своей работе различные методы и алгоритмы, такие как бинаризация, сегментация (поиск текстовых блоков, таблиц, иллюстраций и иных объектов), распознавание текстовых строк и полей таблиц, адаптацию к особенностям шрифтов документа, лингвистические средства.

Многие из них базируются на алгоритмах распознавания образов отдельных символов, которые оперируют либо представлением образа символа в виде набора признаков, либо оригинальным отсканированным образом.

Предельные характеристики качества распознавания, распознающих набор признаков, определяются не только свойствами собственно алгоритма, но также искажениями сигнала и возможностями представления образа символа.

Вместе с тем, по-прежнему, остаются нерешенными вопросы определения возможности распознавания символов, использующих оригинальные образы, насколько могут отличаться образы отсканированных символов от их идеальных прототипов, а также, насколько могут различаться экземпляры одной буквы.

Известны технические решения, которые могли бы быть использованы для решения поставленной задачи (1, 2).

Первая из известных систем содержит блок словаря для регистрации частичных форм символьных изображений данных, определяющих направление штрихов, блок словаря для регистрации символов изображений, состоящих из частичных форм символов, блок ввода штрихов символьного изображения, подлежащего распознаванию, блок поиска символов в словаре и блок выдачи найденного символа (1).

Существенный недостаток данной системы состоит в невысокой надежности распознавания символов, форма начертания символов которых отлична от формы шрифтов эталонных символов.

Известна и другая система, содержащее интерактивную обрабатывающую схему для приема и преобразования видеоинформации первого типа для представления текста на документе, схему для определения изменения расстояния между центрами символов конкретного слова, схему для определения различия в способах расположения символов в данном слове и схему для пошагового распознавания (2).

Последнее из перечисленных выше технических решений наиболее близко к описываемому.

Его недостаток также заключается в том, что высокая надежность распознавания символов текстовых документов достигается только в том случае, когда шрифты начертания распознаваемых символов точно соответствуют шрифтам эталонных символов, используемых для классификации. При предъявлении же символов, шрифты которых отличны от эталонных, надежность их распознавания резко понижается, а с учетом возможных искажений символов за счет типографской печати - о надежности распознавания вообще речь может и не идти.

Цель изобретения - повышение надежности распознавания символов путем использования процедуры их кластеризации.

Поставленная цель достигается тем, что в систему, содержащую содержащая блок представления эталонов символов, группа информационных входов которого является группой информационных входов системы, предназначенных для приема кодового описания эталонов символов, блок формирования циклов наложения образов, управляющий вход которого является управляющим входом системы, предназначенным для запуска

системы, а первый синхронизирующий выход блока формирования циклов наложения образов соединен с синхронизирующим входом блока представления эталонов символов, блок задания сдвигов символов, информационный вход которого является информационным входом системы, предназначенным для установки количественного значения числа сдвигов символов, синхронизирующий вход блока задания сдвигов символов подключен к первому синхронизирующему выходу блока формирования циклов наложения образов, и блок идентификации символов, информационный вход которого соединен с выходом блока задания сдвигов символов, а сигнальный выход блока идентификации символов является сигнальным выходом системы, отличающаяся тем, что система содержит первый селектор признаков наложения, информационные входы которого соединены с первым и вторым информационными выходами блока представления эталонов символов соответственно, тактирующий вход первого селектора признаков наложения подключен к тактирующему выходу первого селектора признаков наложения, а управляющие входы группы первого селектора признаков наложения соединены с соответствующими управляющими выходами группы, первый селектор ошибок наложения, информационные входы которого соединены с первым и вторым информационными выходами блока представления эталонов символов соответственно, тактирующий вход первого селектора признаков наложения подключен к тактирующему выходу первого селектора признаков наложения, а управляющие входы группы первого селектора признаков наложения соединены с соответствующими управляющими выходами группы, второй

селектор ошибок наложения, информационные входы которого соединены со вторым и с третьим информационными выходами блока представления эталонов символов соответственно, тактирующий вход первого селектора признаков наложения подключен к тактирующему выходу первого селектора признаков наложения, а управляющие входы группы первого селектора признаков наложения соединены с соответствующими управляющими выходами группы, второй селектор признаков наложения, информационные входы которого соединены со вторым и с третьим информационными выходами блока представления эталонов символов соответственно, тактирующий вход первого селектора признаков наложения подключен к тактирующему выходу первого селектора признаков наложения, а управляющие входы группы первого селектора признаков наложения соединены с соответствующими управляющими выходами группы, блок измерения параметров наложения, информационный вход которого соединен с четвертым информационным выходом блока представления эталонов символов, первый счетный вход блока измерения параметров наложения подключен к выходу первого селектора признаков наложения, второй счетный вход блока измерения параметров наложения соединен с выходом первого селектора ошибок наложения, третий счетный вход блока измерения параметров наложения подключен к выходу второго селектора ошибок наложения, четвертый счетный вход блока измерения параметров наложения соединен с выходом второго селектора признаков наложения, первый и второй синхронизирующие входы блока измерения параметров наложения подключены к первому и второму

синхронизирующим выходам блока формирования циклов наложения образов соответственно, а установочный вход блока измерения параметров наложения соединен с третьим синхронизирующим выходом блока формирования циклов наложения образов, при этом первый и второй информационные выходы блока измерения параметров наложения являются первым и вторым информационными выходами системы, а первый и второй синхронизирующие выходы блока измерения параметров наложения являются первым и вторым синхронизирующими выходами системы соответственно и подключены к первому и второму синхронизирующим входам блока идентификации символов соответственно.

Сущность изобретения поясняется чертежами, где на фиг.1 представлена структурная схема системы, на фиг.2 - структурная схема блока представления эталонов символов, на фиг.3 - структурная схема блока формирования циклов наложения образов, на фиг.4 - структурная схема селекторов признаков наложения и селекторов ошибок наложения, на фиг.5 - структурная схема блока измерения параметров наложения, на фиг.6 - структурная схема блока идентификации символов.

Система (фиг.1) содержит блок 1 представления эталонов символов, блок 2 формирования циклов наложения образов, первый 3 селектор признаков наложения, первый 4 селектор ошибок наложения, второй 5 селектор ошибок наложения, второй 6 селектор признаков наложения, блок 7 измерения параметров наложения, блок 8 задания сдвигов символов, блок 9 идентификации символов.

На чертеже показаны группа 10-13 информационных входов системы, информационный 14 и управляющий 15 вход системы, а также первый 16 и второй 17 информационные выходы системы, первый 18 и второй 19 синхронизирующие выходы системы, и сигнальный 20 выход системы.

Блок 1 (фиг.2) представления эталонов символов содержит регистры 25-28. На чертеже показаны группа 10-13 информационных входов и синхронизирующий 30 вход блока, а также первый 31, второй 32, третий 33 и четвертый 34 информационные выходы блока.

Блок 2 (фиг.3) формирования циклов наложения образов содержит счетчик 36, дешифратор 37, триггер 38, генератор 39 импульсов, элемент 40 И, элементы 41-43 задержки. На чертеже показан управляющий 15 вход, а также тактирующий 44 выход, группа 45-47 управляющих выходов, первый 48, второй 49 и третий 50 синхронизирующие выходы блока.

Селектор 3 признаков наложения (фиг.4) содержит элементы 52, 53 И, элемент 54 ИЛИ, а селектор 4 (фиг.4) ошибок наложения содержит элементы 55, 56 И, элемент 57 ИЛИ. Селекторы 5 и 6 выполнены аналогичным образом. На чертеже (фиг.1) показаны первый 59 и второй 60 информационные входы селекторов 3, 4, синхронизирующий вход 52 и группа управляющих входов 63-65, а также выходы 66, 67.

Блок 7 (фиг.5) измерения параметров наложения содержит счетчики 71-74, сумматор 75, компаратор 76, группы 77-78 элементов И. На чертеже показаны первый 80, второй 81, третий 82 и четвертый 83 счетные входы блока, информационный 84, первый 85 и второй 86 синхронизирующие и установочный 87

входы блока, а также первый 88 и второй 89 информационные, первый 90 и второй 91 синхронизирующие выходы.

Блок 8 (фиг.1) выполнен в виде регистра, имеющего информационный 14 и синхронизирующий входы, и выход, соединенный с входом 97 блока 9.

Блок 9 (фиг.6) идентификации символов содержит счетчик 93, компаратор 94, элемент 95 ИЛИ, элемент 96 задержки. На чертеже показаны информационный вход 97, счетный вход 98 и установочный вход 99, а также сигнальный 20 выход.

Все узлы и элементы системы выполнены на стандартных потенциально-импульсных элементах.

Система работает следующим образом.

Для распознавания бинарных образов символов

Im={{Im11 , Im12, ..., Im1n }, {Im21, Im22, ..., Im2n}, ..., {Imm1 , Imm2, ..., Immn }},

где Im12{0,1}, стандартизованных к размеру m строк и n столбцов и последовательно поступающих из памяти сервера (на чертеже не показан) через вход 11 в регистр 26 блока 1, используется представление эталонов

Etl={{Etl11, Etl 12, ..., Etl1n}, {Etl 21, Еtl22, ..., Etl 2n}, ..., {Etlm1, Etl m2, ..., Etlmn}}

где Etl ijG={0,2N-1}.

Из эталона Еtl символов сервер извлекает два бинарных представления:

- расширенное Cover (Etl, level С)={Etlij >LevelC}

- скелетное Skel (Etl, level S)={Etl ij>LevelS}

где LevelC и LevelS - пороги бинаризации эталона, удовлетворяющие условию

0<LevelC<LevelS<2 N-1.

Подсчитываются штрафы несовпадения с расширенным образом

Pen(Im,Cover)=(Imij==1 AND Cover==0)

и со скелетным образом

Pen(Im,Skel)=(Imij==0 AND Skel ij==1).

Также подсчитываются размеры совпадений с расширенным образом

Bonus(Im,Cover)=(Imij==1 AND Cover==1)

и со скелетным образом

Bonus(Im,Skel)=(Imij==1 AND Skel ij==1).

Иллюстрация процесса наложения приведена на фиг.4.

Штрафы могут быть отменены или уменьшены в зависимости от соотношений

Bonus(Im,Cover)/Pen(Im,Cover) и

Bonus(Im,Skel)/Pen(Im,Skel).

Общий штраф суммируется

Pen(Im,Etl)=Pen(Im,Cover)+Pen(Im,Skel).

В зависимости от величины штрафа принимается решение об остановке наложения по условию

Pen(Im,Etl)<LevelP.

Если это условие не выполнено, то осуществляется сдвиг образа Im на 1 строку вверх (вниз), на 1 столбец вправо (влево). Например, сдвиг на 1 строку вниз происходит по следующему правилу:

Im*(i+1)j=Imij

Im*0j=0

для 0jn,0i<m.

Вычисляемая таким образом близость распознаваемого образа Im и эталона Etl отвечает на вопрос о том, насколько хорошо образ соответствует распределению данного кластера, то есть позволяет производить сравнение с эталонами из некоторого набора и классифицировать образ в соответствии с получаемыми оценками.

Скелетное представление эталона символа сервер записывает через вход 10 в регистр 25, а расширенное представление эталона символа - через вход 12 в регистр 27. Одновременно с этим через вход 13 в регистр 28 блока 1 сервер записывает пороговое значение штрафа LevelP, а через вход 14 в блок 8 записывает заданное количество сдвигов, с помощью которых может быть оптимизировано положение распознаваемого символа на рецепторном поле. Как правило, количество сдвигов ограничено числом 8, а количество наложений - числом 9.

Начало выполнения процедуры распознавания дается сигналом сервера, поступающим через вход 15 блока 2 на единичный вход триггера 38. Высоким потенциалом единичного выхода триггера 38 открывается элемент 40 И, через который тактирующие импульсы генератора 39 начинают поступать на вход счетчика 36. Как следствие этого, дешифратор 37 начинает последовательно выдавать высокие разрешающие потенциалы на свои выходы 45-47 и далее последовательно открывать соответствующие элементы И селекторов признаков наложения 3, 6 и селекторов ошибок наложения 4, 5.

Импульсы с выхода элемента 40 И, задержанные на время срабатывания счетчика 36 и дешифратора 37 элементом 41 задержки через тактирующий выход 44 блока 2 опрашивают состояния элементов И соответствующих селекторов 3-6,

например, элементов 52, 53 И и 55, 56 И селекторов 3 и 4, как показано на фиг.4.

Если наложение распознаваемого символа и соответствующего эталона произошло, то импульс с входа 44 проходит через элемент 52 И, и далее через элемент 54 ИЛИ и выход 66 блока 3 на счетный вход счетчика 71 блока 7. Сигнала же на выходе элемента 55 И не будет, поскольку элемент 55 И будет закрыт низким потенциалом с нулевого выхода первого триггера регистра 26, находящегося в данный момент в единичном состоянии.

В результате полного цикла проверки наложения счетчик 71 зафиксирует размеры совпадений распознаваемого символа со скелетным образом

Bonus(Im,Skel),

а счетчик 74 зафиксирует размеры совпадений распознаваемого символа с расширенным образом

Bonus(Im,Cover).

Счетчик 72 блока 7 зафиксирует штраф несовпадения со скелетным образом

Pen(Im,Skel),

а счетчик 73 зафиксирует штраф несовпадения с расширенным образом

Pen(Im,Cover),

который может быть уменьшен в зависимости от значений размеров совпадений Bonus(Im,Skel) и Bonus(Im,Cover).

После окончания цикла наложения, момент которого фиксируется появлением импульса на выходе переноса счетчика 36 блока 3, триггер 38 сбрасывается этим же импульсом в исходное состояние. Одновременно этот же импульс с выхода 48 блока 2 поступает на установочные входы регистров блока 1, устанавливая их в начальное состояние, и через вход 85 блока 7 на синхронизирующий вход сумматора 75, где суммируются показания счетчиков 72 и 731. В сумматоре будет зафиксирована общая величина штрафа

Pen(Im,Elt).

Импульс окончания цикла наложения с выхода переноса счетчика 36 после задержки элементом 42 на время срабатывания сумматора 36 с выхода 49 блока 2 через вход 86 блока 7 поступает, во-первых, на входы элементов 77, 78 групп элементов И, переписывая содержимое счетчиков 71, 74 на информационный вход сервера с выходов 16 и 17, а, во-вторых, поступает на синхронизирующий вход компаратора 76, на входы которого поступают зафиксированное сумматором значение штрафа, полученного в результате наложения, и пороговое значение штрафа регистра с входа 84 блока 7.

Если суммарное значение штрафа будет меньше порогового значения, то на выходе 91 компаратора 76 появляется сигнал «наложение», который через выход 19 системы поступает на вход

прерывания сервера в качестве сигнала об отнесении распознаваемого символа к классу эталона. Кроме того, этот же сигнал через вход 99 блока 9 и далее через элемент 95 ИЛИ поступает на установочный вход счетчика 93, подтверждая его исходное состояние.

Если же суммарное значение величины штрафа превысит пороговое значение, то сигнал появится на другом выходе 90 компаратора 76 и через выход 18 системы поступит на вход сервера в качестве сигнала сдвига распознаваемого символа. По команде сервера сдвиг распознаваемого символа осуществляется на 1 строку вверх (вниз), на 1 столбец вправо (влево).

Одновременно с этим, сигнал сдвига с выхода 90 через вход 98 блока 9 поступает на счетный вход счетчика 93, который осуществляет подсчет циклов сдвига.

После сдвига распознаваемого символа сервер вновь записывает в регистры 25 и 27 блока 1 скелетное и расширенное представление образа, а в регистр 26 представление распознаваемого символа и процесс распознавания повторяется аналогичным образом.

Если в процессе заданного числа сдвигов распознаваемого символа суммарная величина штрафа так и не стала меньше порогового значения, то компаратор 94 блока 9 после того, как число сдвигов в счетчике 93 будет зафиксировано равным заданному числу в блоке 8, по сигналу с выхода элемента задержки 96, поступающему на его синхронизирующий вход, выдаст сигнал «отказа от распознавания» на выход 20 и далее на вход сервера для смены эталонов.

Кроме того, этот же импульс через элемент 95 ИЛИ поступает на установочный вход счетчика 93 сдвигов и возвращает его в исходное состояние.

Таким образом, благодаря использованию не жестко заданного эталона, а его скелетного и расширенного бинарных представлений в заявленном устройстве достигнуто существенное повышение надежности распознавания символов даже при типографских дефектах и искажениях оцифровки.

Источники информации, принятые во внимание:

1. Патент ЕПВ №0542566 М. кл. G 06 К 9/46, 9/80, 1993 г.

2. Патент США №4887301 М. кл. G 06 К 9/34, 1991 г. (прототип).

Система адаптивного распознавания символов, содержащая блок представления эталонов символов, группа информационных входов которого является группой информационных входов системы, предназначенных для приема кодового описания эталонов символов, блок формирования циклов наложения образов, управляющий вход которого является управляющим входом системы, предназначенным для запуска системы, а первый синхронизирующий выход блока формирования циклов наложения образов соединен с синхронизирующим входом блока представления эталонов символов, блок задания сдвигов символов, информационный вход которого является информационным входом системы, предназначенным для установки количественного значения числа сдвигов символов, синхронизирующий вход блока задания сдвигов символов подключен к первому синхронизирующему выходу блока формирования циклов наложения образов, и блок идентификации символов, информационный вход которого соединен с выходом блока задания сдвигов символов, а сигнальный выход блока идентификации символов является сигнальным выходом системы, отличающаяся тем, что система содержит первый селектор признаков наложения, информационные входы которого соединены с первым и вторым информационными выходами блока представления эталонов символов соответственно, тактирующий вход первого селектора признаков наложения подключен к тактирующему выходу первого селектора признаков наложения, а управляющие входы группы первого селектора признаков наложения соединены с соответствующими управляющими выходами группы, первый селектор ошибок наложения, информационные входы которого соединены с первым и вторым информационными выходами блока представления эталонов символов соответственно, тактирующий вход первого селектора признаков наложения подключен к тактирующему выходу первого селектора признаков наложения, а управляющие входы группы первого селектора признаков наложения соединены с соответствующими управляющими выходами группы, второй селектор ошибок наложения, информационные входы которого соединены со вторым и с третьим информационными выходами блока представления эталонов символов соответственно, тактирующий вход первого селектора признаков наложения подключен к тактирующему выходу первого селектора признаков наложения, а управляющие входы группы первого селектора признаков наложения соединены с соответствующими управляющими выходами группы, второй селектор признаков наложения, информационные входы которого соединены со вторым и с третьим информационными выходами блока представления эталонов символов соответственно, тактирующий вход первого селектора признаков наложения подключен к тактирующему выходу первого селектора признаков наложения, а управляющие входы группы первого селектора признаков наложения соединены с соответствующими управляющими выходами группы, блок измерения параметров наложения, информационный вход которого соединен с четвертым информационным выходом блока представления эталонов символов, первый счетный вход блока измерения параметров наложения подключен к выходу первого селектора признаков наложения, второй счетный вход блока измерения параметров наложения соединен с выходом первого селектора ошибок наложения, третий счетный вход блока измерения параметров наложения подключен к выходу второго селектора ошибок наложения, четвертый счетный вход блока измерения параметров наложения соединен с выходом второго селектора признаков наложения, первый и второй синхронизирующие входы блока измерения параметров наложения подключены к первому и второму синхронизирующим выходам блока формирования циклов наложения образов соответственно, а установочный вход блока измерения параметров наложения соединен с третьим синхронизирующим выходом блока формирования циклов наложения образов, при этом первый и второй информационные выходы блока измерения параметров наложения являются первым и вторым информационными выходами системы, а первый и второй синхронизирующие выходы блока измерения параметров наложения являются первым и вторым синхронизирующими выходами системы соответственно и подключены к первому и второму синхронизирующим входам блока идентификации символов соответственно.



 

Наверх