Изобретение относится к автоматике и вычислительной технике и может быть использовано для обработки кодированных факсимильных изображений. Цель изобретения - повышение точности распознавания кодированных текстовых и графических факсимильных изображений. Способ основан на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценки размеров Ni этих участков. Новым является введение операций выделения кодированных строчных участков, выделения r-х групп последовательных участков соседних "белых строк" минимального размера, выделения р-х групп последовательных участков соседних "небелых" строк, оценки наличия квазипериодичности следования групп последовательных участков "белых" строк и величины квазипериода Qr, вычисления отношений dp максимальных
dip макс и минимальных
ip мин абсолютных значений разностей размеров соседних кодированных "небелых" строк, сравнения их с порогом D и вынесения соответствующего решения. Способ позволяет выделить признаки, обеспечивающие повышение точности распознавания кодированных факсимильных изображений. 1 ил.
Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания и селекции кодированных документальных сообщений при обработке факсимальной информации.
Известен способ распознавания графической и текстовой информации [1], основанный на построчном сканировании изображения, преобразовании его в последовательность импульсов и формировании информационных импульсов и опорного временного интервала от окончания минимального временного интервала до окончания максимального временного интервала, преобразовании опорного временного интервала в последовательность зонных интервалов равной длительности, а затем в выделении в каждом зонном временном интервале группы импульсов с временными интервалами между соседними импульсами, меньшими или равными суммарной длительности строки и зонного интервала и вынесении решения по числу выделенных групп в каждом зонном интервале.
Существенным недостатком этого способа является низкая точность распознавания кодированных сигналов факсимильных изображений.
Известен способ распознавания факсимильных изображений [2], основанный на построчном сканировании изображения документа, последовательном выделении каждого локального графического образа в сканируемой строке изображения, определении координат и параметров выделенного локального образа, формировании набора пронумерованных эталонов образов в пределах сканируемой строки, формировании набора пронумерованных эталонов образов в пределах всего изображения, сравнении очередного выделенного образа с каждым из эталонов набора сканируемой строки, введении выделенного образа при несовпадении его ни с одним из эталонов в наборе сканируемой строки в этот набор с одновременным определением области несовпадения этого символа с каждым символом из набора эталонов всего изображения и последующем принятии решения путем поэлементной весовой оценки.
Недостатком этого способа является его большая вычислительная сложность и необходимость наличия большого объема памяти для хранения эталонных образцов кодированных символов факсимильных изображений.
Наиболее близким по своей сущности к заявляемому изобретению является способ распознавания факсимильных изображений [3], основанный на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценке размеров этих участков, кроме того, в способе производятся операции выделения участков, содержащих непрерывную информацию, по размеру которых определяют, какие участки содержат символьную информацию, а какие - линейную, в соответствии с чем выполняют отдельную обработку каждого участка.
Основным недостатком этого способа является низкая точность распознавания кодированных текстовых и графических факсимильных сообщений друг от друга.
Известно [4], что наиболее целесообразно осуществлять хранение факсимильных изображений в факсимильных базах данных в форме, использующей кодирование модифицированным кодом Хаффмана (МХ-код), так как это требует меньше места для размещения информации, чем использование других форматов (например, РСХ).
В этой связи распределения серий "нулей" и "единиц" в кодированном факсимильном изображении могут не соответствовать распределениям "нулей" и "единиц" (участков "белого" и "черного" соответственно) в некодированном факсимильном изображении, представленном в двоичной форме, что является причиной низкой точности распознавания кодированных МХ-кодом текстовых и графических изображений в способе-прототипа [3].
Целью изобретения является повышение точности распознавания кодированных текстовых и графических факсимильных изображений.
Указанная цель достигается тем, что в способ распознавания факсимильных изображений, основанный на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценки размеров N
i этих участков, введены операции выделения кодированных строчных участков электрических сигналов, заключенных между двумя соседними кодовыми словами конца строки развертки изображения, удаления служебных битов в выделенных строчных участках, различения и выделения r-х групп (r = 1,2,...,R) последовательных участков соседних "белых" строк минимальной размерности N
(i+1)r, N
(i+2)r, . . ., N
(i+m)r, ..., N
(i+M)r (M - априорно заданное число соседних белых строк в анализируемом фрагменте изображения) путем сравнения с соответствующей пороговой величиной N
o (N
(i+m)r 
N
o), выделения p-х групп (p = 1, 2, . . . , P) последовательных "небелых" кодированных строк размерности N
(i+1)p, N
(i+2)p, . .., N
(i+l)p, ..., N
(i+L)p (L - априорно заданное число соседних "небелых" строк в анализируемом фрагменте изображения) путем сравнения с соответствующей пороговой величиной N
1 (N
(i+l)p 
N
1, оценки наличия квазипериодичности следования участков, соответствующих кодированным "белым" строкам развертки изображения, оценки средней величины квазипериода

оценки абсолютных величин
ip разностей размеров соседних кодированных "небелых" строк

вычисления отношений d
p=
ip макс/
ip мин максимальных и минимальных значений разностей
ip, сравнения полученных значений d
p с априорно заданной пороговой величиной D и вынесения соответствующего решения о принадлежности кодированного факсимильного изображения или его фрагмента графической или текстовой форме.
Как известно [5] кодированная МХ-кодом строка развертки факсимильного изображения состоит из информационных битов, служебных битов заполнения (FILL) и следующего за ними кодового слова конца строки (EOL). Известно также [5], что наименьшее число информационных битов содержится в кодированной "белой" строке развертки факсимильного изображения и, кроме того, среднее число информационных бит, содержащихся в кодированной строке развертки графического изображения, существенно меньше (в 2 - 3 раза), чем среднее число бит в кодированной строке текстового изображения.
В этой связи признаками кодированного текстового сообщения (или его фрагмента) является наличие: 1) групп минимальных значений чисел, меньших порогового значения h
мин = N
0; 2) групп чисел максимального значения, превышающих пороговую величину h
макс = N
1; 3) квазипериодичности чередования групп минимальных и максимальных чисел.
Сопоставительный анализ со способом, выбранным в качестве прототипа, показывает, что заявляемый способ отличается использованием для распознавания кодированных факсимильных изображений принципиально новых операций: определения наличия групп "минимальных" и "максимальных" чисел битов в кодированных строках развертки, наличия квазипериодичности чередования групп минимальных чисел в кодированных строках развертки, вычисления отношения максимального значения разности соседних чисел к минимальному значению их разности в группе из максимальных чисел битов в кодированных строках развертки и сравнения величины этого отношения с заданной пороговой величиной.
Таким образом, заявляемый способ соответствует критерию изобретения "новизна".
Сравнение заявляемого способа с другими способами распознавания изображений показывает, что введение операций выделения групп минимальных, а также максимальных чисел битов в кодированных строках развертки, определения наличия квазипериодичности в порядке их чередования и сравнения величины квазипериода с заданной, вычисления отношения среднего числа битов в группах из максимального числа битов в кодированных строках развертки к среднему числу битов в группе из минимальных чисел битов позволяет выделить признаки для принятия решения о структуре факсимильного изображения по его кодированным сигналам, что обеспечивает (в сравнении с другими способами) повышение точности распознавания текстовых и графических факсимильных изображений.
Таким образом, предлагаемый способ распознавания кодированных изображений для специалиста явным образом не следует из уровня техники и соответствует критерию "изобретательский уровень".
Изобретение может быть использовано в различных областях промышленности, а именно, связанных с техникой передачи и обработки изображений, с вычислительной техникой, а также в других областях народного хозяйства, поэтому соответствует критерию "промышленная применимость".
На чертеже представлена блок-схема алгоритма распознавания кодированных изображений.
Способ осуществления следующим образом.
Последовательность двоичных кодированных электрических сигналов факсимильного изображения объема J (бит) после удаления служебных битов (битов-вставок, битов заполнения типа "FILL", а также кодовых слов (EOL) конца строки развертки [5], разделяется на i-е участки, состоящие из битов кодированных строк развертки изображения. Затем производится оценка размеров N
i (где N
i - случайные величины, определяемые структурой изображения) выделенных i-х участков двоичной последовательности, выделение r-х групп (r = 1, 2, ..., R) последовательных минимальных значений размеров кодированных участков соседних строк N
(i+1)r, ..., N
(i+m)r, ..., N
(i+M)r, где M

M
o - минимально возможное число "белых" строк в промежутках между соседними текстовыми строками - в случае текстовых изображений, N
(i+m)r 
N
o, N
o - максимально допустимый размер кодированной "белой" строки развертки).
В случае отсутствия (необнаружения) участков с такими значениями их размеров выносится решение о принадлежности данной последовательности кодированных сигналов графическому изображению.
При обнаружении r-х групп, соответствующих "кодированным" белым строкам развертки изображения, производится выделение p-х групп "небелых" кодированных строк размера N
(i+1)p, ..., N
(i+l)p, ..., N
(i+L)p (p=1,2,..., P) путем сравнения с соответствующей пороговой величиной N
(i+l)p 
N
1 (при этом N
1 выбирается таким образом, чтобы разность N
1 - N
0 =

N превышала величину погрешности

h, обусловленной наличием "точечных" дефектов на "белых" участках некодированного изображения

N

h, величина L

L
0, где L
0 - максимальное число строк развертки, содержащихся в строке печатного текста с заданной гарнитурой).
После выполнения указанных выше операций производится обнаружение начала квазипериодичности следования участков, соответствующих кодированным белым строкам, и оценка соответствия величины Q
r квазипериода (в случае его обнаружения) заданным нижней q
мин и верхней q
макс границам интервала значений Q
r. При этом значения q
мин, q
макс определяются возможными типами используемых шрифтов в текстовом изображении, а также разрешающей способностью по вертикали конкретной системы развертки изображения.
В случае обнаружения квазипериодичности групп участков, соответствующих "белым" строкам и соответствия величины квазипериода Q
r заданному интервалу значений производится принятие решения о принадлежности кодированных сигналов текстовому изображению. В противном случае производится оценка абсолютных величин
ip разностей значений размеров соседних кодированных "небелых" строк

и вычисление отношений d
p=
ip макс/
ip мин максимальных и минимальных значений указанных выше разностей для каждой p-й группы "небелых" строк, которое затем сравнивается с априорно выбранным порогом D, при превышении которого выносится решение о принадлежности данной p-й группы "небелых" строк графическому изображению, а иначе - текстовому (при этом величина порога D выбирается порядка D = 40 - 60).
Способ реализуется на базе использования однокристальной микро-ЭВМ или ПЭВМ типа IBM РС 386/386 (обеспечивающих ввод данных кодированного факсимального изображения объема 0,5 - 1 кбайт в память ОЭВМ/ПЭВМ и последующую соответствующую арифметико-логическую обработку этих данных).
Таким образом, введение операций выделения r-х групп последовательных минимальных значений размеров кодированных "белых" участков соседних строк развертки изображения, оценки квазипериодичности следования этих r-х групп, выделения p-х групп последовательных значений размеров кодированных "небелых" участков соседних строк, оценки абсолютного значения разностей размеров кодированных "небелых" участков соседних строк внутри каждой p-й группы, вычисления отношения максимальных и минимальных значений этих разностей для каждой p-й группы и сравнения с априорно заданным пороговым значением D обеспечивает повышение точности распознавания кодированных графических и текстовых изображений между собой.
Источники информации: 1. Авторское свидетельство СССР N 1348870, G06K 9/00, 30.10.87.
2. Авторское свидетельство СССР N 1809449, G06K 9/62, H03M 7/42.
3. Патент Японии МКИ по заявке N 61-56554 G06K 9/00, 03.12.86.
4. Введение к реализации системы поиска факсимильных изображений. Экспресс-информация, Сер.Информатика. - 1993, N 3, с.6.
5. Рекомендации МККТТ. Серия Т.4. Синяя книга. Т.VII, вып.VII.3. - 1988, с.17.
Формула изобретения
Способ разпознавания кодированных изображений, основанный на операции разделения изображения, представленного в форме кодированных электрических сигналов, на несколько участков и оценки размеров N
i этих участков, отличающийся тем, что выделяют кодированные строчные участки электрических сигналов, заключенные между двумя соседними кодовыми словами конца строки развертки изображения, удаляют служебные биты заполнения в выделенных строчных участках, различают и выделяют r-е группы, состоящие из M последовательных участков соседних "белых" строк минимальной размерности, сравнивают числа этих групп с соответствующей пороговой величиной N
0 и выделяют p-е группы, состоящие из L последовательных "небелых" кодированных строк, сравнивают числа данных групп с соответствующей пороговой величиной N
1, оценивают наличие квазипериодичности следования участков, соответствующих кодированным "белым" строкам развертки изображения, определяют среднюю величину квазипериода Q
r, оценивают абсолютные величины
ip разностей размеров соседних кодированных "небелых" строк, вычисляют отношения d
p максимальных и минимальных значений разностей
ip, сравнивают полученные величины отношений d
p с априорно заданной пороговой величиной D и выносят решение о принадлежности кодированного изображения или его фрагмента графической или текстовой форме.
РИСУНКИ
Рисунок 1