Устройство для распознавания изображений

 

Решение относится к автоматике и вычислительной технике и может быть использовано при решении задачи автоматического распознавания изображений (АРИ) среди большого числа эталонов. Его использование позволяет получить технический результат в виде увеличения скорости распознавания вводимых в компьютер изображений, сравниваемых с большим количеством эталонов, хранящихся в памяти устройства. Технический результат достигается за счет того, что устройство для распознавания изображений включает в себя видеокамеру, аналого-цифровой преобразователь, блок нормализации, блок выделения признаков, блок памяти эталонов, блок измерения сходства, блок оперативной памяти, блок экстраполяции расстояний, блок выбора (на основе метода направленного перебора) следующего эталона для сравнения с входным изображением, блок принятия решения об останове перебора и блок принятия решения для аутентификации пользователя.

Решение относится к автоматике и вычислительной технике, а более конкретно к системам искусственного интеллекта.

В большинстве известных способов распознавания образов изображение распознаваемого объекта разными способами преобразуется в систему электрических импульсов, переводится в цифровую форму и в дальнейшем сравнивается с аналогично преобразованными эталонными изображениями.

Так, в способе распознавания образов по патенту US 5267332 А, МПК 6 G06К 9/68, выданному 30.11.1993 г., изображения из базы данных предварительно преобразуются в форму, инвариантную к размеру и ориентации. Аналогичная процедура применяется к изображению для распознавания, а на заключительном этапе идет сравнение выделенных характеристик входного изображения со всеми изображениями-эталонами до тех пор, пока не будет найден наиболее близкий к распознаваемому изображению эталон.

При компьютерном распознавании объектов с помощью всех таких методов компьютер последовательно, поочередно сравнивает характеристики изображения нормализованного распознаваемого объекта, выраженные в цифровой форме, с цифровыми же характеристиками изображений эталонов, что требует при большом количестве эталонов большого времени распознавания и не позволяет системе распознавания работать в режиме реального времени.

Известна возможность преодоления этой проблемы - устройство мгновенного распознавания изображений по авторскому свидетельству 2308081, МПК G06К 9/68, опубл. 10.10.2007 г., включающее в себя компьютер, запоминающе-распознающий блок (ЗРБ), многоканальный генератор импульсов, управляемый компьютером, подключенный к входным выводам ЗРБ, считывающее устройство компьютера, подключенное к выходным выводам ЗРБ.

Однако недостатком этого устройства является следующее ограничение: на распознавание могут подаваться только изображения, уже сохраненные в качестве эталонов. На практике же распознаваемое изображение, как правило, не дублирует ни один эталон, поэтому требуется выделять эталон, наиболее близкий к распознаваемому изображению (в смысле некоторой метрики).

Наиболее близким, по сумме признаков, принятым в качестве прототипа, является устройство для распознавания изображений лиц по патенту US 6882741, МПК 6 G06К 9/00, выданному 19.04.2005. Оно содержит последовательно соединенные видеокамеру (с двумя блоками освещения), аналого-цифровой преобразователь (АЦП), блок нормализации, блок выделения признаков (для детектирования лица на изображении), блок распознавания (состоящий из блока памяти эталонов, блока выбора эталонов для сравнения, блока измерения сходства входного изображения и эталона и блока принятия решения об останове перебора) и блок принятия решения для аутентификации пользователя. Недостатком этого устройства является тот факт, что оно последовательно, поочередно сравнивает характеристики изображения распознаваемого объекта с характеристиками изображений эталонов, что требует при большом количестве эталонов большого времени распознавания и не позволяет устройству работать в режиме реального времени.

Задача, на решение которой направлено заявляемое устройство, состоит в том, чтобы система распознавания могла распознавать объекты среди большого множества эталонных изображений (МЭИ), не выполняя при этом полный перебор всевозможных альтернатив. Если входное изображение является одним из эталонов, то поставленная задача должна решаться за время, не зависящее от числа эталонов. В противном случае требуется найти ближайший к распознаваемому изображению эталон, проводя сравнение в среднем лишь с небольшой частью всего МЭИ.

Технический результат, который может быть получен при реализации предлагаемого устройства, - резкое увеличение скорости распознавания вводимых в компьютер изображений при сравнении с большим количеством эталонов.

Этот технический результат достигается тем, что в устройство для распознавания изображений, содержащее последовательно соединенные видеокамеру, АЦП, блок нормализации, блок выделения признаков, блок измерения сходства, блок памяти эталонов, блок выбора эталонов, блок принятия решения об останове и блок принятия решения для аутентификации пользователя, введены дополнительно последовательно соединенные блок оперативной памяти (на который замкнут выход блока измерения сходства) и блок экстраполяции расстояний, выход которого является управляющим входом блока выбора эталона для сравнения.

Сохранение в блоке оперативной памяти расстояний до проверенных эталонов, вычисленных блоком измерения сходства, и введение блока экстраполяции расстояний позволяет сделать блок выбора эталона управляемым: организовать не обычный случайный выбор эталона, с лежащим в его основе методом «проб и ошибок» (полный перебор), а направленный перебор. Именно это обстоятельство вносит решающий вклад в получение указанного выше технического результата.

Блок-схема предлагаемого устройства приведена на чертеже.

Устройство для распознавания изображений содержит видеокамеру 1, АЦП 2, блок нормализации 3, блок выделения признаков 4, блок измерения сходства входного изображения и эталона 5, блок принятия решений об останове 6, блок принятия решения для аутентификации пользователя 7, блок памяти эталонов 8, блок выбора эталонов 9, блок оперативной памяти 10, блок экстраполяции расстояний 11. Блок нормализации 3 установлен после блока АЦП 2, вход которого подключен к видеокамере 1. Выход блока нормализации 3 подключен к входу блока выделения признаков 4. К выходу блока выделения признаков 4 подключен первый вход блока измерения сходства 5. Выход блока измерения сходства 5 подключен к входу блока принятия решения об останове 6 и, через блок оперативной памяти 10, к входу блока экстраполяции расстояний 11. Выход блока экстраполяции расстояний 11 подключен к управляющему входу блока выбора эталонов 9. К входу блока выбора эталонов 9 подключен выход блока памяти эталонов 8. Выход блока выбора эталонов 9 подключен ко второму входу блока измерения сходства 5. Инверсный выход блока принятия решения об останове 6 является управляющим входом блока экстраполяции расстояний 11. Выход блока памяти эталонов 8 и блока принятия решения об останове 6 подключены к блоку принятия решения для аутентификации пользователя 7, который и является выходом устройства.

Устройство работает следующим образом. Анализируемое изображение, принятое с видеокамеры 1, переводится с помощью блока АЦП 2 в цифровую форму. Далее для оцифрованного изображения - интенсивность точки изображения с координатами (u,v)) в блоке нормализации 3 проводятся эквализация, приведение к единому масштабу (высота изображения H=const, ширина W=const) и нормировка. В результате получается нормированное изображение где В нормированном изображении в блоке 4 детектируется лицо. Блок измерения сходства 5 вычисляет информационное рассогласование Кульбака-Лейблера KL(X/Xr) между нормированным изображением , поступившего с выхода блока выделения признаков 4 и эталоном Хr, выбранным блоком выбора эталонов 9. Расстояние KL(X/Xr), вычисленное блоком измерения сходства 5, подается на вход блока принятия решения об останове 6, а также сохраняется в блоке оперативной памяти 10. В блоке оперативной памяти 10 выбирается N=const наилучших из числа проверенных эталонов (с наименьшими расстояниями до входного изображения ), которые поступают в блок экстраполяции расстояний 11. Этот блок в соответствии с методом направленного перебора выполняет экстраполяцию наилучших (наименьших) расстояний, полученных с выхода блока 6. Для экстраполяции используется стандартная модель авторегрессии, причем для вычисления коэффициентов авторегрессии применяется рекуррентная схема Берга-Левинсона с высокой скоростью сходимости. Выходом блока экстраполяции расстояний 11 является спрогнозированное значение расстояния от наилучшего из проверенных эталонов Х* до следующего эталона для проверки. Блок выбора эталонов 9 выбирает из блока памяти эталонов 8 тот эталон Хr, который удален от Х* на расстояние, равное выходу блока экстраполяции расстояний 11 - спрогнозированному расстоянию.

Блок принятия решения об останове 6 сравнивает расстояние KL(X/Xr) с заранее заданным порогом 0, значение которого подбирается экспериментально. Если KL(X/Xr)<0, то блок 6 выдает решение Xr блоку 7 об аутентификации пользователя, определяемого эталоном Х r из блока памяти эталонов 8. В противном же случае (KL(X/Xr)0) с инвертированного выхода блока 6 на управляющий вход блока экстраполяции 11 поступает команда на выбор следующего эталона из блока памяти эталонов 8. Если для всех эталонов из блока памяти 8 проверка в блоке 6 дала отрицательный результат (т.е. для всех эталонов расстояние до входного изображения превышает порог), то в блоке 7 делается вывод об отсутствии входного изображения среди эталонов, поэтому требуется либо выполнить повторную аутентификацию, либо отказать в аутентификации после нескольких подряд неудачных попыток.

Предлагаемое техническое решение было осуществлено в рамках проекта гранта ГУ-ВШЭ 09-03 от 04.06.2009 в виде экспериментального образца информационной системы для распознавания людей по фотографиям лиц. Результаты проведенных натурных испытаний подтвердили его (технического решения) повышенные по сравнению с известными аналогами функциональные возможности и показатели эффективности, а именно: повышенную скорость при высоком качестве распознавания. Для реальной базы данных фотографий лиц, состоящей из 1000 изображений 400 различных людей (полученной после кластеризации 6500 изображений), при тестировании 1000 тестовых изображений, не входящих в МЭИ, в среднем в блоке измерения сходства 5 проверялось 25% эталонов (то есть менее 4% от всей базы данных). Таким образом, благодаря предлагаемому устройству для распознания изображений удается в несколько раз сократить объем вычислений для выполнения наиболее трудоемкой процедуры любого алгоритма АРИ - подсчета расстояния в блоке измерения сходства 5.

Устройство для распознавания изображений, включающее в себя видеокамеру, аналого-цифровой преобразователь (АЦП), блок нормализации, блок выделения признаков, блок памяти эталонов, блок измерения сходства, блок выбора эталонов, блок принятия решения об останове и блок аутентификации пользователя, отличающееся тем, что в него введены блок оперативной памяти и блок экстраполяции расстояний, причем блок нормализации установлен после АЦП, вход которого подключен к видеокамере, выход блока нормализации подключен к входу блока выделения признаков, к выходу которого подключен первый вход блока измерения сходства, его выход подключен к входу блока принятия решения об останове и через блок оперативной памяти к входу блока экстраполяции расстояний, выход последнего подключен к управляющему входу блока выбора эталонов, к его информационному входу подключен выход блока памяти эталонов, выход блока выбора эталонов подключен ко второму входу блока измерения сходства, инверсный выход блока принятия решения об останове является управляющим входом блока экстраполяции расстояний, выходы блока памяти эталонов и блока принятия решения об останове подключены к блоку принятия решения для аутентификации пользователя, который и является выходом устройства.



 

Похожие патенты:

Медицинское оборудование для первичной диагностики новообразований молочной железы и назначения последующего обследования и лечения. В некоторых случаях имеет ощутимое преимущества перед более простым, безопасным и дешевым УЗИ, особенно, когда необходимо проверить аксиллярную зону.

Изобретение относится к устройствам распознавания образов, конкретно к устройствам распознавания объектов по их трехмерным лазерным изображениям
Наверх