Комплексная система автоматического распознавания речевых сигналов

 

Комплексная система автоматического распознавания речевых сигналов, относится к области электрорадиотехники, и может быть использована на стационарных и подвижных объектах. Достигаемым техническим результатом является повышения надежности распознавания речевых команд за счет нормализации индивидуальных различий говорящих и автоматическую верификацию голосов с целью контроля за личностью оператора. 1 ил.

Полезная модель относится к области электрорадиотехники, а именно к системам распознавания речевые сигналов и может быть использована на стационарных и подвижных объектах.

Комплексная система автоматического распознавания речевых сигналов эта система, которая с одной стороны, способна учитывать индивидуальные различия говорящих (ИРГ) при распознавании речевых команд, а с другой стороны - использовать эти различия для автоматической верификации голосов с целью контроля за личностью оператора.

Известен Патент США. Система распознавать речи. Кл. 338-18 №3292116. В этой системе предлагается корректор, имеющий набор частотных характеристик с крутизной подъема в сторону высоких частот, равной 6, 12, 18 и 24 дБ/окт.В зависимости от соотношения уровней входного сигнала в полосах 100-500 Гц и 500-5000 Гц включается управляющая цепь с соответствующей корректирующей характеристикой.

Наиболее близкой к заявляемой системе является Автоматическая система распознования голосов. (Протопип). Skarr R.W. NorMalization and adaption of speech data for automatic recognition. - Int. S. Mach. Stud, 1970, v2, №1.

Система состоит из блока обработки речевого сигнала в который входят; детектор огибающей, детектор основного тона, нормализатор уровня и спектрального полосового анализатора, а также аналого-цифровой преобразователь (АЦП).

В системе помимо выравнивания крутизны наклона спектра, производится и нормализация вариаций общего уровня сигнала. Что приводит к отслеживанию движения формант, для чего применены фильтры с переменной полосой пропускания. Полоса фильтра управляется сигналами, пропорциональными предыдущим значениям формант. Таким образом достигается определение частоты форманты по сравнению со способами, использующими формантные фильтры с постоянными xapaктеристиками, т.е. индивидуальных эталонных изображений звука.

Однако, как аналог, так и прототип не способны учитывать индивидуальные различия говорящих при распознавании речевых команд и автоматическую верификацию голосов с целью контроля за личностью оператора

Целью полезной модели является повышения надежности распознавания команд за счет нормализации индивидуальных различий говорящих.

Поставленная цель достигается тем, что комплексная система автоматического распознавания речевых сигналов состоящая из аналого-цифрового блока обработки речевого сигнала состоящего из детектора огибающей параллельно соединенного с детектором основного тона и нормализатором уровня, который в свою очередь соединен со спектрально-полосовым анализатором, причем выходы детектора огибающей, детектора основного тона и спектрально-полосового анализаторов соединены с аналого-цифровым преобразователем (АЦП), дополнительно введен исполнительный блок состоящий из переключателя, устройств описания и верификации голосов, формирования эталонов, нормализации эталонов команд, распознавания команд и ключа, при этом АЦП пoсредством переключателя связан с устройством описания и верификации голосов выход которого соединен с устройством формирования эталонов, которое своим входом соединено с переключателем, а выход соединен с устройством нормализации эталонов команд выход которого соединен с ключом и устройством описания и газификации голосов, причем ключ своим входом соединен с переключателем, а выход соединен с устройством распознавания команд.

На Фиг. показана блок-схема системы, она состоит из следующих элементов:

1 - детектора щгибающей;

2 - детектора основного тона;

3 - норализатора уровня;

4 - спектрально-полосового анализатора;

5 - аналого-цифрового преобразователя (АЦП);

6 - блока формирования эталонов;

7 - блока описания и верификации голосов;

8 - блока нормализации эталонов команд;

9 - блока распознавания команд;

10 - ключа К

Аналого-цифровой преобразователь 5 осуществляет связь выделенных параметров сигнала с исполнительным блоком.

Спектрально-полосовой анализатор 4 выполнен с помощью 24 четвертьоктавных фильтров, накрывающих полосу от 100 до 6400 Гц. Полученные на выходе анализатора сигналы далее выпрямляются, сглаживаются с помощью фильтров и подаются вместе с огибающей 1 исходного сигнала и значением основного тона 2 на преобразователь 5.

Работа системы заключается в следующем.

Речевой сигнал поступает параллельно на входы детекторов огибающей 1 и

Основного тона 2, нормализатора уровня 3 и спектрально-полосового анализатора 3 и спектрально-полосового анализатора 4, а затем через аналого-цифровой преобразователь 5 - в исполнительную часть системы. Устройство формирования эталонов 6 производит описание голосов верифицируемых операторов и распознаваемых команд. В режиме верификации устройство описания и верификации голосов 7 устанавливает принадлежность голосов оператора к классу «Свой» или «Чужой» и в случае первого исхода передает информацию об индивидуальных различий говорящих (ИРГ) в устройство нормализации эталонов команд 8. Одновременно через ключ (К) выдается разрешение на распознавание команд, произносимых вслед за парольной фразой. Это процедура осуществляется устройством распознавания команд 9 с использованием скорректированных эталонов, выдаваемых устройством нормализации эталонов команд 9.

Предложенная система позволяет существенно сократить объем запоминаемой информации об ИРГ в 6-10 раз по сравнению с использованием индивидуальных эталонных изображений звуков.

В режиме верификации, на материале 100 парольных фраз, произнесенных 10 дикторами, надежность системы автоматического подтверждения личности оператора составила 96%.

Комплексная система автоматического распознавания речевых сигналов, состоящая из аналого-цифрового блока обработки речевого сигнала, который состоит из детектора огибающей, параллельно соединенного с детектором основного тона и нормализатором уровня, который в свою очередь соединен со спектрально-полосовым анализатором, причем выходы детектора огибающей, детектора основного тона и спектрально-полосового анализатора соединены с аналого-цифровым преобразователем (АЦП), отличающаяся тем, что в нее дополнительно введен исполнительный блок, состоящий из переключателя, устройств описания и верификации голосов, формирования эталонов, нормализации эталонов команд, распознавания команд и ключа, при этом АЦП посредством переключателя соединен с устройством описания и верификации голосов, выход которого соединен с устройством формирования эталонов, которое своим выходом соединено с переключателем, а выход соединен с устройством нормализации эталонов команд, выход которого соединен с ключом и устройством описания и верификации голосов, причем ключ своим входом соединен с переключателем, а выход соединен с устройством распознавания команд.



 

Похожие патенты:

Изобретение относится к вычислительной технике, в частности, к автоматизированной системе электронного документооборота ГАС «Выборы» Техническим результатом является повышение быстродействия системы путем локализации поиска адресов картотеки дел по идентификаторам дел, находящихся в делопроизводстве

Автоматизированная система квалифицированной цифровой электронной подписи документов относится к устройствам обработки данных для специального применения и может быть использована в структуре электронного документооборота заказчик-исполнитель, в частности, при реализации документооборота в области рекламы
Наверх