Обнаружитель активности речи

 

Полезная модель относится к технологии цифровой обработки речевого сигнала и может быть использована в системах сжатия речи или системах, использующих режим прерывистой передачи речи. Технический результат заключается в снижении вычислительной сложности устройства обнаружения пауз путем замены расчета энергии частотного спектра с использованием преобразования Фурье параметрическим методом расчета на основе авторегрессионной модели, широко используемой в настоящее время в устройствах параметрического кодирования речевого сигнала на основе метода линейного предсказания речи (липредерах). Кроме того, вычислительную сложность позволяет снизить исключение из схемы аналого-цифрового преобразователя. 5 ил.

Полезная модель относится к технологии цифровой обработки речевого сигнала и может быть использована в системах сжатия речи или системах, использующих режим прерывистой передачи речи.

Особенностью речевых сигналов является высокая доля пауз, суммарная продолжительность которых составляет в среднем около 20% при монологе и около 70% в режиме диалога от общей длительности речи. Удаление из речи участков, соответствующих паузам, позволяет существенно уменьшить объемы битовых представлений речевых сигналов или отключать передатчик цифровой системы передачи речевых данных в такие моменты, т.е. использовать режим прерывистой передачи.

Известно устройство обнаружения пауз в речевых сигналах (Шелухин О.И., Лукьянцев Н.Ф. Цифровая обработка и передача речи / Под ред. О.И. Шелухина. - М.:Радио и связь, 2000. - 456 с.: ил.), содержащее инверсный фильтр, первый вход которого соединен с выходом микрофона, а второй вход - с первым выходом схемы адаптивной установки коэффициентов предсказания, второй выход которого соединен со входом схемы вычисления порога, выход схемы вычисления порога соединен со вторым входом порогового обнаружителя, а первый вход порогового обнаружителя - с выходом инверсного фильтра.

Поскольку в вышеупомянутой схеме применена одномерная решающая функция, построенная на анализе значения порога вида

где 1 - дисперсия речевого сигнала (смеси речевого сигнала и шума); 0 - дисперсия шума; то возникают так называемые мертвые зоны, когда решающая функция для некоторых сочетаний параметров инверсного фильтра до и после их адаптации или не изменяется, или ее значение растет так медленно, что за приемлемое время обнаруживается с вероятностью ложной тревоги. Другим существенным недостатком данного устройства является подавление как компонентов шума (сигнала в паузе речи), так и компонентов речевого сигнала, в случае совпадения их максимумов.

Наиболее близким, принятым за прототип, является устройство обнаружения пауз в речевых сигналах по патенту RU 2317595 С1 от 30.10.2006. В данном техническом решении оценку определения спектрального отклонения речевого сигнала от шума проводят

посредством определения отклонения отношений энергии частотного спектра речевого сигнала от частотного спектра шума, выполняя следующие действия:

1. Осуществляют дискретизацию с шагом t и квантование сигналов с выхода микрофона (получение отсчетов);

2. Записывают в запоминающее устройство поток отсчетов отрезка определенной длины шумового сигнала (сигнала в паузе речи) с выхода микрофона в режиме молчания диктора;

3. Разделяют поток отсчетов отрезка шумового сигнала на ряд участков длиной R;

4. Разделяют частотный диапазон (1/t) энергетического спектра Фурье каждого из этих участков на ряд интервалов (i=1,...,N);

5. Вычисляют точные значения долей энергии отсчетов шумового сигнала Piпауза , соответствующих каждому из частотных интервалов, по формуле

где

- отрезок анализируемого сигнала в i-м частотном интервале (j=1,...,L); - собственные векторы матриц c элементами вида

соответствующие собственным числам k,k=1,...,M.

6. Определяют среднее значение долей энергии отсчетов шумового сигнала P iпауза ср в каждом частотном интервале для всего потока отсчетов отрезка шумового сигнала;

7. Записывают в запоминающее устройство вычисленные значения энергии отсчетов шумового сигнала Piпауза ср;

8. Разделяют поток отсчетов речевого сигнала на участки такой же длины, как и при анализе потока отсчетов шумового сигнала;

9. Вычисляют для каждого участка в каждом из N частотных интервалов значения долей энергии отсчетов речевого сигнала Рi по формуле

где М и уik определяются по выражениям (3)-(5).

10. Вычисляют отношения Р i к Рiпауза ср в каждом из N частотных интервалов всех выбранных участков и определяют из них максимальное значение mах(Рiiпауза ср);

11. Передают максимальное значение mах(Р iiпауза ср) на вxод порогового обнаружителя;

12. Определяют значение порога h в схеме вычисления порога с учетом вычисленного значения М;

13. Сравнивают в пороговом обнаружителе максимальное значение mах(Р iiпауза ср) со значением порога h;

14. Принимают решение о наличии паузы при значении max(Р iiпауза ср) меньшим или равным порогу h, обновляют значение Piпауза ср с учетом текущего значения Piпауза;

15. Производят кодирование пауз, при этом код каждой паузы содержит информацию только о моменте начала и продолжительности паузы.

Схема, иллюстрирующая реализацию устройства обнаружения пауз в речевых сигналах (обнаружителя активности речи) согласно прототипа, представлена на фиг.1. Обнаружитель-прототип содержит пороговый обнаружитель, схему вычисления порога и алгоритмический модуль, в состав которого входит аналого-цифровой преобразователь, устройство записи, запоминающее устройство, считывающее устройство, устройство вычисления энергии спектра, устройство определения среднего значения энергии отсчетов сигнала в паузе, устройство вычисления отношений Рi к P iпауза ср. устройство определения max(Р iiпауза ср), устройство кодирования, устройство синхронизации, причем первый вход алгоритмического модуля подключен к выходу микрофона; первый выход алгоритмического модуля подключен к первому входу порогового обнаружителя; второй выход алгоритмического модуля подключен ко входу схемы вычисления порога;

выход схемы вычисления порога подключен ко второму входу порогового обнаружителя;

выход порогового обнаружителя подключен ко второму входу алгоритмического модуля.

Устройство-прототип работает следующим образом.

Шумовой сигнал (сигнал в паузе речевого сигнала) с выхода микрофона подают на вход алгоритмического модуля, в котором производят дискретизацию с шагом t и квантование входного воздействия (получение отсчетов) с помощью аналого-цифрового преобразователя, записывают при помощи записывающего устройства полученные данные в запоминающее устройство, затем считывают при помощи считывающего устройства участки длиной R потока отсчетов отрезка шумового сигнала в устройство вычисления энергии спектра, в котором вычисляют точные значения долей энергии отсчетов шумового сигнала по формуле (2) в каждом из частотных интервалов (i=1,...,N), на которые разделяют частотный диапазон (1/t) энергетического спектра Фурье каждого из участков длиной R. Далее в устройстве определения среднего значения долей энергии отсчетов шумового сигнала определяют Piпауза сp в каждом частотном интервале для всего потока отсчетов шумового сигнала и записывают данные значения в запоминающее устройство. При наличии на входе микрофона речи речевой сигнал с выхода микрофона поступает на вход алгоритмического модуля в аналого-цифровой преобразователь для дискретизации с шагом t и квантования, после чего речевые данные записывают в запоминающее устройство, затем считывают при помощи считывающего устройства участки длиной R потока отсчетов отрезка речевого сигнала в устройство вычисления энергии спектра, в котором вычисляют по формуле (6) точные значения долей энергии отсчетов речевого сигнала в каждом из частотных интервалов (i=1,...,N), на которые разделяют частотный диапазон (1/t) энергетического спектра Фурье каждого из участков длиной R. После вычисления отношения Рi к P iпауза ср и определения его максимально значения mах(P i/Piпауза ср) последнее поступает с первого выхода алгоритмического модуля на первый вход порогового обнаружителя, на второй вход которого поступает сигнал о значении порога h, полученного в схеме вычисления порога, определенного с учетом вычисленного значения М, поступающего со второго выхода алгоритмического модуля. Код каждой паузы содержит информацию только о моменте начала и продолжительности паузы, что позволяет сократить объем битового представления сигнала в паузе. После этого значение

Piпауза ср обновляют с учетом текущего значения Piпауза. Устройство синхронизации обеспечивает синхронную работу всех блоков, входящих в алгоритмический модуль.

Недостатком известного устройства обнаружения пауз в речевых сигналах (прототипа) является высокая вычислительная сложность при определении энергии частотного спектра шумового сигнала (сигнала в паузах речи) и энергии частотного спектра речи (смеси речевого сигнала и шума).

Техническим результатом, на достижение которого направлено изобретение, является снижение вычислительной сложности устройства обнаружения пауз путем расчета энергии частотного спектра с использованием коэффициентов линейного предсказания.

При вычислении частотного спектра непараметрическим методом с помощью одного из известных алгоритмов быстрого преобразования Фурье (см. Сергиенко А.Б. Цифровая обработка сигналов: Учебник для вузов. 2-е изд. - СПб.: Питер, 2006. - 751 с.: ил.) его вычислительная сложность составляет примерно 2R·log2R операций умножения и сложения и гораздо большее число таких операций при прямом расчете по формулам (2-6).

Наиболее желательным для спектрального оценивания речевых сигналов является использование методов на основе авторегрессионной модели. Это обусловлено простотой модели, удобством расчетов на ее основе и тем, что данная модель в настоящее время широко используются в устройствах параметрического кодирования речевого сигнала на основе метода линейного предсказания речи (липредерах). Варианты использования обнаружителя активности речи в системе сжатия речи на основе липредера представлен на фиг.2, а в системе, использующей режим прерывистой передачи речи, - на фиг.3.

В липредерах коэффициенты линейного предсказания а(m), представляющие собой импульсную характеристику фильтра кратковременного анализа, вычисляются с использованием известных методов, например алгоритма Левинсона-Дарбина (см. Марпл.- мл. С.Л. Цифровой спектральный анализ и его приложения / Пер. с анг. М.: Мир, 1990. 584 с.). Амплитуды составляющий спектра сигнала для требуемого частотного интервала могут быть оценены следующим образом:

где k1 - начальный индекс частотного интервала; k2 - конечный индекс частотного интервала; Р - порядок линейного предсказания; коэффициенты C(k1,k2,m) могут быть рассчитаны заранее в соответствие с выражением

и храниться в запоминающем устройстве.

Значения долей энергии отсчетов речевого сигнала Рi в данном случае могут быть вычислены путем инвертирования квадрата амплитуд A(k1,k2) и умножения на коэффициент автокорреляции AKF(0):

где энергия каждого частотного интервала определяется с использованием констант k1 и k 2, которые определяют его границы.

Очевидно, что расчет энергии частотного спектра по формулам (7), (9) требует выполнения примерно 3(N+Р) операций умножения и сложения, что существенно меньше, чем для вычисления ДПФ. Кроме того, не требуется осуществлять дискретизацию с шагом t и квантование сигналов с выхода микрофона (получение отсчетов) с помощью аналого-цифрового преобразователя. Точность обоих методов оценивания энергии спектра сигнала (непараметрического на основе преобразования Фурье и параметрического на основе авторегрессионной модели) позволяют сравнить графики, представленные на фиг.4.

Для достижения технического результата из известного обнаружителя пауз в речевых сигналах, содержащего пороговый обнаружитель, схему вычисления порога и алгоритмический модуль, в состав которого входит аналого-цифровой преобразователь, устройство записи, запоминающее устройство, считывающее устройство, устройство вычисления энергии спектра, устройство определения среднего значения энергии отсчетов сигнала в паузе, устройство вычисления отношений Р i к Piпауза ср, устройство определения mах(Pi/Piпауза ср ), устройство кодирования, устройство синхронизации, удален аналого-цифровой преобразователь, причем

вход 1 алгоритмического модуля подключен к липредеру;

выход 2 алгоритмического модуля подключен ко входу порогового обнаружителя;

выход 2 алгоритмического модуля подключен ко входу схемы вычисления порога;

выход схемы вычисления порога подключен ко входу 3 порогового обнаружителя;

выход порогового обнаружителя подключен ко входу 4 алгоритмического модуля.

Схема, иллюстрирующая реализацию обнаружителя активности речи согласно полезной модели, представлена на фиг.5. Обнаружитель выполняет следующие действия:

1. Записывает в запоминающее устройство коэффициенты линейного предсказания а(m) и значения коэффициента автокорреляции AKF(0), характеризующие шумовой сигнал (сигнал в паузе речевого сигнала) с выхода липредера в режиме молчания диктора;

2. Разделяет поток коэффициентов линейного предсказания на участки по Р коэффициентов, соответствующие отрезкам шумового сигнала длиной R;

3. Разделяет частотный спектр каждого из таких участков на ряд интервалов (i=1,...,N);

4. Вычисляет точные значения долей энергии отрезков шумового сигнала Рiпауза соответствующих каждому из частотных интервалов, по формуле

где коэффициент автокорреляции AKF(0) считывается из запоминающего устройства, а амплитуда A(k1 ,k2} определяется по формуле (7);

5. Определяет среднее значение долей энергии отрезков шумового сигнала Piпауза ср в каждом частотном интервале для всего шумового сигнала;

6. Записывает в запоминающее устройство вычисленные значения энергии отсчетов шумового сигнала Piпауза ср;

7. Разделяет поток коэффициентов линейного предсказания на участки такой же длины, как и при анализе потока коэффициентов линейного предсказания шумового сигнала;

8. Вычисляет для каждого участка в каждом из N частотных интервалов значения долей энергии отсчетов речевого сигнала Р i по формуле (9);

9. Вычисляет отношения Р i к Piпауза ср в каждом из N частотных интервалов всех выбранных участков и определяет из них максимальное значение max(Pi/Piпауза сp);

10. Передает максимальное значение max(P i/Piпауза сp) на вход порогового обнаружителя;

11. Определяет значение порога h в схеме вычисления порога с учетом значения М;

12. Сравнивает в пороговом обнаружителе максимальное значение max(P i/Piпауза сp) со значением порога h;

13. Принимает решение о наличии паузы при значении max(P i/Piпауза сp) меньшим или равным порогу h, обновляет значение Piпауза ср с учетом текущего значения Piпауза;

14. Производит кодирование пауз, при этом код каждой паузы содержит информацию только о моменте начала и продолжительности паузы.

Направленная на устранение недостатков устройства обнаружения пауз в речевых сигналах, описанного в прототипе, характеризующегося высокой вычислительной сложностью за счет применения непараметрического оценивания энергии спектра сигнала, настоящая полезная модель уменьшает вычислительную сложность путем вычисления энергии спектра сигнала на основе авторегресионной модели с использованием коэффициентов линейного предсказания. Кроме того, полезная модель не содержит аналого-цифровой преобразователь, что дополнительно снижает вычислительную сложность и упрощает ее реализацию.

Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественных всем признакам заявленного технического решения, отсутствуют, что указывает на соответствие заявленного устройства условию патентоспособности «новизна».

Заявленное устройство поясняется чертежами:

фиг.1 - схема устройства-прототипа;

фиг.2 - схема, иллюстрирующая использование обнаружителя активности речи в системе сжатия на основе липредера;

фиг.3 - схема, иллюстрирующая использование обнаружителя активности речи в системе прерывистой передачи речи;

фиг.4а - спектр звука «а», полученный непараметрическим методом на основе ДПФ и параметрическим методов на основе модели авторегрессии;

фиг.4б - спектр звука «и», полученный непараметрическим методом на основе ДПФ и параметрическим методов на основе модели авторегрессии;

фиг.4в - спектр звука «ч», полученный непараметрическим методом на основе ДПФ и параметрическим методов на основе модели авторегрессии;

фиг.4г - спектр сигнала в паузе, полученный непараметрическим методом на основе ДПФ и параметрическим методов на основе модели авторегрессии;

фиг.5 - схема, иллюстрирующая реализацию обнаружителя активности речи согласно полезной модели.

Как показано на фиг.5, предлагаемый настоящей полезной моделью обнаружитель активности речи содержит схему вычисления порога 501, пороговый обнаружитель 502 и алгоритмический модуль 503, в состав которого входит записывающее устройство 504, запоминающее устройство 505, считывающее устройство 506, устройство 507 вычисления энергии спектра, устройство 508 определения среднего значения энергии отсчетов сигнала в паузе, устройство 509 вычисления отношений Рi к Piпауза cp, устройство 510 определения mах(Рiiпауза cp ), устройство кодирования 511, устройство синхронизации 512.

Схема вычисления порога 501, устройство 507 вычисления энергии спектра, устройство 508 определения среднего значения энергии отсчетов сигнала в паузе, устройство 509 вычисления отношений Рi к Piпауза cp, устройство 510 определения mаx(Pi/P iпауза cp) представляют собой устройства сходящихся вычислений. Схемы устройств сходящихся вычислений известны и описаны, например, в книге Э. Айфичера, Б. Джервиса «Цифровая обработка сигналов: практический подход» (М.: Издательский дом «Вильямc», 2004. с.850, рис.12.40). В частности, такая схема может быть реализована на комплексных умножителях PDSP16112А (Mitel) и комплексных накопителях PDSP16318A (Mitel).

Пороговый обнаружитель 502 представляет собой компаратор. Схемы компараторов известны и описаны, например, в книге книге Богданова Н.Г., Иванова Б.Р. Основы радиотехники и электроники. Часть 12. Курс лекций по схемотехнике. (Орел: Академия ФАПСИ, 2000. с.158, рис.8.16). В частности, такая схема может быть реализована на микросхемах К567 серии.

Записывающее устройство 504 представляет собой мультиплексор, а считывающее устройство 506 - демультиплексор. Схемы мультиплексоров и демультиплексоров известны и описаны, например, в книге О.Н.Лебедева, A.M.Сидорова «Импульсные и цифровые устройства. Цифровые узлы и их проектирование на микросхемах» (ВАС, 1980, с.55, рис.2.36). В частности, мультиплексоры и демультиплексоры могут реализованы на микросхемах К155 серии.

Запоминающее устройство 505 содержит, по меньшей мере, два независимых блока оперативной памяти и используется для сохранения коэффициентов линейного предсказания, а также промежуточных результатов вычисления энергии частотного спектра, значений долей энергии отсчетов шумового сигнала, среднего значения долей энергии отсчетов, а также один блок постоянной памяти для хранения коэффициентов C(k1,k2,m), рассчитанных по формуле (8). Запоминающее устройство может состоять из матрицы ОЗУ и ПЗУ. Схемы ОЗУ известны и описаны, например, в книге В.Н.Вениаминова, О.Н.Лебедева, А.И.Мирошниченко «Микросхемы и их применение» (М.: Радио и связь, 1989, с.146, рис.5.2). В частности, ОЗУ

может быть реализовано на микросхемах К565 серии. Схема ПЗУ известна и описана в той же книге на с.156, рис.5.8. В частности, ПЗУ может быть реализовано на микросхемах К555 серии.

Устройство кодирования 511 предназначено для представления значений момента начала паузы и ее продолжительности в виде двоичной последовательности и может быть реализовано в виде шифратора. Схемы шифраторов известны и описаны, например, в книге Богданова Н.Г., Иванова Б.Р. Основы радиотехники и электроники. Часть 12. Курс лекций по схемотехнике. (Орел: Академия ФАПСИ, 2000. с.155, рис.8.13).

Устройство синхронизации 512 выводит восемь синхронизирующих сигналов, подаваемых на записывающее устройство 504, считывающее устройство 506, устройство 507 вычисления энергии спектра, устройство 508 определения среднего значения долей энергии отсчетов, устройство кодирования 511, запоминающее устройство 505, устройство 510 определения max(P i/Piпауза cp) и устройство 509 вычисления отношений Рi к Рiпауза cp соответственно, и предназначено для формирования сигналов синхронизации и управления указанными блоками и устройствами алгоритмического модуля. Устройство синхронизации представляет собой распределитель. Схемы распределителей известны и описаны, например, в книге И.Н.Букреева «Микроэлектронные схемы цифровых устройств» (М.: «Сов. радио», 1975, с.264, рис.6.2). В частности, управляющий блок может быть реализован на микросхемах К561 серии.

Устройство, изображенное на фиг.5, работает следующим образом. Устройство синхронизации 512 посылает в записывающее устройство 504 управляющий сигнал 15. Посредством управления этим сигналом в течение процедуры ввода 1 выполняется запись с выхода липредера коэффициентов линейного предсказания а(m) и значений коэффициентов автокорреляции, характеризующих шумовой сигнал (сигнал в паузе речевого сигнала), в соответствующий блок ОЗУ запоминающего устройства 505. Затем под управлением синхронизирующих сигналов 16 и 17 из запоминающего устройства 505 при помощи считывающего устройства 506 считываются Р коэффициентов линейного предсказания и один коэффициент автокорреляции AKF(0) для отрезка шумового сигнала длиной R в устройство вычисления энергии спектра 507.

Затем на основе синхронизирующего сигнала 20 путем процедуры 10 из ПЗУ запоминающего устройства 505 в устройство вычисления энергии спектра 507 считываются хранимые коэффициенты C(k1,k2,m). В устройстве вычисления энергии спектра 507 на основе синхронизирующего сигнала 17 вычисляются точные значения Рiпауза долей энергии отрезка шумового сигнала по формуле (10) в каждом из частотных интервалов (i=1,...,N),

на которые разделяется частотный диапазон каждого из участков сигнала в паузе длиной R. Вычисленные значения долей энергии отсчетов шумового сигнала путем процедуры 9 сохраняются в запоминающем устройстве 505.

Далее на основе синхронизирующих сигналов 16, 17 и 20 повторяются процедуры 7, 8, 9 и 10 по вычислению точных значений долей энергии всех отрезков шумового сигнала длиной R. Вычисленные значения сохраняются в ОЗУ запоминающего устройства 505, откуда посредством процедуры 11 передаются в устройство 508 определения среднего значения долей энергии отсчетов шумового сигнала.

Под управлением синхронизирующего сигнала 18 в устройстве 508 определения среднего значения долей энергии отсчетов шумового сигнала вычисляются средние значения Рiпауза cp в каждом частотном интервале для всего шумового сигнала, данные значения путем процедуры 12 записываются в запоминающее устройство 505.

При наличии на входе липредера речи (см. фиг.2, 3) с его выхода посредством управления синхронизирующим сигналом 15 в течение процедуры ввода 1 выполняется запись коэффициентов линейного предсказания а(m) и значений коэффициентов автокорреляции, характеризующих речевой сигнал, в соответствующий блок ОЗУ запоминающего устройства 505. Затем под управлением синхронизирующих сигналов 16 и 17 из запоминающего устройства 505 при помощи считывающего устройства 506 считываются Р коэффициентов линейного предсказания и один коэффициент автокорреляции AKF(0) для отрезка речевого сигнала длиной R в устройство вычисления энергии спектра 507.

Затем на основе синхронизирующего сигнала 20 путем процедуры 10 из ПЗУ запоминающего устройства 505 в устройство вычисления энергии спектра 507 считываются хранимые коэффициенты C(k1,k2,m). В устройстве вычисления энергии спектра 507 на основе синхронизирующего сигнала 17 вычисляются точные значения долей энергии отрезка речевого сигнала длиной R. по формуле (9) в каждом из частотных интервалов (i=1,...,N). Вычисленные значения долей энергии отсчетов речевого сигнала путем процедуры 9 сохраняются в запоминающем устройстве 505.

Далее под управлением синхронизирующих сигналов 20 и 22 хранимые в запоминающем устройстве 505 средние значения Piпауза cp в каждом частотном интервале для шумового сигнала и значения долей энергии отсчетов речевого сигнала считываются в устройство 509 вычисления отношения Pi к P iпауза cp. Вычисленные в каждом частотном интервале (i=1,...,N) отношения Рi к Piпауза cp под управлением сигнала 22 путем процедуры 14 передаются в устройство определения max(Pi/P iпауза cp). Максимальное отношение Рi к

Piпауза cp на основе синхронизирующего сигнала 21 с выхода 5 алгоритмического модуля 503 поступает на вход 5 порогового обнаружителя 502, на вход 3 которого поступает сигнал о значении порога h, полученного в схеме вычисления порога 501. Значение порога h вычисляется с учетом вычисленного значения М, поступающего с выхода алгоритмического модуля 503 под управлением синхронизирующего сигнала 17.

Пороговый обнаружитель 502 путем сравнения принятых значений max(Pi /Piпауза cp) и порога h принимает решение о наличии паузы в речевом сигнале, которое передает на вход 4 алгоритмического модуля 503.

Далее на основе синхронизирующего сигнала 19 принятое решение о наличии паузы кодируется в устройстве кодирования 511. Код каждой паузы содержит информацию о моменте начала и продолжительности паузы.

После этого на основе синхронизирующего сигнала 20 путем переадресации в ОЗУ запоминающего устройства 505 значения Piпауза cp в каждом частотном интервале (i=1,...,N) обновляются с учетом текущих значений Рiпауза долей энергии шумового сигнала.

Полезная модель применима к различным случаям сжатия речевого сигнала, включая его прием и передачу в системах связи.

Обнаружитель активности речи, содержащий пороговый обнаружитель, схему вычисления порога и алгоритмический модуль, при этом первый вход алгоритмического модуля подключен к выходу микрофона, первый выход алгоритмического модуля подключен к первому входу порогового обнаружителя, второй выход алгоритмического модуля подключен ко входу схемы вычисления порога, выход схемы вычисления порога подключен ко второму входу порогового обнаружителя, выход порогового обнаружителя подключен ко второму входу алгоритмического модуля, а алгоритмический модуль содержит аналого-цифровой преобразователь, связанный с устройством вычисления отношений Р i к Piпауза cp как через последовательно соединенные запоминающее устройство и устройство вычисления энергии спектра, в котором вычисляют значения долей энергии отсчетов сигнала в паузе Piпауза и сигнала речи Рi, в каждом из N частотных интервалов, так и через присоединенное к устройству вычисления энергии спектра устройство определения среднего значения долей энергии отсчетов сигнала в паузе Рiпауза cp, в каждом из N частотных интервалов и запоминающее устройство, а устройство вычисления отношений Рi к Р iпауза cp соединено с устройством определения значения max(Pi/Piпауза cp ), выход которого соединен с первым входом порогового обнаружителя, кроме того, в состав алгоритмического модуля входит записывающее устройство, соединенное с запоминающим устройством, а также связанное с запоминающим устройством считывающее устройство, которое соединено с устройством вычисления отношений Рi к Рiпауза cp и устройством определения значения max(Pi/Piпауза cp ), отличающийся тем, что первый вход алгоритмического модуля подключен к липредеру, при этом из алгоритмического модуля исключен аналого-цифровой преобразователь, а данные из липредера через последовательно соединенные записывающее устройство, запоминающее устройство и считывающее устройство поступают в устройство вычисления энергии спектра, которое связано с устройством определения среднего значения долей энергии отсчетов сигнала в паузе P iпауза cp через запоминающее устройство.



 

Похожие патенты:

Дистанционный обнаружитель течи внутренних и наружных водопроводных сетей и водопроводов относится к средствам диагностики водопроводных сетей и предназначен для обнаружения начала разрушения больших магистральных водоводов и последующего их ремонта.

Изобретение относится к способам измерения концентраций газов в газовых средах методом абсорбционной спектроскопии, в частности, к способам измерения газовых примесей в атмосфере и контроля загрязнения окружающей среды

Изобретение относится к пьезоэлектрическим устройствам и может быть использовано для преобразования энергии ветра, волнения моря, течения воды, мускульной силы человека в электрическую энергию для обеспечения главным образом маломощных потребителей энергии
Наверх