Способ идентификации факта речевой активности оператора
Изобретение относится к диагностике психофизиологического состояния человека по речевому сигналу в процессе его профессиональной деятельности и может быть использовано при реализации контроля состояния водителя транспортного средства. Согласно данному способу регистрируют звуковое давление посредством двух разнесенных микрофонов, среднюю скорость воздушного потока - непосредственно перед ртом говорящего. Параметры движения видимой части рта определяют как мгновенное значение эффективной площади его раскрытия, а факт речевой активности устанавливают по критерию, использующему комбинацию упомянутых параметров, при этом пороговые значения для критерия подбирают экспериментально. Данный способ обеспечивает повышение надежности идентификации факта речевой активности оператора в условиях сильного зашумления и снижение требований к точности позиционирования датчиков дополнительной физиологической информации, а также микрофонов. 2 з.п. ф-лы, 2 ил.
Изобретение относится к способам диагностики психофизиологического состояния человека по речевому сигналу в процессе профессиональной деятельности и может быть использовано, в частности, в системах автоматического контроля состояния операторов различных профессий, преимущественно водителей транспортных средств.
Известно, что контроль функционального состояния оператора по речевому сигналу может быть эффективно использован для поддержания работоспособности, например, в условиях монотонии, когда оператор теряет бдительность (см. патент, RU 2111134 С1, НЕЙРОКОМ, В 60 К 28/06, 1998). Способ предусматривает ведение речевого диалога с последующим анализом адекватности реакции водителя (например, ответа в речевой форме) на смысловое содержание вопроса, для чего используется система распознавания речи, которая может быть реализована различными известными методами. Известно также, что качество распознавания предъявляемого речевого сигнала определяется методами и средствами его приема и фиксации, приобретающими особое значение в реальных условиях работы оператора, особенно водителей транспортных средств, причем в этом случае стараются снизить общий уровень фона. Для этой цели известно использование нескольких микрофонов с совместной обработкой зарегистрированных каждым из них сигналов (патент, US 5539859, Robbe et al., G 10 L 9/00, 395/2.42,1996). При этом для эффективного распознавания и очистки от шума необходимо выявить только тот акустический сигнал, который и представляет собой речь данного оператора. Для такой цели известно использование дополнительных каналов физиологической информации, например, фиксирующих одновременно с речевым сигналом движение опорных точек на лице оператора с определением набора нормализованных векторов расстояний, описывающих мимику говорящего, с последующим их учетом (патент, US 5586215, Stork et al., G 10 L 5/06, 395/2.41, 1996) или других физиологических параметров, характеризующих эмоциональное состояние данного оператора (патент, ЕР 0660303 Al, AT&T Corp. , G 10 L 9/16, 1995). Вместе с тем, в указанных источниках не содержится информации о возможности распознавания речи в условиях особо высокой защумленности, например в кабине локомотива. Наиболее близким аналогом патентуемого способа является способ идентификации факта речевой активности оператора, включающий одновременную регистрацию звукового давления посредством установленного у рта говорящего первого микрофона, и параметров движения видимой части рта, сопоставление зарегистрированных параметров с пороговыми значениями и последующее выделение начала и конца речевого фрагмента, подлежащего распознаванию (патент, US 5473726, Marshall, G 10 L 5/06, 395/2.4, 1995). Способ может быть реализован посредством устройства, включающего микрофон и фотодатчик, подключенные к ЭВМ. Однако вышеупомянутое изобретение не позволяет достаточно надежно идентифицировать факт речевой активности оператора в условиях сильного зашумления и вибрации, свойственным условиям работы ответственных профессий, например экипажей локомотивных бригад на железнодорожном транспорте. Технический результат изобретения состоит в повышении надежности идентификации факта речевой активности оператора в условиях сильного зашумления и снижении требований к точности позиционирования датчиков дополнительной физиологической информации, а также микрофонов. Поставленная цель достигается тем, что способ идентификации факта речевой активности оператора включает одновременную регистрацию звукового давления P1(t) посредством установленного у рта говорящего первого микрофона, и параметров перемещения элементов видимой части рта, сопоставление зарегистрированных параметров с пороговыми значениями и последующее выделение начала и конца речевого фрагмента, подлежащего распознаванию. Дополнительно регистрируют среднюю скорость V(t) воздушного потока непосредственно перед ртом говорящего, а также среднее значение звукового давления P2(t) посредством второго микрофона, удаленного от первого. При этом в качестве параметров движения видимой части рта определяют мгновенное значение эффективной площади Sэфф(t) его раскрытия, а факт речевой активности устанавливают при одновременном выполнении следующих условий: |P1(t)-P2(t)| > Eп1ор; |P1(t)|-|P2(t)| > Eп2ор; |Sэфф(t)| > Eп3ор;
Формула изобретения
1. Способ идентификации факта речевой активности оператора, включающий одновременную регистрацию звукового давления P1(t) посредством установленного у рта говорящего первого микрофона и параметров перемещения элементов видимой части рта, сопоставление зарегистрированных параметров с пороговыми значениями и последующее выделение начала и конца речевого фрагмента, подлежащего распознаванию, отличающийся тем, что дополнительно регистрируют среднюю скорость V(t) воздушного потока непосредственно перед ртом говорящего, а также среднее значение звукового давления P2(t) посредством второго микрофона, удаленного от первого, при этом в качестве параметров движения видимой части рта определяют мгновенное значение эффективной площади Sэфф(t) его раскрытия, а факт речевой активности устанавливают при одновременном выполнении следующих условий:




где P1(t), P2(t) - средние значения звукового давления;
E1пор, E2пор, E3пор, E4пор, E5пор - пороговые значения, установленные экспериментально. 2. Способ по п. 1, отличающийся тем, что средние значения звукового давления P1(t), P2(t) определяют путем усреднения соответствующих величин мгновенного звукового давления во временном интервале длительностью 10-100 мс. 3. Способ по п. 1 или 2, отличающийся тем, что среднюю скорость V(t) воздушного потока непосредственно перед ртом говорящего определяют путем усреднения величины мгновенной скорости воздушного потока во временном интервале длительностью 10-100 мс.
РИСУНКИ
Рисунок 1, Рисунок 2