Способ определения информативности спектральных составляющих акустического сигнала пчелиных семей при распознавании их состояний
Изобретение может найти применение в практической работе на индивидуальных и коллективных пасеках. Способ предусматривает для каждой узкой полосы частот (25-30 Гц) помимо нормированного значения интенсивности определение стабильности, зависящей от вариации значений интенсивности для разных реализаций сигнала. Далее для каждой пары диагностируемых состояний определяют коэффициенты информативности по каждой выделенной полосе частот. Выделяют минимальную совокупность спектральных составляющих акустического сигнала пчелиных семей. Подсчитывают суммарную информативность для каждой выделенной узкой полосы частот по всем парам диагностируемых состояний, выбирают полосу частот с максимальной суммарной информативностью и выделяют те пары состояний, которые плохо разделяются данным информативным признаком. Для этих пар состояний подсчитывают суммарную информативность по всем оставшимся полосам частот. Следующей выбирается полоса, которая имеет максимальную суммарную информативность для данных пар классов. Далее отбор продолжается таким же образом, пока все пары классов не будут характеризоваться достаточными значениями коэффициентов информативности хотя бы для одной из отобранных узких полос частот. Способ позволяет упростить и оптимизировать аппаратурную реализацию средств распознавания и сократить время анализа. 2 з.п. ф-лы, 7 табл.
Изобретение относится к области пчеловодства и может найти применение в практической работе на индивидуальных и коллективных пасеках.
Известен способ распознавания состояний пчелиной семьи по издаваемому ею акустическому шуму путем его спектрального анализа и измерения амплитуд отдельных спектральных составляющих [1, 2]. Его недостатками являются: отсутствие четких количественных критериев распознавания конкретных состояний пчелиных семей и определенного алгоритма классификации (указываются лишь качественные отличия амплитудных спектров при различных состояниях); большое число информативных признаков, по которым должно вестись распознавание различных состояний (этими признаками являются средние значения сигнала в узких частотных полосах шириной 25-30 Гц, причем всего таких частотных полос - 20-25 и они перекрывают диапазон частот от 60 до 600 Гц). Эти недостатки затрудняют распознавание конкретных состояний пчелиных семей, увеличивают время анализа, не обеспечивают возможности количественной оценки достоверности распознавания и усложняют аппаратную (или программную) реализацию средств распознавания. Технической задачей, на решение которой направлено предлагаемое изобретение, является сокращение числа информативных признаков (анализируемых узких полос частот) путем использования количественных критериев информативности этих признаков и отбора наиболее информативных, что позволит построить оптимальный классификатор (решающие правила), а также существенно упростить аппаратную (или программную) реализацию средств распознавания и сократить время анализа. Решение указанной задачи проводится в три этапа. На первом этапе определяются коэффициенты информативности каждого информативного признака для распознавания конкретных состояний пчелиной семьи. Исходными данными для решения этой задачи являются перечень распознаваемых состояний (Sj, где j = 0, 1, 2, . , N, причем S0 - нормальное состояние) и снятые для них амплитудные или энергетические спектры акустических сигналов, представляемые средневыпрямленными значениями сигнала в узких полосах частот (шириной 25-30 Гц), перекрывающие диапазон от 60 до 600 Гц. Для каждого состояния желательно иметь не менее m = 10 реализаций сигнала (и, соответственно, их спектров), чтобы можно было оценить стабильность спектральных составляющих. Тогда усредненные по этим реализациям значения спектральных составляющих будем называть интенсивностями спектральных составляющих Iij, где i = 1, 2,.., n- порядковые номера спектральных полос, j = 0, 1, 2,.., N - распознаваемые состояния пчелиной семьи




Чтобы устранить влияние коэффициента передачи приемного тракта (микрофона и усилителя) на измеренные значения спектральных составляющих сигнала, производится их нормирование относительно среднеквадратического значения всего сигнала в анализируемой полосе частот (60 - 600 Гц). Проще всего нормирование осуществлять аппаратно, введя в приемный тракт АРУ (автоматическую регулировку усиления), управляющий сигнал для которой получают с выхода детектора среднеквадратического значения, на вход которого поступает выходной сигнал усилителя с полосой пропускания от 60 до 600 Гц. В этом случае выделенные с помощью узкополосных фильтров или расчетным путем (с помощью дискретного преобразования Фурье) спектральные составляющие сигнала будут пронормированы относительно среднеквадратического значения сигнала для всей анализируемой полосы частот (60 - 600 Гц). Если используется численный метод спектрального анализа, то предпочтительней использовать не амплитудные, а энергетические спектры сигнала, поскольку они более устойчивы и могут быть определены по более коротким реализациям сигнала. Таким образом, исходные данные представлены двумя матрицами, размерностью n

Jijk =|Iij-Iik|





где j, k = 0, 1, 2,..., N, причем j


где R - число сочетаний из (N+1) по два. Таким образом, коэффициенты информативности Jjki составляют матрицу размерностью n


Это позволяет ранжировать спектральные полосы по их информативности для распознавания данных состояний. Однако суммарные коэффициенты информативности характеризуют усредненную информативность данной узкой полосы частот по всем парам состояний. При этом одни пары состояний могут разделяться очень хорошо (разница между интенсивностями сигнала в данной полосе частот большая), а другие - плохо (разница между интенсивностями сигнала при соответствующих состояниях мала и находится в пределах их вариаций для различных реализаций сигналов при тех же самых состояниях). Поэтому для таких плохо различаемых пар состояний надо искать другие узкие полосы частот, для которых именно эти пары состояний хорошо различаются, т.е. имеют достаточно большие значения коэффициентов информативности (хотя суммарный коэффициент информативности по всем парам классов может быть существенно ниже). Очевидно, что чем больше будет использовано информативных признаков для распознавания (узких полос частот), тем, в принципе, надежней может быть произведено распознавание заданного множества состояний, но тем сложнее окажутся решающие правила, используемые для распознавания, а следовательно, и реализующее их распознающее устройство. Поэтому возникает задача отбора минимально необходимого количества информативных признаков (узких полос частот) для надежного распознавания заданного множества состояний. Именно эта задача и решается на втором этапе. Ее предлагается решать следующим образом. На первом шаге выбирается узкая полоса частот, обеспечивающая максимальную суммарную информативность по всем парам классов -Ji


где R- число всех пар состояний. Все коэффициенты информативностей для выбранной на первом шаге узкой полосы частот сравниваются с этим критическим значением и все строки матрицы коэффициентов информативностей, для которых Jjk(1)


где J(


Центры областей d - мерного пространства, соответствующих заданным (N+1) состояниям будут определяться уравнениями

Здесь: у0, y1,..., yi,... yN - выходные величины решающего устройства, соответствующие каждому из заданного множества состояний; аij - постоянные коэффициенты уравнений, которые и требуется определить. Фактически каждое из этих уравнений преобразует d - мерное пространство информативных признаков в одномерное пространство результативного признака уi. Теперь, чтобы полностью определить решающие правила, необходимо, во-первых, определить неизвестные коэффициенты ij, а во-вторых, задать верхние и нижние границы каждого результативного признака yi, соответствующие границам распознаваемых состояний. Постоянные коэффициенты аij должны определять удельный вклад каждого информативного признака (а ими являются измеренные значения Ii) в соответствующий результативный признак. Логично принять этот вклад пропорциональным сумме различительных способностей этого признака (способности отличать данное состояние от всех остальных заданных состояний). А они определяются соответствующими коэффициентами информативности Jiki. Следовательно, целесообразно определять весовые коэффициенты aij в виде
aij = Jijk


где

hi - нормирующий множитель;
Jiki - коэффициенты информативности. Это эквивалентно общепринятому методу определения неизвестных коэффициентов в уравнениях регрессии в метрических задачах (где объект характеризуется не различными качественными состояниями, а различными значениями выходного количественного признака). Действительно, в таких задачах коэффициенты линейного уравнения регрессии (весовые коэффициенты уравнения, связывающего результативную выходную величину с информативными признаками) находят из условия их пропорциональности частным производным выходной величины по соответствующему информативному признаку. Естественно, что в зависимости от знака приращения информативного признака

Jjki = (Iij -Iik)


Оно отличается от (5) лишь тем, что разность (Iij-Iik) берется с учетом ее знака. В этом случае, очевидно, и bij, находимые по (13), а следовательно, и aij, находимые по (12), могут иметь различные знаки. Если на допустимые значения результативных признаков не накладывается никаких ограничений (что имеет место при цифровом способе реализации распознающего устройства), то нормирующий множитель hi можно принимать равным единице. Если же на предельно допустимые значения результативного признака накладываются ограничения (что имеет место при аналоговом способе реализации распознающего устройства), то нормирующий множитель hi подбирается из условия, чтобы yjmax соответствовал (0,7 - 0,9)yjдоп. Ограничение нормирующего множителя снизу обусловлено тем, что в аналоговых устройствах при малых уровнях сигналов возрастают погрешности. Теперь остается лишь определить границы каждого состояния по соответствующим результативным признакам уjгр. Наиболее корректным решением данной задачи в условиях, когда заданное первоначально множество состояний (N+1) далеко не исчерпывает всего множества возможных состояний пчелиной семьи, является ограничение каждого состояния двусторонними границами с центрами, определяемыми в соответствии с уравнениями (11) и шириной интервалов, зависящей от дисперсии значений интенсивностей сигналов в используемых узких полосах частот при данных состояниях для различных реализаций сигналов. Учитывая, что при нормальном законе распределения значений информативных признаков в интервал шириной



где Dij - дисперсии интенсивностей в i-м узком диапазоне частот при j-м состоянии, определяемая по m реализациям сигнала в соответствии с (2). Очевидно, что определяемые таким образом границы отдельных состояний будут располагаться симметрично относительно их центров, заданных уравнениями (11). Поэтому более удобно определить интервалы


и, откладывая их по обе стороны от центров состояний yj, определять границы каждого состояния. При нахождении интервалов


1. Если лишь для одного из уравнений системы (11) вычисленное значение yj попадает в разрешенный интервал между верхним и нижним граничными значениями, то данная реализация сигнала соответствует именно данному j-му состоянию. 2. Если ни для одного из уравнений значение yj не попадает между границами данного состояния, то это будет свидетельствовать о том, что данная реализация сигнала соответствует состоянию, не включенному в заданное множество N. Такая ситуация вполне вероятна, поскольку реальные состояния пчелиной семьи зависят от множества факторов, которые могут накладываться друг на друга, что может приводить к практически неограниченному множеству возможных состояний, из которого мы первоначально выбираем лишь некоторые, наиболее интересующие пчеловодов состояния. 3. И, наконец, в принципе возможен и третий исход, когда одновременно опознаются более чем одно состояние. Это будет свидетельствовать о том, что границы областей, соответствующих заданным состояниям в d-мерном пространстве пересекаются, что может произойти, если разделимость данных пар состояний, определяемых соответствующими парными коэффициентами информативности, недостаточна. В этом случае необходимо увеличить мерность пространства информативных признаков, т.е. добавить еще одну узкую полосу частот, что требует полной перестройки всей системы распознавания. Чтобы этого избежать, можно попытаться сузить границы соответствующих пересекающихся состояний, т. е. в соответствующих уравнениях из системы уравнений (15) принять допустимые границы вариаций интенсивности не


Проиллюстрируем все изложенное конкретным примером. Зададим следующее множество распознаваемых состояний пчелиной семьи:
S0 - нормальное;
S1 - потеря матки;
S2 - принятие новой матки;
S3 - отвергание новой матки;
S4 - предроевое состояние;
S5 - перегрев улья. Для каждого из данных состояний было снято по m = 12 реализаций акустических сигналов и получены их амплитудные спектры, представленные нормированными значениями интенсивностей сигнала в узких частотных полосах шириной 30 Гц, равномерно распределенных в диапазоне от 60 до 570 Гц (всего n = 17 частотных полос, т. е. i = 1,2,...,17). Нормирование спектральных составляющих проводилось аппаратно, с помощью АРУ, встроенной в предварительный усилитель. По этим нормированным значениям, определенным для каждой t-ой реализации сигнала, в соответствии с (1) находились усредненные по всем реализациям интенсивности спектральных составляющих для j-ого состояния

Они образуют матрицу размерностью n(N+1), т.е. 17


А затем по (3) определялись коэффициенты вариации

и по (4) стабильности этих спектральных составляющих:
Cij= l-

Имея усредненные по всем m реализациям сигналов значения интенсивностей lij и стабильностей Cij спектральных составляющих для каждой i-ой полосы частот и каждого j-ого состояния, по формуле (5) вычисляем коэффициенты информативности каждой из этих спектральных полос для различения любой j-ой пары состояний - Jjk. В итоге получаем матрицу коэффициентов информативности размерностью n




Затем из табл.2 вычеркиваем те строки, в которых выбранный информативный признак дает значения коэффициента информативности Jjk > Jjk(кp) = 17,6. В нашем случае будут вычеркнуты строки 2 (J02 = 23,4), 3 (J03 = 33,8), 4 (J04 = 23,7), 6 (J12= 23,4), 10 (J23 = 33,7), 11 (J24 = 32,3) и 12 (J25 = 36,7). По оставшимся строкам для всех признаков, кроме уже отобранного, вновь подсчитываются суммарные коэффициенты информативности и следующим отбирается признак, имеющий максимальное значение этого коэффициента. Для нашего случая это будет спектральная составляющая, соответствующая полосе 420-450 Гц (J










Найденные значения bij представлены в табл. 4. Эти значения могут непосредственно использоваться в качестве весовых коэффициентов аij в цифровых распознающих системах (поскольку для них можно значения всех нормирующих множителей hj принять равным единице). Для аналоговых распознающих систем этого сделать нельзя, т.к. напряжения на выходах сумматоров не должны превышать предельно допустимых значений. Кроме того, в аналоговых распознающих системах целесообразно, по возможности, провести упрощение структуры, т.е. на сумматоры, выделяющие определенные состояния заводить не все 4 сигнала (с узкополосных каналов), а лишь наиболее информативные из них (именно для выделения данного состояния), что несложно определить по соответствующим коэффициентам информативности. В частности, на сумматор, выделяющий нулевое состояние, целесообразно завести сигналы с 1-го и 3-го частотных каналов, а со 2-го и 4-го не заводить. Действительно, по первому каналу хорошо разделяются состояния 0-2; 0-3 и 0-4 (соответствующие значения коэффициентов информативности равны 23,4; 33,8 и 23,7). Для разделения же пар состояний 0-1 и 0-5 достаточно использовать 3-й канал (соответствующие коэффициенты информативности равны 16,4 и 26,6). Для выделения первого состояния вообще достаточно только одного 3-го канала, т.к. по данному каналу все коэффициенты информативности достаточно велики (J10 = 16,4, J12 = 24,9, J13 = 21,5, J14 = 37,5, J15= 47,3). Для выделения второго состояния также достаточно завести сигнал лишь с одного 1-го канала (J20 = 23,4, J21 = 23,4, J23 = 33,7, J24 = 32,3, J25 = 36,7). Для выделения третьего состояния тоже достаточно сигнала с одного 2-го канала (J30 = 22,2, J31 = 29,9, J32 = 21,7, J34 = 45,2, J35 = 72,7). Для выделения 4-го и 5-го состояний необходимы сигналы со всех 4-х частотных каналов. С учетом указанных упрощений распознающего устройства значения коэффициентов bij изменятся. Для упрощенной структуры эти значения приведены в табл. 5. Теперь можно приступить к определению необходимых значений нормирующих множителей hj. Для получения числового решения зададимся значениями напряжений на выходах узкополосных каналов, равными нормированным усредненным значениям соответствующих интенсивностей, умноженным на 0,1 В. В результате получим следующую матрицу сигналов на выходах узкополосных каналов при всех диагностируемых состояниях пчелиной семьи (в вольтах).

Для нахождения масштабных коэффициентов hj используем условие, чтобы при любом из диагностируемых состояний максимальный выходной сигнал любого сумматора не превышал 0,8 Uдоп (0,8 Uдоп взято с учетом возможности превышения отдельных реализаций сигнала над усредненными значениями, приведенными в матрице (17)). В общем случае это условие можно записать
U(k


Здесь U(k




Аналогично определяем остальные нормирующие множители:





Теперь можно определить весовые коэффициенты аij = bijhj Их значения представлены матрицей (19):

Коэффициенты aij представляют собой коэффициенты передачи сумматоров по каждой из суммирующих цепей. При подаче на входы сумматоров напряжений, представленных матрицей (17), на выходах сумматоров будут сформированы напряжения, представленные табл. 7. Теперь осталось только вычислить граничные интервалы состояний и определить их границы. Для этого воспользуемся выражением (16), но при этом надо учесть, что приведенные в табл. 3 значения среднеквадратических отклонений





































Аналогично получаем пороговые напряжения компараторов, подключаемых к выходам остальных сумматоров:
U1н= 8,00 - 1,02


U2н= 8,00 - 0,59


U3н= 8,00 - 1,11


U4н= 8,00 - 1,69


U5н= 8,00 - 0,67


Примечание: Выходные напряжения сумматоров


1. Еськов Е.К. Акустическая сигнализация общественных насекомых. - М.: Наука. 1979. 2. Еськов Е.К. Управление процессами жизнедеятельности медоносных пчел и их оптимизация. - М.: Всесоюзная академия сельскохозяйственных наук имени В. И. Ленина. - 1982. 3. Дж. Ту. Р. Гонсалес. Принципы распознавания образов. - М.: Мир, 1978, стр. 177. (Обучаемые классификаторы образов, детерминистский подход). 4. Основы метрологии и электрические измерения. Под ред. Е.М. Душина. - Л.: Энергоатомиздат, 1987. 5. Шиндовский Э. , Щурц О. Статистические методы управления качеством/Контрольные нормы и планы контроля/ Пер. с немецкого. - М.: Мир, 1976-579 с.
Формула изобретения
РИСУНКИ
Рисунок 1, Рисунок 2, Рисунок 3, Рисунок 4, Рисунок 5, Рисунок 6, Рисунок 7, Рисунок 8, Рисунок 9, Рисунок 10