Устройство для установления степени правдоподобия информации
Заявляемая полезная модель относится к устройствам кодирования и преобразования кода и реализует способ оценки вероятности ошибки информации, представленной в виде цифровых значений. Задачей заявляемой полезной модели является создание устройства, обеспечивающего определение степени правдоподобия значений информационных показателей, полученной путем кодирования и преобразования кодов. Это достигается тем, что в предлагаемом устройстве для установления степени правдоподобия информации, включающем блок регистрации данных, блок сравнения, блок ранжирования и устройство вывода информации, новым является то, что оно дополнительно содержит детекторный блок, который включает в себя компаратор и накопитель, а блок ранжирования входит в детекторный блок, причем компаратор и накопитель соединены с блоком ранжирования, кроме того, выход блока регистрации данных соединен со входом блока сравнения, выход блока сравнения соединен с входом компаратора, выход блока ранжирования соединен с устройством вывода информации, а блок сравнения имеет возможность для ввода данных. Блок-схема устройства содержит блок регистрации данных 1, выполненный с возможностью ввода данных, блок сравнения 2, выполненный с возможностью ввода условного критерия, детекторный блок 3, включающий компаратор 4 и блок ранжирования 5, соединенный с накопителем 6, устройства вывода информации 7 установлено на выходе детекторного блока 3. Таким образом, наличие дополнительного детекторного блока, включающего компаратор и соединенный с накопителем блок ранжирования, установленного на выходе блока сравнения, позволяет заявляемому устройству устанавливать степень достоверности информации, представленной в цифровых значениях, путем кодирования и преобразования кодов.
Заявляемая полезная модель относится к устройствам кодирования и преобразования кода и реализует способ оценки вероятности ошибки информации, представленной в виде цифровых значений.
Основатель кибернетики Норберт Винер писал, что информация призвана представлять действительность такой, какова она есть (см. Винер Н. Кибернетика и общество: Пер. с англ. - М.: Изд-во иностр. лит., 1958. - 200 с).
На практике же приходится иметь дело с искаженной в той или иной степени информацией, неверно отражающей действительность. Особенно это типично для медицины. Искажение происходит по объективным и субъективным причинам. Ошибки делят на систематические и случайные. Между тем, несмотря на большую актуальность проблемы определения степени истинности, правильности информации, эта проблема до сих пор не нашла отражения в научных исследованиях. Особое значение указанная проблема имеет в случае, если объект представляется как многопараметрическая система или в виде набора показателей.
Наиболее близким, принятым за прототип устройством, является Устройство для выведения интегральных показателей по суммам мест, описанное в патенте на полезную модель № RU 48241, Н 03 М 7/16, 2005.09.27. Это устройство также предназначено для кодирования и преобразования кодов с целью определения интегральных оценок сходных объектов по ряду параметров, с возможностью последующего ранжирования группы объектов по полученным интегральным показателям для выведения заключений на основании полученных результатов. Блок-схема прототипа содержит последовательно соединенные блок регистрации данных, блок ранжирования, интеграционный блок и устройство вывода информации. Интеграционный блок состоит из последовательно соединенных сумматора и блока сравнения, на вход которого подсоединен блок памяти, выход блока сравнения соединен с устройством вывода информации.
Недостаток прототипа заключается в том, что невозможно определить, насколько высока или низка правдивость информации, закодированной и преобразованной для получения интегральной оценки по отношению к какому-либо критерию.
Задачей заявляемой полезной модели является создание устройства, обеспечивающего определение степени правдоподобия значений информационных показателей, полученной путем кодирования и преобразования кодов.
Это достигается тем, что в предлагаемом устройстве для установления степени правдоподобия информации, включающем блок регистрации данных, блок сравнения, блок ранжирования и устройство вывода информации, новым является то, что оно дополнительно содержит детекторный блок, который включает в себя компаратор и накопитель, а блок ранжирования входит в детекторный блок, причем компаратор и накопитель соединены с блоком ранжирования, кроме того, выход блока регистрации данных соединен со входом блока сравнения, выход блока сравнения соединен с входом компаратора, выход блока ранжирования соединен с устройством вывода информации, а блок сравнения имеет возможность для ввода данных.
Техническим результатом предлагаемой полезной модели является возможность определения степени правдоподобия значений информационных показателей.
На чертеже представлена блок-схема устройства.
Блок-схема содержит блок регистрации данных 1, выполненный с возможностью ввода данных, блок сравнения 2, выполненный с возможностью ввода условного критерия, детекторный блок 3, включающий компаратор 4 и блок ранжирования 5, соединенный с накопителем 6, устройства вывода информации 7 установлено на выходе детекторного блока 3.
Устройство работает следующим образом. Сначала формируется группа показателей для характеристики интересующего нас какого-либо качества объекта. Затем устанавливаются значения этих показателей. Показатели вводят в блок регистрации данных 1. Далее определяются критерии по каждому показателю. В медицине, где сложно установить критерии, в роли условных критериев могут выступать так называемые авторитетные средние. Их вводят в блок сравнения 2, в котором производят нахождение относительных отклонений значений каждого показатели из группы от своего авторитетного среднего, то есть вычисляются новые нормированные по относительному отклонению от авторитетного среднего значения по каждому изучаемому объекту по формуле (1).
где zi - значение показателя;
zaвт - значение авторитетного среднего;
х - нормированное по относительному отклонению от авторитетного среднего значение.
Для последующего вычисления среднего нормированного относительного отклонения сохранятся знак отклонения: отклонение в лучшую сторону от авторитетного среднего обозначается знаком «+», а отклонение в худшую сторону - знаком «-».
Следующее действие с кодированными показателями - вычисление среднего квадратического отклонения ряда найденных нормированных по отклонениям от авторитетного среднего значений показателей группы по формуле (2) производят с помощью компаратора 4, входящего в состав детекторного блока 3.
где - среднее квадратическое (стандартное) отклонение;
x - нормированное по относительному отклонению от авторитетного среднего значение;
- среднее значение по всем нормированным значениям;
n - число показателей.
Это измеренное обобщенное «отклонение отклонений» и является мерилом степени истинности, правдоподобия значений показателей в группе или мерой степени доверия к значениям показателей в неслучайной группе.
Для удобства классификации степеней доверия, полученные преобразованием кодов, их переводят в баллы с помощью блока ранжирования 5, Мы установили, что свыше 95% значений степеней доверия имеют величины от 0 до 1. Следовательно, чтобы применить наиболее привычную в России пятибалльную оценочную шкалу надо разбить весь интервал от 0 до 1 на пять интервалов по 0,2. Тогда наиболее высокие по величине значений степени доверия в виде средних квадратических (стандартных) отклонений будут располагаться в интервале от 0,000 до 0,200 (то есть меньше 0,200). Этому интервалу присваивается балл 5, что трактуется, как очень высокая или отличная степень доверия. Следующему интервалу значений от 0,200 до 0,400 присваивается балл 4 (высокая или хорошая степень доверия).
Интервалу значений стандартных отклонений от 0,400 до 0,600 соответствует балл 3 (средняя или удовлетворительная степень доверия). Интервалу от 0,600 до 0,800 присваивается балл 2 (низкая или неудовлетворительная степень доверия). Наконец, интервалу значений от 0,800 и выше присваивается балл 1 (очень низкая степень доверия). Если определить ступенчатую функцию f(x) как указано выше, то получаем новую более удобную для данной задачи оценочную количественную шкалу (см. таблицу 3). Баллы, показывающие достоверность информационных параметров, получают в виде таблицы с помощью устройства вывода информации 7.
Продемонстрируем, как работает предложенная блок-схема на конкретном примере. Допустим, что мы хотим оценить, насколько отражают реальную эпидемическую ситуацию по туберкулезу в регионах Северо-Западного Федерального округа (ФО) России отчетные данные за 2004 год, представленные соответствующими медицинскими ведомствами этих регионов. Эпидситуацию по туберкулезу будем оценивать по следующим десяти показателям: заболеваемость туберкулезом по ф. №8; заболеваемость туберкулезом по ф. №33; заболеваемость туберкулезом детей; заболеваемость туберкулезом подростков; болезненность туберкулезом; болезненность деструктивными формами туберкулеза; болезненность бациллярными формами туберкулеза; болезненность фиброзно-кавернозным туберкулезом; смертность от туберкулеза по ф. №33; количество ранних рецидивов на 100 тысяч населения.
Введем в блок регистрации данных 1 значения отобранных эпидемиологических показателей по всем субъектам РФ этого округа. К 10 регионам округа для проверки действия устройства добавим три гипотетических смоделированных региона путем ввода их показателей в блок сравнения 2.
1-я модель региона - гипотетический регион со среднероссийскими значениями выбранных показателей. Он должен демонстрировать самый оптимальный по степени правдоподобия результат и дать самую высокую оценку степени доверия, так как в этом случае будет иметь место нулевое отклонение от авторитетных средних.
2-я модель региона - гипотетический регион с отклонением значений всего одного показателя, но это отклонение максимальное в масштабах России для данного показателя.
3-я модель региона - гипотетический регион с самым неправдоподобным сочетанием значений показателей, где значения половины показателей будут самые
неблагополучные в России в 2004 г., а значения другой половины показателей будут самыми благополучными в России по итогам 2004 года.
Значения 10 выбранных эпидпоказателей по 13 регионам приведены в таблице 1.
В таблице 2 представлены полученные посредством блока сравнения 2 нормированные значения (по относительному отклонению от авторитетного среднего) по всем 13 регионам с указанием знака отклонения. Эти нормированные значения показателей по каждому региону направляют в детекторный блок 3, где с помощью компаратора 4 коды преобразуют для получения стандартного отклонения, которое с помощью блока ранжирования 5 и накопителя 6 преобразуют в степени доверия к значениям показателей регионов, которые выводят на устройство вывода информации 7 в виде таблицы 3. Из таблицы 3 видно, что гипотетический регион со средними по России значениями эпидпоказателей (модель 1) получил самую лучшую оценку по стандартному отклонению и соответственно 5 баллов, то есть очень высокую степень доверия показателей. Наоборот, модель 3 гипотетического региона с самым неправдоподобным сочетанием значений эпидпоказателей получила самую низкую оценку по стандартному отклонению и соответственно оценку в баллах - 1. Обращает внимание, что значения показателей Калининградской области тоже получили очень низкую степень доверия (1 балл). Величины баллов, являясь обобщенными показателями, не указывают, из-за каких значений эпидпоказателей регион получил ту или иную степень доверия. Задача оценки по степени доверия другая - привлечь внимание к объекту, чьи значения показателей выглядят неправдоподобно. Выяснить, из-за каких значений получилась низкая оценка степени доверия, можно знакомясь со значениями показателей того региона, который привлек наше внимание. Например, при знакомстве с показателями Калиниградской области, получившей балл 1, видно, что неправдоподобно выглядят значения двух показателей по отношению к значениям остальных показателей этого региона: заболеваемость туберкулезом детей и болезненность фиброзно-кавернозным туберкулезом.
Описанным способом мы обработали отчетные данные по всем 78 субъектам Российской Федерации (без Чеченской республики и без малочисленных автономий). Оказалось, что значения эпидпоказателей 75-ти из 78-ми регионов (96,2%) имели оценку степени доверия в виде стандартного отклонения в интервале от 0,077 (Москва) до 0,984 (республика Северная Осетия-Алания). Данные трех
регионов получили оценку по стандартному отклонению свыше 1,00 (очень низкая степень доверия): Калининградская область (1,076), республика Тыва (1,110) и Камчатская область (1,528). При знакомстве с отчетными данными по этим трем субъектам России можно убедиться в неправдоподобном соотношении значений некоторых эпидемиологических показателей, поданных соответствующими медицинскими ведомствами этих регионов.
Таким образом, наличие дополнительного детекторного блока, включающего компаратор и соединенный с накопителем блок ранжирования, установленного на выходе блока сравнения, позволяет заявляемому устройству устанавливать степень достоверности информации, представленной в цифровых значениях, путем кодирования и преобразования кодов.
Таблица 1 | ||||||||||
Значения эпидпоказателей по туберкулезу в регионах Северо-Западного ФО по тогам 2004 года | ||||||||||
Регионы | Заболевае-мость туберкуле-зом по ф. N8 | Заболе-вае-мость туберкулезом по ф. N33 | Заболе-вае-мость детей тубер-куле-зом | Заболеваемость подрост-ков тубер-кулезом | Болез-нен-ность тубер-куле-зом | Болез-ненность дест-рукт. тубер-кулезом | Болез-ненность бацилл. туберкулезом | Болезнен-ность ФКТ | Смерт-ность от акт. туберку-леза по ф. N33 | Ранние рециди-вы, на 100 тыс. нас. |
Архангельская область | 72,3 | 56,2 | 12,8 | 14,6 | 122,2 | 69,1 | 68,2 | 7,3 | 15,9 | 6,1 |
Вологодская область | 55 | 43,9 | 20,1 | 11,7 | 99,4 | 44,6 | 53,8 | 6,3 | 8,4 | 2,7 |
Калиниградс-кая область | 127 | 108,5 | 75,7 | 62 | 291,8 | 97,4 | 133,1 | 17,7 | 30,6 | 4,7 |
Ленинградская область | 72,4 | 63,8 | 25,7 | 25,4 | 179,5 | 70,6 | 74,3 | 13,2 | 19,5 | 4,2 |
Модель 1 (ССРР)* | 83,1 | 69,5 | 16,1 | 35,9 | 218,3 | 79,3 | 86,9 | 25,4 | 18,5 | 2,8 |
Модель 2 | 255,2 | 69,5 | 16,1 | 35,9 | 218,3 | 79,3 | 86,9 | 25,4 | 18,5 | 2,8 |
Модель 3 | 255,2 | 225,8 | 94,9 | 177,8 | 834,7 | 22,6 | 35,9 | 5,6 | 4,1 | 0,4 |
Мурманская область | 65,9 | 49,3 | 5,9 | 32 | 152,4 | 43 | 82,8 | 11,8 | 13,6 | 2,6 |
Новгородская область | 72,7 | 56,1 | 5,1 | 14,1 | 176,7 | 67,5 | 85,7 | 5,6 | 15,2 | 2,1 |
Псковская область | 76,8 | 54,6 | 5,8 | 26,8 | 162,8 | 63,8 | 64,3 | 11,5 | 15,7 | 6,6 |
Республика Карелия | 75,1 | 62,4 | 12 | 30,3 | 199,8 | 66,7 | 77,6 | 14,5 | 13,5 | 3,8 |
Республика Коми | 83,8 | 66,7 | 24 | 22,1 | 189,1 | 77 | 79,8 | 9,4 | 16,3 | 3,3 |
Санкт-Петербург | 41,5 | 34,8 | 17,1 | 22,2 | 122,7 | 48,4 | 46,6 | 7,1 | 9,2 | 1,5 |
Примечание: ССРР - среднестатистический регион России с авторитетными средними значениями. |
Таблица 2 Нормированные значения эпидпоказателей в регионах Северо-Западного ФО | |||||||||||
Регионы | Заболевае-мость туберкуле-зом по ф. N8 | Заболе-вае-мость туберкулезом по ф. N33 | Заболевае-мость детей тубер-куле-зом | Заболевае-мость под-рост-ков тубер-куле-зом | Болез-нен-ность тубер-куле-зом | Болез-нен-ность дест-рукт. тубер-куле-зом | Болез-нен-ность бацилл. туберкулезом | Болезнен-ность ФКТ | Смертность от акт. туберку-леза по ф. N33 | Ранние рецидивы, на 100 тыс. нас. | Средние значения |
Архангельская область | 0,13 | 0,191 | 0,205 | 0,593 | 0,44 | 0,129 | 0,215 | 0,713 | 0,141 | -1,179 | 0,158 |
Вологодская область | 0,338 | 0,368 | -0,248 | 0,674 | 0,545 | 0,438 | 0,381 | 0,752 | 0,546 | 0,036 | 0,383 |
Калиниградская область | -0,528 | -0,561 | -3,702 | -0,727 | -0,337 | -0,228 | -0,532 | 0,303 | -0,654 | -0,679 | -0,764 |
Ленинградская область | 0,129 | 0,082 | -0,596 | 0,292 | 0,178 | 0,11 | 0,145 | 0,48 | -0,054 | -0,5 | 0,027 |
Модель 1 (ССРР)* | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0,000 |
Модель 2 | -2,071 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -0,207 |
Модель 3 | -2,071 | -2,249 | -4,894 | -3,953 | -2,824 | 0,715 | 0,587 | 0,78 | 0,778 | 0,857 | -1,227 |
Мурманская область | 0,207 | 0,291 | 0,634 | 0,109 | 0,302 | 0,458 | 0,047 | 0,535 | 0,265 | 0,071 | 0,292 |
Новгородская область | 0,125 | 0,193 | 0,683 | 0,607 | 0,191 | 0,149 | 0,014 | 0,78 | 0,178 | 0,25 | 0,317 |
Псковская область | 0,076 | 0,214 | 0,64 | 0,253 | 0,254 | 0,195 | 0,26 | 0,547 | 0,151 | -1,357 | 0,123 |
Республика Карелия | 0,096 | 0,102 | 0,255 | 0,156 | 0,085 | 0,159 | 0,107 | 0,429 | 0,27 | -0,357 | 0,130 |
Республика Коми | -0,008 | 0,04 | -0,491 | 0,384 | 0,134 | 0,029 | 0,082 | 0,63 | 0,119 | -0,179 | 0,074 |
Санкт-Петербург | 0,501 | 0,499 | -0,062 | 0,382 | 0,438 | 0,39 | 0,464 | 0,72 | 0,503 | 0,464 | 0,430 |
Примечание: * ССРР - среднестатистический регион России. |
Таблица 3 Значения стандартных отклонений и соответствующие им степени доверия в баллах (ранжированные от лучших к худшим показателям) | ||
Сравниваемые объекты | Стандартное отклонение | Степень доверия в баллах к значениям показателей данного региона |
Модель 1-я | 0,000 | 5 |
Санкт-Петербург | 0,197 | 5 |
Мурманская область | 0,198 | 5 |
Республика Карелия | 0,202 | 4 |
Новгородская область | 0,268 | 4 |
Вологодская область | 0,298 | 4 |
Республика Коми | 0,299 | 4 |
Ленинградская область | 0,334 | 4 |
Архангельская область | 0,513 | 3 |
Псковская область | 0,548 | 3 |
Модель 2-я | 0,655 | 2 |
Калиниградская область | 1,076 | 1 |
Модель 3-я | 2,227 | 1 |
Устройство для установления степени правдоподобия информации, преимущественно структурированной в виде показателей, включающее в себя последовательно соединенные блок регистрации данных, блок сравнения, выполненный с возможностью ввода в него дополнительных данных, блок ранжирования и устройство вывода информации, отличающееся тем, что блок ранжирования входит в состав детекторного блока, содержащего дополнительно компаратор, вход которого соединен с выходом блока сравнения, и накопитель, выход которого соединен с блоком сравнения, при этом детекторный блок соединен с входом устройства вывода информации через выход блока ранжирования.