Устройство заполнения пропусков в информационных матрицах

 

Полезная модель направлена на обработку ковариационных матриц содержащих информацию произвольных наблюдений в любой научной отрасли и относится к области вычислительной техники.

В настоящее время устройств заполнения пропусков в информационных матрицах не обнаружено, однако, необходимость восстановления пропущенных данных в ковариационных матрицах содержащих статистические данные по испытаниям, эксплуатации и т.д. является важной задачей.

Цель полезной модели заключается в решении задачи по заполнению пропущенных данных в двумерных выборках с пропусками в одной переменной, для формирования необходимого количества и качества исходной информации с целью повышения точности и достоверности оцениваемых показателей, а также для получения более точных параметров законов распределения случайных величин.

Поставленная цель достигается тем, что предлагаемое устройство за счет применения блока управления, четырех блоков памяти, пяти блоков сложения, пяти блоков деления, трех блоков вычитания, трех блоков умножения, одного блока возведения в квадрат, двух блоков счетчик, а также организации связей между ними позволяет реализовать алгоритм восстановления пропущенных (утраченных) данных и, тем самым, восстановить пропущенные данные для дальнейшей оценки параметров статистических данных. Вместе с тем, часть исходных данных, предназначенных для проведения анализа, по объективным и субъективным причинам может отсутствовать. Разработанное устройство заполнения пропусков в информационных матрицах обеспечивает восстановление данных с пропусками, его применение позволяет значительно уменьшить дисперсию оцениваемых показателей, используемых в любых отраслях применения статистического анализа.

Полезная модель относится к вычислительной технике и может быть использована в специализированных комплексах обработки информации для заполнения пропусков в информационных матрицах.

На настоящее время прототипов устройства заполнения пропусков в информационных матрицах не обнаружено, однако, необходимость восстановления пропущенных данных в ковариационных матрицах содержащих статистические данные по испытаниям, эксплуатации и т.д. является важной задачей.

Цель полезной модели заключается в решении задачи по заполнению пропущенных данных в двумерных выборках с пропусками в одной переменной, для получения более точных параметров законов распределения случайных величин.

Поставленная цель достигается тем, что предлагаемое устройство за счет применения блока управления, четырех блоков памяти, пяти блоков сложения, пяти блоков деления, трех блоков вычитания, трех блоков умножения, одного блока возведения в квадрат, двух блоков счетчик, а также организации связей между ними позволяет реализовать алгоритм восстановления пропущенных (утраченных) данных и, тем самым, восстановить пропущенные данные для дальнейшей оценки параметров статистических данных.

Функциональная схема устройства заполнения пропусков в информационных матрицах представлена на фиг.1.

Устройство содержит блок 1 управления, блоки 2, 3, 23, 24 памяти, блоки 6, 7, 14, 15, 22 сложения, блоки 8, 9, 16, 17, 18 деления, блоки 10, 11, 20 вычитания, блоки 13, 19, 21 умножения, блок 12 возведения в квадрат, блоки

4, 5 счетчик.

Принцип работы устройства заполнения пропусков в информационных матрицах заключается в реализации алгоритма, сущность которого заключается в следующем.

Наиболее эффективным средством заполнения пропущенных данных является метод факторизации правдоподобия, ориентированного на конкретную информационную ситуацию.

Устройство рассматривает многомерный случай с пропусками в одной переменной по результатам испытаний, эксплуатации и. т.д. В эксперименте величина Xi может быть случайной, регистрируемой без пропусков, или детерминированной величиной, управляемой исследователем.

Данные по параметру Yi могут отсутствовать вследствие неуправляемых событий в процессе сбора таких данных, как отказ от ответа, недопустимые значения, удаленные из выборки, ошибки при регистрации данных.

Операция по заполнению пропущенных значений и оценку максимального правдоподобия (МП) получают, независимо максимизируя правдоподобия, соответствующие коэффициентам регрессии.

Максимизация первого фактора дает:

т.е. выборочные среднее x и дисперсию x М наблюдений х11 ...,хj1.

Максимизация второго фактора проводится с использованием стандартных результатов для регрессии

где: для j, k=1,2,

при:

где: j - неполные данные, j, k, x, y, - средние значения показателей.

Используя свойство

можно получить МП-оценки других параметров [1]. В частности, y - средняя оценка значений показателей yj и y - дисперсия (с учетом пропусков)

Далее, необходимо вычислить значения y фактически представляющие пропущенные y, предсказанные линейной регрессией yj , на xj, вычисленной по полным наблюдениям

Численно данная задача решена в [2].

Таким образом, алгоритм заполнения пропущенных данных включает следующие операции:

вычисление оценок математического ожидания и дисперсии по столбцам;

получение коэффициентов регрессии yx, y;

построение регрессионной модели;

вывод матрицы полных значений на выход устройства.

Работа устройства осуществляется по схеме, задаваемой тактовыми импульсами блока 1 управления.

Начальная установка блоков устройства происходит при подаче импульса на вход «П», в результате действия которого обнуляются все блоки устройства, и запускается блок 1 управления. Одновременно на информационные входы блоков 2 и 3 памяти, имеющих 50 ячеек памяти каждый подаются значения и , где N и M формируются в блоках 4 и 5 счетчиках соответственно.

Первый тактовый импульс с первого выхода блока 1 управления подается на управляющие входы блоков 2 и 3 памяти, а также блоков 4 и 5 счетчиков и инициирует их работу. В результате в первые ячейки памяти блоков 2 и 3 памяти записываются значения x 1 и y1 соответственно, а в блоках 4 и 5 счетчиках формируются результаты i=N=1 и j=M=1.

Второй тактовый импульс с первого выхода блока 1 управления подается на управляющие входы блоков 2 и 3 памяти, а также блоков 4 и 5 счетчиков и инициирует их работу. В результате во вторые ячейки памяти блоков 2 и 3 памяти записываются значения x 2 и y2 соответственно, а в блоках 4 и 5 счетчиках формируются результаты i=N=2 и j=M=2.

С третьего по пятидесятый тактовые импульсы проводятся аналогичные операции, в результате чего в ячейках памяти блоков 2 и 3 памяти записываются значения и соответственно, а в блоках 4 и 5 счетчиках - получены результаты i=N и j=M соответственно. При этом, если значения xi и yj отсутствуют, то в ячейка памяти записываются значения равные нулю, а блоки 4 и 5 счетчики срабатывают в случае, когда в ячейки памяти блоков 3 и 4 памяти записываются значения

xi и yj отличные от нуля.

Пятьдесят первый тактовый импульс со второго выхода блока 1 управления подается на управляющие входы блоков 6 и 7 сложения и инициирует их работу. В результате чего с выходов первых ячеек блоков 2 и 3 памяти значения x1 и y 1 поступают на информационные входы блоков 6 и 7 сложения соответственно.

Пятьдесят второй тактовый импульс со второго выхода блока 1 управления подается на управляющие входы блоков 6 и 7 сложения и инициирует их работу. В результате чего с выходов вторых ячеек блоков 2 и 3 памяти значения x2 и y2 поступают на информационные входы блоков 6 и 7 сложения соответственно, где складываются с предыдущими значениями.

С пятьдесят третьего по сотый тактовые импульсы проводятся аналогичные операции. При этом суммирование значений xi, поступающих с выходов ячеек памяти блока 2 памяти, производится по , в результате чего в блоках 6 и 7 сложения получены значения сумм и соответственно.

Сто первый тактовый импульс с третьего выхода блока 1 управления подается на управляющие входы блоков 8 и 9 деления и инициирует их работу. В результате чего с выходов блоков 6 и 7 сложения значения сумм и поступают на первые информационные входы блоков 8 и 9 деления соответственно. На вторые информационные входы блоков 8 и 9 деления с выхода блока 5 счетчика поступает значение M, в результате чего в блоках 8 и 9 деления получены значения x и y соответственно.

Сто второй тактовый импульс с четвертого выхода блока 1 управления подается на управляющие входы блоков 10 и 11 вычитания и инициирует их

работу. В результате чего с выходов первых ячеек блоков 2 и 3 памяти значения x1 и y 1 поступают на первые информационные входы блоков 10 и 11 вычитания соответственно. Кроме того, на вторые информационные входы блоков 10 и 11 вычитания подаются значения x и y с выходов блоков 8 и 9 деления соответственно, в результате чего в блоках 10 и 11 вычитания получаются значения (x1-x) и (y1-y) соответственно.

Сто третий тактовый импульс с пятого выхода блока 1 управления подается на управляющие входы блока 12 возведения в квадрат и блока 13 умножения и инициирует их работу. В результате чего с выхода блока 10 вычитания значение разности (x1 -x) поступает на первый информационный вход блока 12 возведения в квадрат и первый информационный вход блока 13 умножения, а на второй информационный вход блока 13 умножения с выхода блока 11 вычитания поступает значение разности (y1-y). В результате в блоке 12 возведения в квадрат формируется значение (x1-x)2, а в блоке 13 умножения - значение (x1-x) и (y1-y).

Сто четвертый тактовый импульс с шестого выхода блока 1 управления подается на управляющие входы блоков 14 и 15 сложения и инициирует их работу. В результате чего с первых выходов блока 12 возведения в квадрат и блока 13 умножения на первые информационные входы блоков 14 и 15 сложения поступают значения (x1-x)2 и (x 1-x)(y1-y) соответственно.

Сто пятый тактовый импульс с четвертого выхода блока 1 управления подается на управляющие входы блоков 10 и 11 вычитания и инициирует их работу. В результате чего с выходов первых ячеек блоков 2 и 3 памяти значения x2 и y2 поступают на первые информационные входы блоков 10 и 11 вычитания соответственно. Кроме того, на вторые информационные входы блоков 10 и 11 вычитания подаются значения x и y выходов блоков 8 и 9 деления соответственно, в результате чего в блоках 10 и 11 вычитания получаются

значения (x2-x) и (y2-y) соответственно.

Сто шестой тактовый импульс с пятого выхода блока 1 управления подается на управляющие входы блока 12 возведения в квадрат и блока 13 умножения и инициирует их работу. В результате чего с выхода блока 10 вычитания значение разности (x2 -x) поступает на первые информационный вход блока 12 возведения в квадрат и первый информационный вход блока 13 умножения, а на второй информационный вход блока 13 умножения с выхода блока 11 вычитания поступает значение разности (y2-y). В результате в блоке 12 возведения в квадрат формируется значение (x2-x)2, а в блоке 13 умножения - значение (x2-x)(y2-y).

Сто седьмой тактовый импульс с шестого выхода блока 1 управления подается на управляющие входы блоков 14 и 15 сложения и инициирует их работу. В результате чего с первых выходов блока 12 возведения в квадрат и блока 13 умножения на первые информационные входы блоков 14 и 15 сложения поступают значения (x2-x)2 и (x 2-x)(y2-y) соответственно, где суммируются с предыдущими значениями.

Со сто седьмого по трехсотый тактовые импульсы проводятся аналогичные операции. В результате на первых выходах блоков 14 и 15 сложения формируются значения и .При этом количество циклов будет равно j - раз (j=М). После чего с входа (0) устройства на входы блоков 8 и 9 деления, 10 и 11 вычитания, 12 возведения в квадрат и 13 умножения, 14 и 15 сложения подается значение "0" 50 - j раз.

Триста первый тактовый импульс с седьмого выхода блока 1 управления подается на управляющие входы блоков 16 и 17 деления и инициирует их работу. В результате чего, с выходов блоков 14 и 15 сложения значения

сумм и поступают на первые информационные входы блоков 16 и 17 деления соответственно. На вторые информационные входы блоков 16 и 17 деления с выхода блока 5 счетчика поступает значение M, в результате чего в блоках 16 и 17 деления получены значения SSx и SSxy соответственно.

Триста второй тактовый импульс с восьмого выхода блока 1 управления подается на управляющий вход блока 18 деления и инициирует его работу. В результате чего, с первого выхода блока 16 деления на первый вход блока 18 деления поступает значение SS x, а с первого выхода блока 17 деления на второй вход блока 18 деления поступает значение SSxy. В результате завершения работа триста второго тактового импульса получается значение yx.

Триста третий тактовый импульс с девятого выхода блока 1 управления подается на управляющий вход блока 19 умножения и инициирует его работу. В результате чего, с первого выхода блока 18 деления на первый вход блока 19 умножения поступает значение yx, а с первого выхода блока 8 деления на второй вход блока 19 умножения поступает значение x. По завершению работы триста третьего тактового импульса на первый выход блока 19 умножения подается значение произведения yxx.

Триста четвертый тактовый импульс с десятого выхода блока 1 управления подается на управляющий вход блока 20 вычитания и инициирует его работу. В результате чего, с первого выхода блока 9 деления на первый вход блока 20 вычитания поступает значение y, из которого производится вычитание значения поступающего с первого выхода блока 19 умножения на второй вход блока 20 вычитания. В результате завершения работа триста шестого тактового импульса на первом выходе блока 20 вычитания подается значение

y.

Триста пятый тактовый импульс с одиннадцатого выхода блока 1 управления подается на управляющий вход блока 21 умножения и инициирует его работу. В результате чего, с первого выхода блока 18 деления на первый вход блока 21 умножения подается значение yx, а с первого выхода блока 2 памяти на второй вход блока 21 умножения подается значение x 1. В результате в первой ячейке блока 21 умножения записывается значение произведения (yxx1).

Триста шестой тактовый импульс с одиннадцатого выхода блока 1 управления подается на управляющие входы блока 21 умножения и инициирует его работу. В результате чего, с первого выхода блока 18 деления на первый вход блока 21 умножения подается значение yx, а с первого выхода блока 2 памяти на второй вход блока 21 умножения подается значение x 2. В результате во второй ячейке блока 21 умножения записывается значение произведения (yxx2).

С триста седьмого по триста пятьдесят четвертый тактовый импульс проводятся аналогичные операции, в результате чего в блоке 21 умножениязаписываются значения .

Триста пятьдесят пятый тактовый импульс с двенадцатого выхода блока 1 управления подается на управляющие входы блока 22 сложения и инициирует его работу. В результате чего, с первого выхода блока 21 умножения на первый вход блока 22 сложения поступает значение (yxx1), а с первого выхода блока 20 вычитания на второй вход блока 22 сложения поступает значение y. В результате в первую ячейку блока 22 сложения записывается значение y+(yxx1).

Триста пятьдесят шестой тактовый импульс с двенадцатого выхода блока 1 управления подается на управляющие входы блока 22 сложения и

инициирует его работу. В результате чего, с первого выхода блока 21 умножения на первый вход блока 22 сложения поступает значение (yxx2), а с первого выхода блока 20 вычитания на второй вход блока 22 сложения поступает значение y. В результате во вторую ячейку блока 22 сложения записывается значение суммы y+(yxx2).

С триста пятьдесят седьмого по четыреста четвертый тактовый импульс проводятся аналогичные операции, в результате чего в блоке 22 сложения записываются значения .

Четыреста пятый тактовый импульс с тринадцатого выхода блока 1 управления подается на управляющий вход блока 23 памяти и инициирует его работу. В результате чего, с первого выхода блока 2 памяти на первый вход блока 23 памяти в первую ячейку памяти записывается значения x1, а с первого выхода блока 22 сложения на второй вход блока 23 памяти записывается значение соответственно.

Четыреста шестой тактовый импульс с тринадцатого выхода блока 1 управления подается на управляющий вход блока 23 памяти и инициирует его работу. В результате чего, с первого выхода блока 2 памяти на первый вход блока 23 памяти во вторую ячейку памяти записывается значения x 2, а с первого выхода блока 22 сложения на второй вход блока 23 памяти записывается значение соответственно.

С четыреста седьмого по четыреста пятьдесят четвертый тактовые импульсы проводятся аналогичные операции, в результате чего в ячейках памяти блока 23 памяти записывается значения и соответственно.

Четыреста пятьдесят пятый тактовый импульс с четырнадцатого выхода блока 1 управления подается на управляющий вход блока 24 памяти и инициирует его работу. В результате этого, с первого выхода блока 3 памяти

на первый вход блока 24 памяти поступает M значений yj , а на второй вход блока 24 со второго выхода блока 23 памяти поступает N-М значений . В результате в блоке 24 замены сформирована матрица столбец .

По завершению всех операций на выход устройства с первого выхода блока 23 памяти подается значение x i, а с первого выхода блока 24 памяти значение в результате чего, получена матрица полных значений.

Применение предлагаемого устройства позволит решать задачи по заполнению пропущенных данных в двумерных выборках с пропусками в одной переменной, следовательно, появится возможность получения более точных параметров законов распределения случайных величин.

Список использованных источников

1. Р.Дж.А.Литтл, Д.Б.Рубин. Статистический анализ данных с пропусками.: М., Финансы и статистика, 1991 г.

2. С.В.Омельченко, В.Ю.Калинин, В.А.Чубасов. Оценка результатов испытаний образцов (комплексов) артиллерийского вооружения в условиях пропуска данных.: М., РОСПАТЕНТ №2005611646 2005 г.

Устройство заполнения пропусков в информационных матрицах, содержащее блок управления, четыре блока памяти, пять блоков сложения, пять блоков деления, три блока вычитания, три блока умножения, один блок возведения в квадрат, два блока счетчика, отличающееся тем, что в него дополнительно введены блок управления, четыре блока памяти, пять блоков сложения, пять блоков деления, три блока вычитания, три блока умножения, один блок возведения в квадрат, два блока счетчика, причем начальная установка блоков устройства происходит при подаче импульса на вход "П", в результате действия которого обнуляются все блоки устройства, вход хi, устройства соединен с информационными входами блока 2 памяти и с входом блока 4 счетчика, вход у j устройства соединен с информационными входами блока 3 памяти и с входом блока 5 счетчик, первый выход блока 1 управления соединен с управляющими входами блоков 2 и 3 памяти, блоков 4 и 5 счетчиков, второй выход блока 1 управления соединен с управляющими входами блоков 6 и 7 сложения, третий выход блока 1 управления соединен с управляющими входами блоков 8 и 9 деления, четвертый выход блока 1 управления соединен с управляющими входами блоков 10 и 11 сложения, пятый выход блока 1 управления соединен с управляющими входами блока 12 возведения в квадрат и блока 13 умножения, шестой выход блока 1 управления соединен с управляющими входами блоков 14 и 15 сложения, седьмой выход блока 1 управления соединен с управляющими входами блоков 16 и 17 деления, восьмой выход блока 1 управления соединен с управляющим входом блока 18 деления, девятый выход блока 1 управления соединен с управляющим входом блока 19 умножения, десятый выход блока 1 управления соединен с управляющим входом блока 20 вычитания, одиннадцатый выход блока 1 управления соединен с управляющим входом блока 21 умножения, двенадцатый выход блока 1 управления соединен с управляющим входом блока 22 сложения, тринадцатый выход блока 1 управления соединен с управляющим входом блока 23 памяти, четырнадцатый выход блока 1 управления соединен с управляющим входом блока 24 памяти, выход блока 2 памяти соединен с входом блока 6 сложения, с первым входом блока 10 вычитания, с первым входом блока 23 памяти и со вторым входом блока 21 умножения, выход блока 3 памяти соединен с входом блока 7 сложения, с первым входом блока 11 вычитания, первым входом блока 24 памяти, выход блока 6 сложения соединен с первым входом блока 8 деления, а второй вход блока 8 деления соединен с выходом блока 5 счетчик, выход блока 7 сложения соединен с первым входом блока 9 деления, второй вход блока 9 деления соединен с выходом блока 5 счетчик, выход блока 8 деления соединен со вторым входом блока 10 вычитания и вторым входом блока 19 умножения, выход блока 9 деления соединен со вторым входом блока 11 вычитания и первым входом блока 20 вычитания, выход блока 10 вычитания соединен с входом блока 12 возведения в квадрат и первым входом блока 13 умножения, выход блока 11 вычитания соединен со вторым входом блока 13 умножения, выход блока 12 возведения в квадрат соединен с входом блока 14 сложения, выход блока 13 умножения соединен с входом блока 15 сложения, выход блока 14 сложения соединен с первым входом блока 16 деления, выход блока 15 сложения соединен с первым входом блока 17 деления, выход блока 16 деления соединен с первым входом блока 18 деления, выход блока 17 деления соединен со вторым входом блока 18 деления, выход блока 18 деления соединен с первым входом блока 19 умножения и первым входом блока 21 умножения, выход блока 19 умножения соединен со вторым входом блока 20 вычитания, выход блока 20 вычитания соединен со вторым входом блока 22 сложения, выход блока 21 умножения соединен с первым входом блока 22 сложения, выход блока 22 сложения соединен со вторым вводом блока 23 памяти, второй выход блока 23 памяти соединен со вторым выходом блока 24 памяти, выход блока 23 памяти соединен с выходом хi устройства, выход блока 24 памяти соединен с выходом уj устройства.



 

Наверх