Способ поиска и восстановления функциональных зависимостей и устройство для его реализации
Владельцы патента RU 2708343:
Вейко Алексей Владимирович (RU)
Кутоманова Дарья Дмитриевна (RU)
Великоиваненко Владимир Ильич (RU)
Изобретение относится к области вычислительной техники, основанной на детерминированных конечных автоматах и стековых вычислительных машинах. Технический результат заключается в повышении точности поиска и восстановления функциональных зависимостей показателей и параметров изделий ракетно-космической техники. Устройство поиска и восстановления функциональных зависимостей показателей и параметров изделий ракетно-космической техники содержит оптимизатор статистических коэффициентов, выполненный в виде генератора псевдослучайных чисел, сервер очередей в виде базы данных, генератор функций, имеющий два входа, оптимизатор функций, содержащий оптимизатор статистических коэффициентов, компилятор математических выражений в объектный код и объектная машина. Способ описывает работу устройства. 2 н.п. ф-лы, 1 ил., 2 табл.
Изобретение относится к области вычислительной техники, основанной на детерминированных конечных автоматах и стековых вычислительных машинах. Более точно - к компьютерному системному анализу численных данных в структурированных массивах информации, предназначенным для решения задачи определения математически обусловленных функциональных зависимостей, и может быть также использовано для анализа существующих в матрицах математически обусловленных функциональных зависимостей, в частности, для проверки новых векторов на непротиворечивость исходным данным.
Предлагаемый способ позволяет существенно снизить трудоемкость анализа разнородных статистических данных и обеспечить получение набора математически обусловленных функциональных зависимостей для дальнейшего исследования сложных технических систем эргатического типа («персонал-система-среда»).
Известен способ (см. патент RU №2504006, 10.01.2014, МПК7 G06N 3/08) в котором для последовательного поиска и восстановления зависимостей между матрицей исходных данных и эталонными данными используется численная оптимизация статистических параметров нейросети на основе дополнения процесса ее обучения экспертными данными. Такое решение позволяет за счет знаний эксперта существенно увеличить качество и скорость процесса обучения нейросети. Вместе с тем, ему также присущи и недостатки, которые связаны с тем, что фактически время, затрачиваемое на обучение нейросети, переносится на этап проведения экспертной обработки исходных данных. Кроме того, мнение эксперта о возможной классификации исходных данных зачастую может быть субъективным и не совпадать с общим мнением экспертной группы.
Известно также техническое решение (см. патент RU №.105038, 27.05.2011, МПК7 G06F 9/45) в котором для установления зависимости между матрицей исходных данных и эталонными данными используется метод регрессионного анализа на основе заранее определенных классов функций. Такое техническое решение, в отличие от предыдущего решения, позволяет получить аналитический вид зависимости, однако, в основе используемого способа восстановления зависимостей также содержится аналог нейросети с заранее заданной структурой.
Недостатком выше указанного технического решения, является необходимость априорного задания классов функций, что делает его применение ограниченным и требует значительных временных ресурсов для реализации.
Известен способ обучения искусственной нейронной сети (ИНС) (см. патент RU №2504006, 10.01.2014, МПК7 G06N3/08), заключающийся в подаче исходных данных на вход ИНС, которая на основании обучающих примеров осуществляет оптимизацию статистических коэффициентов в виде векторов синаптических весов нейронов с соответствующей коррекцией до завершения обучения ИНС. Данное изобретение выбрано в качестве прототипа.
Недостатками указанного способа являются требование исходного существования структуры нейросети и невозможность осуществления последовательного приближения к исходному виду функции.
Целью предлагаемого изобретения является устранение вышеуказанных недостатков.
Указанная цель достигается путем последовательного усложнения математических формул с их последующей подачей на оптимизатор и сохранения математически обусловленных зависимостей для дальнейшей оценки вероятности их появления.
Решение сформулированной задачи целесообразно реализовать в виде отдельного унифицированного блока, что позволяет ускорить процесс поиска функциональных зависимостей и расчет вероятности их наблюдения за счет распараллеливания вычислений.
На фиг. 1 представлена схема устройства поиска функциональных зависимостей между входными и выходными данными.
Устройство для поиска функциональных зависимостей содержит: базу данных (сервер очередей) - 1, генератор функций - 2, блок оптимизации - 3, который включает в себя компилятор математических выражений в объектный код - 4, блок оптимизации статистических коэффициентов - 5 и объектную машину - 6.
Вход и выходы устройства поиска функциональных зависимостей (которыми являются вход и выход сервера очередей 1) на фиг. 1 не показаны.
База данных (сервер очередей) - 1 представляет собой систему выдачи на генератор функций исходной матрицы численных значений и целевого вектора параметров исследуемого объекта. Отличительной особенностью его является то, что за одно обращение он выдает ровно один набор данных. В сервер очередей может входить база данных, которая используется для хранения исходных данных и результатов расчета.
Генератор функций - 2 представляет собой систему поэтапного усложнения математических функций, который работает на основе заранее заданной формальной грамматики. Эта грамматика описывает, в свою очередь, множество всех возможных математически корректных формул. Структурно генератор получает исходные данные от сервера очередей, генерирует функции и передает их в компилятор математических выражений.
Блок оптимизации - 3 представляет собой систему поиска оптимальных значений набора статистических коэффициентов в переданной от генератора функций (2) формулы. Структурно блок оптимизации 3 получает исходные данные для расчета и математическую формулу от генератора функций, а также осуществляет оптимизацию статистических коэффициентов переданной формулы по заранее выбранному функционалу. В качестве возвращаемого на генератор функций 2 данных блок оптимизации 3 использует функционал, который рассчитывается на основе отклонения эталонных и расчетных данных.
Компилятор математических выражений - 4 представляет транслятор переданных математических формул в объектный код, что способствует существенному ускорению расчетов.
Блок оптимизации статистических коэффициентов - 5 представляет собой систему численной оптимизации статистических коэффициентов по заранее заданному функционалу.
Объектная машина - 6 представляет собой устройство, выполняющее объектный код, который генерирует компилятор математических выражений. Технически объектная машина представляет собой стековую вычислительную машину.
Сущность способа последовательного поиска и восстановления функциональных зависимостей и устройство для его реализации заключается в следующем.
Генератор функций 2, осуществляющий общее управление поиском математически обусловленных функциональных зависимостей, производит запрос задания, хранимого в сервере очередей 1. Генератор функций 2 инициализирует значение текущей формулы пустой строкой и производит на основе формальной грамматики вывод всех формул, которые отличаются от исходной формулы применением ровно одного правила. При этом на данном этапе предусматривается возможность увеличения количества статистических коэффициентов в формуле на 1. Данный набор функциональных зависимостей последовательно передается на оптимизатор функций (3), который последовательно возвращает обратно формулы с рассчитанными коэффициентами и ошибку в расчетах. На основании этих данных в сервер очередей передается для хранения информация о формуле с наименьшей ошибкой и сложность ее математической конструкции, определяемая как количество правил грамматики, которое необходимо применить для синтаксического разбора полученной формулы. На основании этих данных сервер очередей (1) осуществляет оценку вероятности наблюдения формулы, как отношение количества раз, сколько формула передавалась в блок (1) к общему числу транзакций по передаче формулы заданной сложности.
Оптимизатор функций (3), получая данные от генератора функций (2), осуществляет компиляцию переданной формулы в объектный код при помощи транслятора (4), который после этого передает полученный результат, исходную матрицу численных данных и вектор целевых значений на оптимизатор статистических коэффициентов (5).
Оптимизатор статистических коэффициентов (5) осуществляет поиск наилучшего набора статистических коэффициентов переданной формулы, используя для этого объектную машину (6), которая производит вычисления на основе полученного от генератора функций (2) объектного кода.
Модельный пример
Известны исходные данные о характеристиках отечественных и зарубежных средств выведения (СВ), представленные в виде матрицы вида (таблица 1):
Таблица 1.
Наименование средств выведения | Стоимость (Y), млн. долл. | Масса ПН (X1) (НОО), кг | Масса РКН (X0), кг |
KSLV 1 | 150 | 100 | 140600 |
Старт 1 | 15 | 532 | 47200 |
Минитмен 2 | 7 | 680 | 33014 |
Эпсилон | 38 | 1200 | 91000 |
Космос | 17 | 1500 | 109000 |
Минотавр 4 | 50 | 1750 | 87000 |
M-5 | 62 | 1800 | 139000 |
Молния М | 40 | 1800 | 305000 |
PSLV-CA | 17.8 | 2100 | 230000 |
Рокот | 30 | 2150 | 107500 |
Вега | 55 | 2400 | 137000 |
Великий поход 2C | 30 | 2400 | 192000 |
Дельта 2 7320 | 130 | 2700 | 152000 |
Циклон | 20 | 3000 | 182000 |
Союз-2.1в | 23 | 3150 | 160000 |
Атлас 1 | 65 | 3630 | 148700 |
Днепр | 40 | 3700 | 211000 |
Великий поход 2D | 20 | 3800 | 250000 |
PSLV-XL | 28 | 3800 | 320000 |
Ангара 1.2 | 26 | 4000 | 171000 |
Великий поход 4B | 42 | 4200 | 249200 |
Великий поход 4C | 41 | 4200 | 250000 |
GSLV Mk II | 35 | 5000 | 414000 |
Антарес 130 | 90 | 5100 | 296000 |
Великий поход 3A | 67 | 6000 | 241000 |
Атлас 2 | 116 | 6780 | 187170 |
Союз-ФГ | 18 | 6950 | 298400 |
Союз-У | 17 | 6950 | 308000 |
Зенит 3SL | 95 | 7000 | 473000 |
Союз-2.1а | 36 | 7020 | 312000 |
Союз-ФГ с РБ «Фрегат» | 25 | 7020 | 313000 |
Ангара-А3.2 | 41 | 8000 | 425000 |
GSLV Mk III | 35 | 8000 | 630600 |
Союз-2.1б | 36 | 8250 | 312000 |
Атлас 5 401 | 138.2 | 9797 | 334500 |
H2A202 | 88.5 | 10000 | 289000 |
Дельта 4 средняя (5.2) | 164 | 10300 | 292732 |
Великий поход 3B | 70 | 12000 | 425800 |
Дельта 4 средняя (5.4) | 164 | 13600 | 404600 |
Атлас 5 421 | 138 | 13600 | 428000 |
Зенит 2S | 27 | 13740 | 460000 |
Дельта 4 средняя (5.4) RS-68A | 164 | 14140 | 406600 |
Ангара-А3 | 46 | 15300 | 482000 |
Атлас 5 531 | 140 | 15575 | 475000 |
Ариан 5G | 125 | 16000 | 746000 |
H-2B | 185 | 16500 | 531000 |
Атлас 5 541 | 232 | 17443 | 540300 |
Ангара-А5.2 | 60 | 18200 | 714000 |
Атлас 5 551 | 200 | 18500 | 587000 |
Ариан 5 ECA | 160 | 20000 | 780000 |
Ариан 5 ES | 150 | 21000 | 760000 |
Протон-М | 41 | 22000 | 705000 |
Протон-М с РБ «Бриз-М» | 65 | 22000 | 712800 |
Фалькон 9 (вер 1.2) | 80 | 22800 | 549054 |
Ангара-А5 | 75 | 26000 | 775000 |
Дельта 4 тяжелая | 350 | 28790 | 733000 |
Дельта 4 тяжелая RS-68A | 350 | 28790 | 733400 |
Ангара-А7.2 | 150 | 36000 | 1130000 |
Ангара-А7.2 В | 200 | 50000 | 1107000 |
Фалькон тяжелая | 120 | 54400 | 1462836 |
Сатурн 5 | 820 | 118000 | 3000000 |
Требуется: определить возможный вид зависимости "Стоимости" средств выведения (Y) от массы ракеты (X1) и массы полезной нагрузки (ПН, Х0), выводимой на различные низкие околоземные орбиты (НОО) для решения целевых задач.
Решения, которые были получены с использованием предлагаемого способа и разработанного на его основе алгоритма (показаны только наилучшие в своем уровне сложности функциональные зависимости) представлены в таблице 2.
Таблица 2.
Уровень сложности функциональной зависимости | Сумма квадратов ошибки* | Функциональная зависимость с поправочными (корректирующими) коэффициентами |
1 | 319693.9778 | Y=(X1*0.00022103153859481632) |
2 | 290780.743 | Y=(X0*0.0063328663933562793) |
3 | 267694.5096 | Y=(0.0054232804232943188*(X0+5089.7808201058197)) |
4 | 266857.7733 | Y=(0.0055476919599613348*(X0+(8607.2958333333245-3970.0060293000515))) |
5 | 263473.3487 | Y=((((-130.02158078680208)*(X0+3782.9636712752117))+X1)/(-17700.179118339875)) |
6 | 253308.4021 | Y=((((X0/(13363.658227027378+20.899085087557935))*75.102844427402033)+20.899085087557935)-((-14519.347326376181)/X0)) |
....................................................................................................................................................................................................................................... | ||
13 | 249639.7697 | Y=((((((((X0+7115.0609430628401)*108.38084799351319)-X1)/14471.370612254026)-(108.38084799351319-(-7134.5944794433617)))+(13047.212165726771/X0))+7115.0609430628401)+108.38084799351319) |
* обеспечиваемая полученной функциональной зависимостью сумма квадратов отклонений между рассчитанным и фактическим значениями.
С практической точки зрения, соответствие между единицами измерений для функциональных зависимостей (Y) и значениями вектора X=(Х0, Х1) обеспечивается тем, что подобные преобразования осуществляются при помощи найденных предлагаемым в заявке способом значениями статистических коэффициентов. Данная особенность иллюстрируется примером формирования функциональных зависимостей с уровнями сложности 1 и 2, которые могут быть записаны в виде:
где – стоимость пуска ракеты космического назначения (РКН), млн. долл.;
– выводимая масса полезной нагрузки (ПН) на НОО, размерность которой – кг.;
– статистический коэффициент, выраженный в (млн. долл.) на один килограмм полезной нагрузки, характеризующий удельную стоимость выведения ПН.
С экономической точки зрения, данная формула вида (1) полностью соответствует существующему в ракетно-космической отрасли методическому подходу к укрупненной оценке стоимости оказания пусковых услуг, которая активно используется при сравнении конкурентоспособности отечественных и зарубежных средств выведения /1, 2/.
где – стоимость пуска РКН, млн. долл.;
– масса РКН, выраженная в кг;
– статистический коэффициент, выраженный в (млн. долл.) на один килограмм РКН, характеризующий удельную стоимость производства и эксплуатации РКН.
Кроме того, с экономической точки зрения, выражения (1) и (2) соответствуют рекомендованным к использованию ФГУП «Организация «Агат» укрупненным соотношениям, которые приняты к использованию при планировании ценообразования на производство и эксплуатацию средств выведения (СВ). При этом необходимо отметить, что существующие отклонения в значениях статистических коэффициентов и
от приведенных в нормативно-правовых документах объясняются использованием в рассматриваемом модельном примере данных не только по российским средствам выведения, но также и по зарубежным СВ.
Таким образом, предлагаемый способ поиска и восстановления функциональных зависимостей характеризуется следующей новизной и практической значимостью:
Полученные в ходе поиска функциональные зависимости с уровнем сложности до 5-го уровня включительно коррелируются по своей структуре с принятым в ракетно-космической отрасли укрупненным подходом, который предусматривает использование при распределении финансовых средств по государственному заказу методов линейного регрессионного анализа.
Получаемые далее соотношения функциональных зависимостей (например, по уровню сложности 13) демонстрируют переход к таким функциональным зависимостям, которые наиболее полно соответствуют академическим исследованиям, а также зависимостям, которые на практике используют при проектировании средств выведения конструкторские бюро предприятий и организаций Государственной корпорации «Роскомос».
Возможность практической реализации представленного способа и его технической реализации, т.е. возможность ее промышленного применения, подтверждается следующими факторами. Общая структура реализации подобных систем известна из прототипа (патент G06N 3/08 от 10.01.2014). Остальные блоки, входящие в состав заявленного «Способа поиска и восстановления функциональных зависимостей», относятся к классам устройств, для которых известны правила и методы, с помощью которых они могут быть получены по предъявляемым к ним требованиям Заказчика, а именно:
- сервер очередей (1) может быть реализован по предъявляемым к нему требованиям в соответствии с известными правилами и методами, описанными: Дюбуа, Поль «MySQL, 2-e издание». Издательский дом: «Вильяме», 2004. – с. 697-719;
- блоки генератора (2) и транслятора функций (4) могут быть реализованы по предъявляемым к ним требованиям по известным правилам и методам, описанными: Ахо, Сети Р., Ульман Дж. «Компиляторы: принципы, техника реализации и инструменты». 2-е изд. Издательский дом «Вильяме», 2003. – с. 22-41;
- блок оптимизатора статистических коэффициентов (5) представлен в источнике: Е.В. Алексеева, О.А. Кутненко, А.В. Плясунов «Численные методы оптимизации». Министерство Образования Российской Федерации. Новосибирск, 2008. – с. 4-120;
- объектная машина (6) может быть получена по предъявляемым к ним требованиям по известным правилам и методам, описанными в Ахо, Сети Р., Ульман Дж. «Компиляторы: принципы, техника реализации и инструменты». 2-е изд. Издательский дом «Вильяме», 2003. – с. 22-41.
Список использованных источников
Министерство экономического развития. Приказ от 2016 г. №.423 «Об утверждении методических рекомендаций по разработке, корректировке, мониторингу среднесрочного прогноза социально-экономического развития Российской Федерации и о признании утратившим силу приказа Минэкономразвития России от 30 ноября 2009 г. № 492».
Министерство экономического развития. Приказ от 2 октября 2013 г.№567. «Об утверждении методических рекомендаций по применению методов определения начальной (максимальной) цены контракта, цены контракта, заключаемого с единственным поставщиком (исполнителем)».
1. Способ поиска и восстановления функциональных зависимостей показателей и параметров изделий ракетно-космической техники, заключающийся в генерировании математически корректных формул на основе экспертной информации и исходных статистических данных об изделиях ракетно-космической техники в виде векторов с численной оптимизацией статистических коэффициентов, отличающийся тем, что сигналы, характеризующие исходные статистические данные об изделиях ракетно-космической техники в виде векторов из сервера очередей подают на вход генератора функций, обеспечивая инициализацию значений исходной функции, а выходной сигнал генератора функций в виде множества формул направляют через компилятор математических выражений в оптимизатор статистических коэффициентов, обеспечивая поиск наилучшего набора статистических коэффициентов путем сравнения сигналов, характеризующих расчетные и эталонные данные, для чего выходной сигнал оптимизатора статистических коэффициентов подают на второй вход генератора функций, получая сигнал отклонения, который используют для формирования новой функциональной зависимости.
2. Устройство поиска и восстановления функциональных зависимостей показателей и параметров изделий ракетно-космической техники, содержащее оптимизатор статистических коэффициентов, выполненный в виде генератора псевдослучайных чисел и выполняющий экспертную функцию, сервер очередей в виде базы данных, отличающийся тем, что содержит генератор функций, имеющий два входа, оптимизатор функций, в состав которого кроме оптимизатора статистических коэффициентов входят компилятор математических выражений в объектный код и объектная машина, при этом вход объектной машины соединен с выходом оптимизатора статистических коэффициентов, вход которого связан выходом компилятора математических выражений в объектный код, выход оптимизатора функций связан со вторым входом генератора функций, а первый вход генератора функций связан с выходом сервера очередей.