Система для работы с интеллектуальной электронной книгой - элингой - носителем знаний

 

Полезная модель направлена для обеспечения ускоренного доступа к знаниям массового пользователя. Указанный технический результат достигается прямым моделированием по предложениям и интеграцией знаний, находящихся в моделях исходных текстов, причем дублирования знаний нет. Попутно решается проблема синонимов, омонимов, диалектных слов, фразеологизмов за счет предварительного моделирования знаний экспертом-редактором. Используемая модель знаний в базе знаний включает все идентификаторы, где моделируемые предложения встречаются. При логическом выводе на выходе выдается связный текст, который в исходных текстах не существует, причем пользователь может свободно двигаться по всему полю знаний, имеющимся в исходных текстах. При этом результат может получаться с максимальным уровнем достоверности. С целью защиты базы знаний и машины логического вывода от несанкционированного копирования элинги используются специальное устройство считывания и щифрование базы знаний и машины логического вывода.

1. Область техники, к которой относится полезная модель

Полезная модель относится к компьютерным системам, использующим модели, основанные на знаниях, а именно к системам, синтезирующим интеллектуальные решения и новые знания по запросу пользователя.

2. Уровень техники 1 аналог

Известна компьютерная система «Изобретающая машина» для решения изобретательских задач, см. Конспект научно-практической конференции «Теория и практика обучения техническому творчеству» Миасс, 23-27 мая 1988 г. ПРОЕКТ "ИЗОБРЕТАЮЩАЯ МАШИНА". Современное состояние и реальные перспективы. В.М.Цуриков, 1988 г. Последний вариант системы известен как Invention Machine Goldfire. См. информационный буклет «Invention Machine Goldfire. Data sheet/». 2009.

Используется в компьютерной системе - компьютер -машиночитаемый носитель - программное средство (ПС) - пользователь для решения интеллектуальных задач для одного направления - решения технических задач. Представляет собой гибридную экспертную систему (ЭС) с использованием моделей знаний, объединенных в базу знаний имеющей машину логического вывода. Имеется возможность искать подходящие документы по запросам на основе семантического анализа, как в локальных базах данных (БД), так и в сети Интернет.

«Изобретающая машина» обладает знаниями (и выдает ответы) в своей части превосходящие знания наиболее квалифицированных специалистов. В ней содержатся мощные информационные базы - технических спецэффектов из разных областей знаний, каталог методов решения задач, используются некоторые расчетные модели, в частности, функционально-стоимостного анализа. Некоторые из этих баз построены с использованием моделей знаний, в частности семантических сетей, продукционных моделей и моделей «субъект - акция - объект» (САО-модели). Также применяются визуальные и графические образы -графики, изображения, чертежи для повышения эффективности работы, подключенные к некоторым моделям знаний.

Поставляется пользователю на стандартных машиночитаемых носителях, защищенных от копирования кодами доступа. Поскольку нет массовой продажи, нет необходимости в специальных устройствах чтения машиночитаемых носителей и специальных средствах для их защиты.

Традиционно подобные системы продаются на машиночитаемых носителях, которые для эксплуатации подключаются к компьютерам через устройства считывания. При работе ядро ПС считывается в компьютер и работа выполняется в оперативной памяти компьютера с подкачкой объемов информации с машиночитаемого носителя.

Недостатки системы заключаются в следующем:

- сфера применения узкоспециальная;

- ограниченные возможности получения новых знаний;

- имеются возможности несанкционированного копирования ПС и информации непосредственно из оперативной памяти компьютера;

- обработке больших объемах информации происходят постоянные потери времени на подкачку информации с машиночитаемого носителя;

- кроме того «Изобретающая машина» работает только в рамках технологии ТРИЗ (теория решения изобретательских задач) для нахождения новых технических решений на собственных информационных базах - базах знаний и БД;

- не предназначена для нахождения уже известных и отработанных технологий, поскольку для этих целей нужны иные базы знаний.

2 аналог

Электронная книга по заявке US 2008/0076103.

Компьютерная система состоит из портативного компьютера со стандартным набором устройств, в частности, дисплея (с применением двух экранов), устройства печати, устройств для воспроизведения звука, клавиатуры, центрального процессора с оперативной памятью, устройства считывания машиночитаемых носителей, машиночитаемых носителей с ядром ПС, которое управляет работой системы, переводчиком, и системой записи текстов на машиночитаемые носители и воспроизведения для пользователя, в т.ч. с переводом. При этом также запоминаются графические и визуальные образы совместно с текстом. Также применяется звуковой вариант воспроизведения. Тексты запоминаются в БД на машиночитаемом носителе в исходном формате.

Недостатки системы заключаются в следующем:

- поскольку текстовых документов много и число их постоянно растет, в т.ч. во многих узких предметных областях, знания в них дублируются, вплоть до простого дублирования исходных текстов, а технические возможности ограничены, то подобное устройство не решает проблему в принципе, лишь помогая немного пользователю, в частности, в дороге;

- проблема анализа исходных текстов и знаний, содержащихся в них, поиск связей между ними остаются полностью за пользователем;

- не может находить решения для пользователя, из анализа имеющихся больших информационных баз;

- не имеет особых специальных возможностей для защиты информационных баз на машиночитаемом носителе.

3 аналог, который является прототипом.

К предлагаемой полезной модели наиболее близка система семантического анализа и отбора документов со способностью получения знаний, DOCUMENT SEMANTIC ANALYSIS/SELECTION WITH KNOWLEDGE CREATIVITY CAPABILITY пат. US 2001/0014852. Система состоит из компьютера, машиночитаемого носителя знаний, устройства считывания, средства связи с локальными сетями и Интернет и машины логического вывода в виде отдельного семантического процессора. Последний включает блок подготовки текстов для моделирования, блок получения анализируемых САО-структур, блок синтеза ключевых слов/фраз для рефератов на естественном языке, блок синтеза рефератов, а также, блок базы знаний для САО-структур, блок БД исходных текстов, блок БД обобщений текстов на естественном языке, блок БД новых концептов на естественном языке, блок БД ключевых слов и фраз для рефератов.

Пользователь, используя принятые термины, вводит в систему запросы с клавиатуры компьютера. Система моделирует запросы пользователя в виде САО-структур с выделением ключевых слов и фраз, на основе которых в локальных БД и Интернет подбирает подходящие исходные тексты-кандидаты. В текстах-кандидатах также выделяются С АО-структуры. Если они соответствуют САО-структурам запросов пользователя, то тексты-кандидаты запоминаются для просмотра в БД текстов на естественном языке. Тексты-кандидаты, не имеющие запрашиваемых САО-структур удаляются. На основе наиболее частых ключевых слов, фраз и грамматических правил составляются рефераты отобранных текстов. Имеется возможность синтеза новых концептов знаний на основе синтеза подобранных САО-структур с учетом словарей синонимов компонентов САО-структур.

Недостатки последней системы заключаются в следующем:

- при каждом запросе пользователя система последовательно рассматривает весь объем доступных текстов во внешних и внутренних сетях, без исключения повторов или весьма похожих источников. Последовательный перебор всех текстов требует значительных затрат машинного времени;

- возможности системы ограничены доступными источниками, а в ряде областей знаний тексты на бумажных носителях, слишком велики, засекречены или продаются по высокой цене;

- разбиение предложений исходных текстов на САО-структуры приводит к разрыву весьма сложных семантических структур которые присутствуют внутри предложений и разделов текста. Попытка нового синтеза на их основе приведет во многих случаях к утере исходного семантического смысла;

- система удовлетворительно синтезирует рефераты, но синтез новых концептов знания достигается лишь в редких случаях;

- при получении САО-структур не решается задача выделения синонимов, фразеологизмов, метафор, профессиональных и заимствованные слов, неологизмов, диалектизмов, архаизмов, которые также имеют семантический смысл;

- отсутствует оценка уровня соответствия удаляемых текстов-кандидатов. Достаточно одного не очень удачного или нового термина, и исходный текст, содержащий необходимую информацию, будет снят с рассмотрения;

- система применяется только подготовленным экспертом-пользователем. Корректность САО-структур и достоверность рефератов, подготовленных без участия эксперта, остается неподтвержденной.

3. Раскрытие полезной модели

Предлагаемая полезная модель решает задачу предварительной систематизации знаний и данных на специальном машиночитаемом носителе, выполненном в виде интеллектуальной электронной книги ИЭК). ИЭК готовится группой экспертов-редакторов в отдельной области знаний, на основе опубликованных печатных изданий, а также других достоверных источников информации. В отличие от печатных изданий и их электронных версий, ИЭК читается только в компьютерной системе, способна распознавать вопросы пользователя и синтезировать достоверные ответы, которые могут не содержаться в исходных источниках. Для ИЭК, располагающих такими возможностями, далее по тексту применяется термин «элинга». Полезная модель также решает задачу повышения эффективности семантического анализа, повышения достоверности результатов, улучшения защиты элинг от незаконного копирования, а также повышения скорости нахождения обоснованных решений.

Технический результат от использования полезной модели заключается в создании и использовании - элинги, как доступного продукта массового спроса, содержащего систематизированные знания и способного формулировать новые знания по запросам пользователей. Централизованное создание и тиражирование элинг - носителей знаний обеспечивает их умеренную стоимость и доступность широкому кругу пользователей.

Полезная модель реализуется компьютерной системой (фиг.1), которая состоит из компьютера 1, связаного с устройством считывания элинги 2, имеющей разъем 3. Пользователь 4 имеет доступ к элинге и результатам работы с ней через технические возможности компьютера 1. Машиночитаемый носитель 5 с элингой подключается к устройству считывания элинги через свой разъем 6 (фиг.2).

На машиночитаемом носителе 5 находятся шифратор/дешифратор 7, блок распределения заданий 8, блок машины логического вывода 9, блок базы знаний 10, блок ввода знаний 11, блок БД словарей 12 (здесь содержатся словари терминов, отношений, качественных признаков, количественных признаков, лингвистических и логических связей (все с их синонимами), вместе со словарем введенных исходных текстов), блок графических и визуальных образов 13, блока рабочей части диалога 14, блока сохраненной части диалога 15.

Физически элинга представят собой - машиночитаемый носитель 5 с блоками, реализованными на базе электронных компонентов. Функционирует только в рамках компьютерной системы на базе компьютер 1 для работы с машиночитаемым носителем 5 с элингой.

Базовые режимы работы элинги 16 представлены на фиг.3. Основные два - режим ввода знаний 17 и режим рабочий 18. В состав рабочих режимов 19 входят режим вывода текстов 19, режим работы с диалогом 20 и режим логического вывода 21. В свою очередь, в режим вывода текстов 19 входят режим вывода исходных текстов 22 и режим когезии 23.

В режиме работы с диалогом 20 возможен также переход к режимам вывода исходных текстов 22 и режиму когезии 23.

Режим ввода знаний 17 резко отличается от прототипа. В прототипе он один из текущих оперативных режимов работы компьютерной системы. В настоящем изобретении ввод знаний резко отделена от оперативной работы пользователя 4. Ввод знаний в режиме ввода знаний 17 производит, как минимум, один (может быть более) подготовленный эксперт-редактор 4, который у производителя элинги заполняет блок базы знаний достаточно долго, но качественно,

А оперативная работа пользователя 4 уже происходит быстро без дополнительных потерь времени на преобразования исходных текстов, баз знаний, поиска исходных текстов во внешних БД и каких-то их отборов, как в прототипе. А именно скорость в оперативной работе и качественный результат одно из главный требований пользователя к компьютерной системе, в т.ч. при работе со знаниями.

Режим ввода знаний 17 происходит через блок ввода знаний 11 в блок базы знаний 10, блок БД словарей 12, блок графических и визуальных образов 13.

Сам ввод знаний в элингу в режиме ввода знаний 17 производится экспертом-редактором 4 следующим образом.. Имеется множество специально подобранных исходных текстов определенной предметной области, они разбиваются на простые предложения преимущественно длиной 3-15 слов. Это простые предложения превращаются в специальные модели знаний - молинги, имеющие следующую структуру (табл.1)

Табл.1
Код1Код 2 Код3Код 4 Код 5Код 6
Множество идентификаторовУсловие применимости ядра молингиЯдро молингиПоследовательность номеров словарей Уровень достоверности Постусловия молинги

простых предложениймолинг

Они не только ускоряют и упрощают моделирование знании из исходных текстов, в частности, по сравнению с САО-структурами у прототипа, но и значительно упрощают получение результатов логического вывода для элинги, позволяя выдавать пользователю 4 связный осмысленный текст, весьма удобный для чтения и понимания.

Код 1 - это множество идентификаторов, с помощью которого данная молинга выделяется из всего множества молинг, хотя для некоторых молинг они могут быть и одинаковы (поскольку находятся в одном абзаце исходного текста). В качестве идентификатора выступает составной номер, включающий номер ссылки на текст в словаре исходных текстов (обозначим код 1.1), номер главы (код 1.2), номер параграфа внутри конкретной главы (код 1.3) и номер абзаца внутри конкретного параграфа (где молинга находится - код 1.4). Заголовок параграфа имеет код абзаца равный нулю. Каждый идентификатор молинги, в целом, имеет вид -

код 1.1. код 1.2. код 1.3. код 1.4;

Указываются все идентификаторы для этой молинги всех исходных текстов (или разделы внутри них), где встречались одинаковые знания.

Код 2 - это условие применимости ядра молинги. Обычно представляет собой логическое выражение. Когда оно принимает значение «истина», ядро молинги активизируется.

Код 3 - основным элемент молинги - ядро молинги. Ядро молинги вводится после обработки экспертом-редактором простых и сложных предложений (которые превращает в простые) исходных текстов. При вводе ядер молинг выявляются и вводятся в состав словаря терминов (обозначаемый 1), находящегося в блоке БД словарей 12, - все термины, их синонимы, фразеологизмы, метафоры, профессиональные слова, заимствованные слова, неологизмы, диалектизмы, архаизмы. В молинги вводятся, в основном, базовое значение терминов (определяемое экспертом-редактором). Соответственно таким же образом при вводе ядер молинг выявляются и вводятся в состав словаря отношений (обозначаемый 2), находящегося в блоке БД словарей 12, - все отношения с их синонимами. Так же при вводе ядер молинг выявляются и вводятся в состав словаря качественных признаков (обозначаемый 3), находящегося в блоке БД словарей 12, - все качественные признаки с их синонимами, в состав словаря количественных признаков (обозначаемый 4), находящегося в блоке БД словарей 12, - все количественные признаки с их синонимами, в состав словаря лингвистических и логических связей (обозначаемый 5), находящегося в блоке БД словарей 12, - все лингвистические и логические связи с их синонимами.

В коде 4 указаны последовательность номеров словарей, фиксирующих положение слов и элементов простых предложений в ядре молинги последовательностью номеров словарей терминов, отношений, качественных признаков, количественных признаков или лингвистических и логических связей.

В коде 5 указываются уровни достоверности молинг в виде факторов уверенности, впервые примененных в ЭС MYCIN.

В коде 6 описываются постусловия молинги. Они актуализируются только в том случае, если ядро молинги реализовалось, в т.ч. и ничего не делать (если код 6 равен нулю). Постусловия молинги описывают действия и процедуры, которые необходимо выполнить после реализации ядра молинги. В их числе может быть - переход к другой молинге или актуализация визуальных или графических образов из блока визульных и графических образов 13.

Фиксация элементов ядра молинги последовательностью номеров словарей, фиксирующих положение слов и элементов простых предложений означает фиксацию представления ядра молинги в виде короткой семантический сети. В результате блок базы знаний 10 содержит большой набор коротких семантических сетей. Далее процедура происходит в соответствии с фиг.4.

Имеются, например, исходные тексты 1,2,, n - блоки 24, 25, 26, которые предполагается ввести в блок БЗ 10 элинги. Ввод производится в рамках компьютерной системы, представленной на фиг.1. Тексты разбивается на простые предложения и привязанные к ним расчетные модели и визуальные и графические образы. Простые предложения превращаются в молинги, а тексты в модели текстов (фиг.4, блоки - 27, 28, 29), с кодированием порядка элементов в ядрах молинг с занесением соответствующих элементов в блок БД словарей 12, если они или их синонимы в словарях отсутствуют. При моделировании эксперт-редактор задает значение уровня достоверности в виде фактора уверенности со значениями в пределах от -1 (совершенно недостоверная) до+1 (полностью достоверная).

Визуальные и графические образы привязываются в качестве постусловий к молингам и заносятся непосредственно в блок визуальных и графических образов 13.

На фиг.4 показано на первом этапе в исходных текстах 1,2,, n (блоки 24, 25, 26) по 6 простых предложений. На втором этапе (блоки 27, 28, 29) после моделирования в модели текста 1 (блок 27) - 6 молинг, а во второй группе моделей текста 2,, n (блоки 28, 29) уже по пять. Это связано с тем, что если предложения или их синонимические представления являются повторами и находятся в том же абзаце, то они повторно не вводятся. Также не вводятся предложения, которые с точки зрения эксперта-редактора 4 не имеют значения для ввода.

Затем молинги (с их базовыми идентификаторами, определяющие их положение в исходном тексте) вводятся в базу знаний элинги, находящейся в блоке базы знаний 10 по порядку ввода исходных текстов, определяемый экспертом-редактором 4. Если ядра молинг одинаковы или синонимичны той молинге, которая уже находится в блоке базы знаний 10, то добавляется ее идентификатор в множество идентификаторов данной молинги. Подобное построение базы знаний обеспечивает декларативный подход к моделям знаний. На первом этапе в исходных текстах на фиг.3 было 18 простых предложений в блоке базы знаний 10 их уже всего восемь.

Известно - знания в исходных текстах повторяются. При вводе знаний в виде моделей знаний в блок базы знаний элинги 10, делаются пометки (идентификаторы) из какого исходного текста ввод. Повторение знаний, имеющихся в базе знаний повышает их достоверность (пометки дублированных знаний из разных источников в виде набора идентификаторов сохраняются). А то чего нет, - вводится и увеличивает объем базы знаний. Т.е. с каждым новым исходным текстом, база знаний представляет собой новую версию, монотонно возрастающую в объеме.

Т.е. база знаний элинги представляет собой постепенно увеличивающуюся «паутину» - все более расширяющуюся и сгущающуюся в местах «горбов» знаний, где они или полностью оказываются дублированными (указывается только еще один их новый идентификатор) или все более уточняют эту фокусную область знаний конкретной предметной области. Этот и есть «эффект гребня»

Такое построение базы знаний обеспечивает возможность вывода необходимого источника в виде близком к исходному тексту, достаточно задать номер исходного текста из словаря введенных исходного текстов.

Режим логического вывода 21 реализуется машиной логического вывода 9 с участием блока базы знаний 10 и блока рабочей части диалога II, - приведен на фиг.5.

Машина логического вывода 9 выполняет две функции:

- просмотр существующих фактов (у нас - терминов) из рабочей памяти 30 машины логического вывода 9 и молинг из блока базы знаний 10 и добавление (при возможности) в рабочую память 30 новых терминов (для вывода);

- определение порядка просмотра и применения молинг. Этот механизм управляет процессом вывода, сохраняя для пользователя информацию о полученных заключениях в блоке рабочей части диалога 14.

Логический вывод основан на правиле modus ponens, - «если известно, что истинно утверждение А и истинно правило вида «ЕСЛИ А, ТО В», тогда утверждение В также истинно». Применительно к молингам, которые представимы короткой семантической сетью в виде связанного графа (где вершинами являются термины из блока БД словарей 12), оно имеет вид, - «если имеет место определенный уровень истинности утверждения (термина) А и существует цепь в молинге, связывающая А с утверждением (термином) В, то имеет место определенный уровень истинности (достоверности) утверждения (термина) В». Этот уровень достоверности определяется уровнем достоверности (код 5) молинги.

Пример вывода показан на фиг.6. Предположим, пользователь задал запрос - найти связь между двумя разными терминами - термин 1 и термин9. Ищется на основе прямого вывода с ограниченным перебором (с количеством промежуточных терминов не более шести). Вводится вначале исходный термин 1, ищется какая-то первая молинга с ядром молинги, где есть термин 1 (или его синоним) и термин9 (или его синоним) одновременно. Если находится, то вводится в блок рабочей части диалога 14, где выстраиваются по мере уменьшения уровня достоверности найденных молинг. Если не находится, ищется некая (i-я) молинга с термин 1 с самым высоким уровнем достоверности и есть другие термины. Молинга срабатывает и выбираются другие термины, находящиеся в молинге для дальнейшего поиска, - это термины - термин 2 и термин 3. Вначале ищется цепочка связи с термин 9 по первому термин 2 (и его синониму), выбирается (i+k) -я молинга, в ней ищется следующий ближайший термин - терминб. Ищется следующая молинга, имеющая терминб (или его синоним) и термин9, и она находится (i+k+r) -я молинга. Результат вывода - последовательность молинг с порядковыми номерами (i), (i+k) (i+k+r) помещается блок рабочей части диалога 14.

Машина логического вывода должна функционировать даже при недостатке информации. Полученное решение может и не быть точным, однако система не должна останавливаться из-за того, что отсутствует какая-либо часть входной информации.

Машина логического вывода определяет порядок применения правил и выполняет четыре функции (см. фиг.5.)

1. Сопоставление (блок программы 31 машины логического вывода 9) - выбранная молинга сопоставляется с имеющимися терминами, выбранные поступают в конфликтное множество - блок программы 32.

2. Выбор (блок программы 33) - если в конкретной ситуации может быть применено сразу несколько молинг, то из них выбирается одна, наиболее подходящее по заданному критерию выбора молинг (блок программы 34) и происходит разрешение конфликта. Этим критерием является более высокий уровень достоверности и при равных величинах - первая по порядку.

3. Срабатывание (блок программы 35) - если молинга при сопоставлении совпала с какими-либо терминами из блока рабочей части диалога 14, то молинга срабатывает.

4. Действие (блок программы 36) - блок рабочей части диалога 14 подвергается изменению путем добавления в него сработавшей молинги и новых терминов для дальнейшего вывода. Если в правой части молинги содержится указание на какое-либо действие -постусловие, то оно выполняется.

Машина логического вывода 9 циклична. В каждом цикле просматриваются молинги, чтобы выявить те, где термины совпадают с известными на данный момент терминами из блока рабочей памяти 30 (кроме уже просмотренных). После выбора (блок программы 33) молинга срабатывает, и новый термин заносится в блок рабочей части диалога 14 для дальнейшего вывода, и цикл повторяется.

В одном цикле может сработать только одна молинга. Если несколько молинг успешно сопоставлены с терминами, то машина логического вывода 9 производит выбор по заданным критериям единственной молинги, которая срабатывает в данном цикле.

В режиме работы с диалогом 20, реализуемым блоком рабочей части диалога 14, всю необходимую информацию выдают пользователю 4 через компьютер 1. Пользователю 4 поступают по группам все последовательности логического вывода ядер молинг с номерами (i), (i+k), (i+k+r) разной длины в порядке убывания уровня достоверности (код 5) при заданном запросе для вывода на основе термин 1 - термин9.

Уровень достоверности последовательности молинг упосл рассчитывается следующим образом.

Пусть

у; - уровень достоверности в виде фактора уверенности в пределах от - 1 до 1 для начальной i-й молинги (где 1i,n);

Уi+k - уровень достоверности в виде фактора уверенности в пределах от - 1 до 1 для некоторой промежуточной i+k -и молинги (где 1<k<n);;

yi+k+r - уровень достоверности в виде фактора уверенности в пределах от -1 до 1 для некоторой конечной i+k+r -и молинги (где i+k<r<n - (i+k));. Тогда

Упосл =П уi х х yi+k х х yi+k+г если все у;, y,+k, y;+k+r>0 (1)

1 $iSn, Kk<n,i+k<r<n-(i+k)

Если какое-то из значений у;, y;+k, yi+k+r окажется<0, то и все значение Упосл указывается сразу равным=0 без дальнейшего расчета. Пользователь, читая последовательность этих ядер молинг, а фактически это группы последовательностей простых предложений, семантически связанных между собой, сам решает, удовлетворяет его этот результат -текст или нет. Выбирает необходимую ему группу (или группы) и фиксирует ее (или их) в блок сохраненной части диалога (вместе с терминами запроса) 15, вместе с со всеми результатами постусловий при запуске визуальных и графических образов из блока визуальных и графических образов 13. Если ответ его полностью не устраивает, пользователь имеет возможность или снова повторить логический вывод (режим логического вывода 21) с новыми вариантами запроса (с новыми терминами для логического вывода) или по какому-то ядру молинги запустить режим когезии 23 (локальной связанности текста относительного конкретного исходного текста (одного из используемых для конкретной молинги идентификаторов исходного текста, соответствует абзацу исходного текста) на небольшом расстоянии от исходного предложения) или когерентности (глобальной связанности текста через одинаковые термины (заголовки), относительного конкретного упомянутого и выбранного исходного текста из нескольких идентификаторов),

Режим когезии 23 обеспечивает вывод в блок рабочей части диалога 14 из блока базы знаний 10 последовательностей ядер молинг, имеющих, как минимум, один идентификатор, соответствующий заданному пользователем (через представленному ему перечню исходных текстов, их глав, параграфов из словаря введенных исходных текстов из блока БД словарей 12). Вывод ядер молинг в режиме когезии при одинаковом идентификаторе соответствует выводу абзаца исходного текста (блоки 24 или 25 или 26). Запрос пользователя о выводе всего исходного текста, соответствующего интересующему его ядра молинги (простого предложения) соответствует использованию эффекта когерентности исходного текста или режима вывода исходного текста 22. Объем может задаваться пользователем 4 - или в объеме параграфа, или в объеме главы, или в объеме всего исходного текста со всеми главами и параграфами.

Весь необходимый пользователю текст, который оказался необходим пользователю и полученный им в режиме работы с диалогом 20 в блоке рабочая часть диалога 14, может быть сохранен пользователем в блоке сохраненной части диалога 15. Причем блоки исходного текста (в виде последовательностей ядер молинг), полученных в режиме когезии 23, могут непосредственно в блоке сохраненной части диалога 15 запоминаться, а также полученные в режиме вывода исходных текстов (обеспечения когерентности) 22, только с указанием выделенных пользователем необходимых идентификаторов.

В дальнейшем при работе пользователя с блоком сохраненной части диалога 15 необходимые последовательности ядер молинг будут подгружаться в блок сохраненной части диалога 15 из блока базы знаний 10, также как и необходимые визуальные и графические образы из блока 13. Соответственно, все это будет выводиться по запросу пользователя в компьютер 1 для пользователя.

Режим вывода текстов 22 может задаваться пользователем через блок распределения заданий 8. Последний активизирует блок рабочей части диалога 14 и по запросу пользователя производится вывод из блока базы знаний 10 тех или иных исходных текстов в виде последовательности ядер молинг по подобранным идентификаторам, начиная с одинакового номера ссылки в словаре исходных текстов в коде 1. Все это передается в компьютер 1 для пользователя.

Подробнее программная реализация режима вывода текстов 22 и режима когезии 23 в машине логического вывода 9 рассмотрены на фиг.7.

В режиме когезии 23 пользователь при работе с результатами, выдаваемыми элингой в блок рабочей части диалога 14, может выбрать интересующее его простое предложение (ядро некоторой молинги) и для уточнения выбрать поясняющий абзац, выбрав один из идентификаторов молинги, в виде - код 1.1.код 1.2. код 1.3. код 1.4. Он поступает в машину логического вывода 9 в блок программы 37, а из него в блок программы 38, который ищет все молинги, находящиеся в блоке базы знаний 10 с заданным идентификатором. Если молинга найдена, то блоком программы 39 копия молинги отправляется в блок рабочей части диалога 14, если "нет" - проверяется блоком программы 40 все ли просмотрено. Если "нет", просмотр продолжается, если "да", то проверяют в блоке программы 41 -это был запущен режим когезии 23 или нет.Если "да", то сообщают в блок рабочей части диалога 14, что задание выполнено.

Если "нет", то - машина логического вывода 9 инициирована или блоком распределения заданий 8 или блоком рабочей части диалога 14 (в обоих случаях пользователем) в режиме вывода исходных текстов 22.

Режим пт.ттюпя исхпдт.ту тр.кстлт» 9.9. чядяотся или г-п бпокя распределения заданий 8 или блока рабочей части диалога 14. В блок программы 42 машины логического вывода 9 в виде запроса текста который надо вывести - код 1.1.х.х.х, т.е. надо вывести весь текст близкий к исходному тексту, который содержится в блоке базы знаний 10 в форме молинг. Кол 1.1 соответствует номеру исходного текста из словаря исходных текстов, который находится в блоке БД словарей 12..Возможны варианты задания в виде код 1.1.код 1.2.х.х, когда задается вывод только конкретной главы конкретного исходного текста, и код 1.1.код 1.2.код 1.3.х - когда задается вывод только конкретного параграфа конкретной главы.

Поиск молинг начинается с задания поиска главы с номером 1 в виде задания код 1.1.х.х.х=код 1.1.1.х.х. Задается начальный код параграфа, который ищется с номером 1 в виде

код 1.1.х.код 1.3..х=код 1.1.x.1.x в блоке программы 43.

Далее задается начальный номер абзаца с номером 0 (это - заголовок) в начальном параграфе начальной главы в блоке программы 44 в виде код 1.1.х.х.х=код 1.1.х.х.О.

И затем начинается поиск молинг для 0-го абзаца. Дальше все проходит, как и в режиме когезии 23. Если в блоке программы 41 идет выход "нет", то происходит переход к блоку программы 46, в котором определяется все ли абзацы в параграфе просмотрены. Если выход блока программы 46 -"нет", то в блоке 47 увеличивается номер кода для поиска нового абзаца

код 1.1.х.х.код1.4=код 1.1.х.х. (код 1.4+1).

Если в качестве выхода блока программы 46 используется "да", то идет переход к блоку программы 48. При этом проверяются все ли номера параграфов просмотрены; если "нет", то идет присвоение нового номера параграфа в блоке программы 49 в виде

кол 1.1.х.код1.3.х=код 1.1.х.(кол1.3+1).х и далее по циклу.

Если в блоке программы 48 был выход "да", то означает, что просмотрены все параграфы заданной главы заданного исходного текста и идет переход к блоку программы 50. Если из него выход "нет", т.е. не просмотрены все главы заданного исходного текста, то номер главы в блоке программы 51 увеличивается

код 1.1.код1.2.х.х=код 1.1.(код 1.2+1).х.х.

Если выход из блока программы 50 "да", то это означает, что все молинги данного номера текста с кодом код 1.1. выбраны и отправлены в блок рабочей части диалога 14. При этом происходит возврат к блокам распределения заданий 8 или блоку рабочей части диалога 14 с сообщением, что задание по блоку 42 закончено.

Для снижения опасности копирования элинг и времени реакции на задаваемые вопросы (в процессе эксплуатации) используется специальное устройство считывания эллинг 2 для запуска машиночитаемых носителей 5 сэлингами и специальные методы защиты машиночитаемых носителей,

- как механическим путем, программным, так и организационным. А именно:

- с целью затруднения копирования. - машиночитаемый носитель 5 имеет механические изменения, препятствующие его считыванию на иных устройствах считывания (отличных от устройств считывания 2) - разъемы 3, 6 имеют размеры отличные от стандартных;

- все содержимое блоков на машиночитаемом носителе 5 с каждой новой версией шифруется с использованием блоков шифратор/дешифратор 7, препятствуя считыванию эллинг в т.ч. на иных устройствах считывания, отличных от устройств считывания 2;

- набор молинг в блоке базы знаний 10 каждой новой версии имеет небольшие изменения, препятствующие работу со старой машиной логического вывода 9, в частности, изменяются разделители кодов молиттг и их последовательность.

Итак, основные отличия от прототипа:

- иная техническая реализация поставленных целей, в частности, совсем иная реализация машиночитаемого носителя и его роль;

- использование объединенной базы знаний текстов; причем специально отобранных, обеспечивает более качественный отбор знаний, меньший объем объединенной базы знаний (по сравнению с традиционными системами управления знаниями), что затем приводит к резкому ускорению нахождения решений даже того же уровня и возможности «свободного плавания» по предметному «морю» знаний (объединенной базе знаний), что практически невозможно у прототипа;

- использование в качестве моделей знаний молинг приводит, по сравнению с САО-структурами, к намного более точному отражению семантики знаний уже на уровне предложений, ликвидации проблем синтеза на уровне предложений и возможности применения намного более простых и более быстродействующих методов синтезов текстов, в т.ч. реального синтеза текстов; близких к исходным текстам, что фактически на базе САО-структур в удовлетворительном варианте реализовать нельзя;

- жесткое разделение на режимы ввода знаний 17 и рабочий режим 18. причем в режиме ввода знаний 17 производителем элинг возможно медленное (казалось бы. но качественное и множеством экспертов-редакторов; причем даже параллельно) заполнение объединенной базы знаний, но в рабочем режиме 18 намного более быстрое нахождение результатов по уже находящейся в элинге объединенной базы знаний (в т.ч. не надо потерь времени на каналы передачи информации по Интернету и внутри компьютерной системы);

- более качественное нахождение результатов логического вывода-поскольку ядра молинг по сравнению с САО-структурами более качественно отражают семантическую сущность используемых элементов

Более конкретно ниже. Основными существенными признаками являются нижеследующее.

Система для работы с ИЭК - элингой - носителем знаний, состоящая из компьютера 1, устройства считывания элинги 2 и машиночитаемого носителя 5, соединяемых через разъемы 3, 6, отличающаяся тем, что на машиночитаемом носителе 5 находятся - блок машины логического вывода 9, блоком базы знаний 10, шифратор/дешифратор 7, блок распределения заданий 8, блок рабочей части диалога 14, блок сохраненной части диалога 15, блок ввода знаний 11, блок БД словарей 12, блок визуальных и графических образов 13, причем машина логического вывода 9 связана с разъемом 6 через блок распределения заданий 8 и шифратор/дешифратор 7, а также связана с блоком рабочей части диалога 14 и блоком базы знаний 10, блок распределения заданий 8 связан с блоком рабочей части диалога 14, блоком сохраненной части диалога 15 и блоком ввода знаний 11, который, в свою очередь, связан с блоком базы знаний 10, блоком БД словарей 12, блоком визуальных и графических образов 13, блок базы знаний 10 дополнительно связан с блоком рабочей части диалога 14, блоком сохраненной части диалога 15, блоком БД словарей 12, блоком визуальных и графических образов 13, который, в свою очередь, связан с блоком рабочей части диалога 14.

4. Краткое описание чертежей

Фиг.1 - обобщенная структурная схема, в которой функционирует полезная модель

Фиг.2 - структурная схема связей блоков на машиночитаемом носителе 5 Фиг.3-базовые режимы работы элинги 16 Фиг.4 - порядок семантического анализа исходных текстов и заполнения базы знаний в режиме ввода знаний 17 Фиг.5 - структура работы машины логического вывода 9 в режиме логического вывода 21

Фиг.6 - вариант логического вывода на базе знаний из молинг Фиг.7 - блок-схема программы машины логического вывода 9 и связи блоков при этом в режиме вывода исходных текстов 22 и режима когезии 23

5. Осуществление полезной модели

В принципе технология реализации полезной модели и ее использования полностью находятся в рамках создания интеллектуальных систем, в частности, ЭС, и их использования.

Однако ряд указанных технических особенностей реализации такой технологии для системы для работы с ИЭК - элингами, обеспечивают новые возможности, которые ранее были недостижимы.

Например, ЭС могут работать только в узкой области и для не слишком сложных задач, поскольку все выдаваемые результаты должны быть отлажены с участием экспертов, а базы знаний вводятся только с участием экспертов и заполняются и отлаживаются весьма медленно.

А при работе с элингой - база знаний может быть намного больше, т.е. время отладки для ЭС, с подобной базой знаний, - просто ушло бы в бесконечность. Решаемые задачи для элинги гораздо более сложные, а предметная область намного шире, - все оказывается по-иному.

Полная отладка не делается из-за отсутствия необходимости и невозможности. Используется то, что вводятся исходные тексты, уже прошедшие редактирование, экспертизу и нередко весьма тщательную (например, патенты, стандарты, учебники и т.п.). При этом отладка элинги проводится только локальная. Если возникают при вводе разные варианты молинг (разные варианты знаний), то они фиксируются, как разные, с разными уровнями достоверности, оцениваемых факторами уверенности. Способ их расчета, такой, какой применялся в 3C.MYCIN..

Остается ситуация, традиционная для чтения текстов тысячелетиями - возможны какие-то мелкие ошибки или нестыковки при подготовке текста автором или подготовке к печати. Что не мешает, как правило, восприятию текста и знаний вообще.

Если при чтении одного текста пользователь имеет дело с одним текстом, то в данном случае он имеет дело действительно фактически с «морем» знаний (присутствуют интегрированные знания из многих книг), в котором он перемещается по своему желанию. Возникает тот же эффект, который уже давно зафиксирован для гипертекстовых систем, когда пользователь имеет дело с нелинейной организацией текста. Обычный текст пользователь читает последовательно (линейно), а для гипертекстовых систем идет постоянный переход от одной частей текста к другим, в т.ч. разных источниках. В элинге это происходит в связи с логическим выводом по базе знаний элинги.

За счет использования эффектов когезии или когерентности, -связанный текст, получаемый при работе машины логического вывода элинги, представляется пользователю весьма осмысленным и связным текстом, имеющим для пользователя совершенно новое звучание. Эффекты когезии и когерентности хорошо известны в лингвистике.

Оценим размер баз знаний элинги с точки зрения реализуемости. Элинга с хорошим уровнем знаний будет иметь знания, где-то от 100 исходных текстов конкретной предметной области, например, книг.Средняя книга - объем 300 стр., средний объем страницы около 30 Кбайт, средний объем 1 рисунка (чертежа) на 1 стр.- около 70 Кбайт. Итого получается 30 Мбайт на 1 книгу или 3 Гбайта на весь объем. Однако не менее 50% знаний окажется дублированным, т.е. в разных книгах или даже разных частях одной книги совпадающим, то объем окажется уже 1,5 Гбайта. Поскольку в молинге, кроме ядра есть еще информация, а кроме того еще есть информация о кодировании структуры самого ядра, как маленькой семантической сети, то общий объем возрастает теперь в среднем в 1,5 раза, т.е. до 2,25 Гбайт. Словари терминов (и их синонимов), отношений, качественных признаков и иного, займут относительно немного места. ПС машины вывода займет не более 300 М байт. Т.о. общий объем такой элинги вполне мог бы записывается на обычный диск формата DVD объемом около 4 Гбайт или небольшую флэшку (которые имеют тоже сложную внутреннюю структуру), а тем более специально разработанный машиночитаемый носитель 5 для создания элинги.

Теперь оценим с точки зрения уровня знаний с учетом «эффекта гребня».

Предположим, около 50% молинг (полученных из отдельных предложений) находятся в достаточно широкой предметной области, а 50% сосредоточены в фокусных местах, где появились «горбы» знаний (о чем мы говорили при объяснении «эффекта гребня»). В исходном тексте -тексте- книге, предположим, на странице - 20 предложений (или получается 25 молинг - излагается исходный текст более четко).

Общее число молинг получается -100 книг х 300 страниц х 25 молинг=750000 молинг. Из них около 400000 относится к фокусным группам. Если фокусных групп около 100, в среднем по 1 на книгу, большинство из них фактически будут в первых книгах, причем некоторые из последних вводимых вообще никаких фокусных групп не добавят. У нас выходит, что, в среднем, на 1 фокусную группу приходится около 4000 молинг. Из 30-летней практики применения ЭС известно, что при увеличении базы знаний ЭС до 10000 продукционных правил (в среднем), ЭС превосходит наиболее квалифицированных специалистов по уровню выдаваемых результатов. Здесь молинги вполне можно сравнивать с продукционными правилами, они еще более мощные и гибкие средства моделирования знаний по сравнению с ними. Этот же предел в 10000 продукционных правил (как ориентировочный барьер интеллектуальности) указан в проекте создания ЭВМ 5-го поколения.

Увеличение базы знаний элинги еще в 3-4 раза, приведет к тому, что элинги в широкой предметной области способны выдавать ответы с уровнем знаний, превышающий лучших специалистов конкретных предметных областей. Заметим, что не для всех предметных областях с ходу возможно создания элинг с таким уровнем результатов.

Полезная модель реализуется компьютерной системой (фиг.1), которая состоит из компьютера 1, связанного с устройством считывания элинги 2, имеющей разъем 3. Пользователь 4 имеет доступ к элинге и результатам работы с ней через технические возможности компьютера 1. Машиночитаемый носитель 5 с элингой подключается к устройству считывания элинги через свой разъем 6 (фиг.2).

На машиночитаемом носителе 5 находятся шифратор/дешифратор 7, блок распределения заданий 8, блок машины логического вывода 9, блок базы знаний 10, блок ввода знаний 11, блок БД словарей 12 (здесь содержатся словари терминов, отношений, качественных признаков, количественных признаков, лингвистических и логических связей (все с их синонимами), вместе со словарем введенных исходных текстов), блок графических и визуальных образов 13, блока рабочей части диалога 14, блока сохраненной части диалога 15, связанные определенным образом между собой.

Физически элинга представят собой - машиночитаемый носитель 5 с блоками, реализованных на базе электронных компонентов. Функционирует только в рамках компьютерной системы на базе компьютер 1 для работы с машиночитаемым носителем 5 с элингой..

Базовые режимы работы элинги 16 представлены на фиг.3. Основные два - режим ввода знаний 17 и режим рабочий 18.

В состав рабочих режимов 18 входят режим вывода текстов 19, режим работы с диалогом 20 и режим логического вывода 21. В свою очередь, в режим вывода текстов 19 входят режим вывода исходных текстов 22 и режим когезии 23. В режиме работы с диалогом 20 возможен также переход к режимам вывода исходных текстов 22 и режиму когезии 23.

Режим ввода знаний 17 резко отличается от прототипа. В прототипе он один из текущих оперативных режимов работы компьютерной системы. В настоящем изобретении ввод знаний резко отделен от оперативной работы пользователя 4. Ввод знаний в режиме ввода знаний 17 производит, как минимум, один (может быть более) подготовленный эксперт-редактор 4, который у производителя элинги заполняет блок базы знаний 10 достаточно долго, но качественно,

А оперативная работа пользователя 4 уже происходит быстро без дополнительных потерь времени на преобразования исходных текстов, баз знаний, поиска исходных текстов во внешних БД и каких-то их отборов, как в прототипе. А именно скорость в оперативной работе и качественный результат одно из главный требований пользователя к компьютерной системе, в т.ч. при работе со знаниями.

Режим ввода знаний 17 происходит через блок ввода знаний 11 в блок базы знаний 10, блок БД словарей 12 и блок графических и визуальных образов 13.

Сам ввод знаний в элингу в режиме ввода знаний 17 производится экспертом-редактором 4 следующим образом.. Имеется множество специально подобранных исходных текстов определенной предметной области, они разбиваются на простые предложения преимущественно длиной 3-15 слов. Это простые предложения превращаются в специальные модели знаний - молинги, имеющие следующую структуру (табл.2)

Табл.2

Код 1Код 2Код 3 Код 4Код 5Код 6
Множество идентификаторов простых предложений Условие применимости ядра молинги Ядро молингиПоследовательность номеров словарей Уровень достоверности молинг Постусловия молинги

Они не только ускоряют и упрощают моделирование знаний из исходных текстов, в частности, по сравнению с САО-струтурами у прототипа, но и значительно упрощают получение результатов логического вывода для элинги, позволяя выдавать пользователю 4 связный осмысленный текст, весьма удобный для чтения и понимания.

Код 1 - это множество идентификаторов, с помощью которого данная молинга выделяется из всего множества молинг, хотя для некоторых молинг они могут быть и одинаковы (поскольку находятся в одном абзаце исходного текста). В качестве идентификатора выступает составной номер, включающий номер ссылки на текст в словаре исходных текстов (обозначим код 1.1), номер главы (код 1.2), номер параграфа внутри конкретной главы (код 1.3) и номер абзаца внутри конкретного параграфа (где молинга находится - код 1.4). Заголовок параграфа имеет код абзаца равный нулю. Каждый идентификатор молинги, в целом, имеет вид -

код 1.1.код 1.2. код 1.3. код 1.4;

Указываются все идентификаторы для этой молинги всех исходных текстов (или разделы внутри них), где встречались одинаковые знания.

Код 2 - это условие применимости ядра молинги. Обычно представляет собой логическое выражение. Когда оно принимает значение «истина», ядро молинги активизируется.

Код 3 - основным элемент молинги - ядро молинги. Ядро молинги вводится после обработки экспертом-редактором простых и сложных предложений (которые превращает в простые) исходных текстов. При вводе ядер молинг выявляются и вводятся в состав словаря терминов (обозначаемый 1), находящегося в блоке БД словарей 12, - все термины, их синонимы, фразеологизмы, метафоры, профессиональные слова, заимствованные слова, неологизмы, диалектизмы, архаизмы. В молинги вводятся, в основном, базовое значение терминов (определяемое экспертом-редактором). Соответственно таким же образом при вводе ядер молинг выявляются и вводятся в состав словаря отношений (обозначаемый 2), находящегося в блоке БД словарей 12, - все отношения с их синонимами. Так же при вводе ядер молинг выявляются и вводятся в состав словаря качественных признаков (обозначаемый 3), находящегося в блоке БД словарей 12, - все качественные признаки с их синонимами, в состав словаря количественных признаков (обозначаемый 4), находящегося в блоке БД словарей 12, - все количественные признаки с их синонимами, в состав словаря лингвистических и логических связей (обозначаемый 5), находящегося в блоке БД словарей 12, - все лингвистические и логические связи с их синонимами.

В коде 4 указаны последовательность номеров словарей, фиксирующих положение слов и элементов простых предложений в ядре молинги последовательностью номеров словарей терминов, отношений, качественных признаков, количественных признаков или лингвистических и логических связей.

В коде 5 указываются уровни достоверности молинг в виде факторов уверенности, впервые примененных в ЭС MYCIN.

В коде 6 описываются постусловия молинги. Они актуализируются только в том случае, если ядро молинги реализовалось, в т.ч. и ничего не делать (если код 6 равен нулю). Постусловия молинги описывают действия и процедуры, которые необходимо выполнить после реализации ядра молинги. В их числе может быть - переход к другой молинге или актуализация визуальных или графических образов из блока визульных и графических образов 13.

Фиксация элементов ядра молинги последовательностью номеров словарей, фиксирующих положение слов и элементов простых предложений означает фиксацию представления ядра молинги в виде короткой семантический сети. В результате блок базы знаний 10 содержит большой набор коротких семантических сетей. Далее процедура происходит в соответствии с фиг.4.

Имеются, например, исходные тексты 1,2,, n - блоки 24, 25, 26, которые предполагается ввести в блок БЗ 10 элинги. Ввод производится в рамках компьютерной системы, представленной на фиг.1. Тексты разбивается на простые предложения и привязанные к ним расчетные модели и визуальные и графические образы. Простые предложения превращаются в молинги, а тексты в модели текстов (фиг.4, блоки - 27, 28, 29), с кодированием порядка элементов в ядрах молинг с занесением соответствующих элементов в блок БД словарей 12, если они или их синонимы в словарях отсутствуют.При моделировании эксперт-редактор задает значение уровня достоверности в виде фактора уверенности со значениями в пределах от -1 (совершенно недостоверная) до+1 (полностью достоверная).

Визуальные и графические образы привязываются в качестве постусловий к молингам и заносятся непосредственно в блок визуальных и графических образов 13.

На фиг.4 показано на первом этапе в исходных текстах 1,2,, n (блоки 24, 25, 26) по 6 простых предложений. На втором этапе (блоки 27, 28, 29) после моделирования в модели текста 1 (блок 27) - 6 молинг, а во второй группе моделей текста 2,, n (блоки 28, 29) уже по пять. Это связано с тем, что если предложения или их синонимические представления являются повторами и находятся в том же абзаце, то они повторно не вводятся. Также не вводятся предложения, которые с точки зрения эксперта-редактора 4 не имеют значения для ввода.

Затем молинги (с их базовыми идентификаторами, определяющие их положение в исходном тексте) вводятся в базу знаний элинги,. находящейся в блоке базы знаний 10 по порядку ввода исходных текстов, определяемым экспертом-редактором 4. Если ядра молинг одинаковы или синонимичны той молинге, которая уже находится в блоке базы знаний 10, то добавляется ее идентификатор в множество идентификаторов данной молинги. Подобное построение базы знаний обеспечивает декларативный подход к моделям знаний. На первом этапе в исходных текстах на фиг.3 было 18 простых предложений в блоке базы знаний 10 их уже всего восемь.

Известно - знания в исходных текстах повторяются. При вводе знаний в виде моделей знаний в блок базы знаний элинги 10, делаются пометки (идентификаторы) из какого исходного текста ввод. Повторение знаний, имеющихся в базе знаний повышает их достоверность (пометки дублированных знаний из разных источников в виде набора идентификаторов сохраняются). А то чего нет, - вводится и увеличивает объем базы знаний. Т.е. с каждым новым исходным текстом, база знаний представляет собой новую версию, монотонно возрастающую в объеме.

Т.е. база знаний элинги представляет собой постепенно увеличивающуюся «паутину» - все более расширяющуюся и сгущающуюся в местах «горбов» знаний, где они или полностью оказываются дублированными (указывается только еще один их новый идентификатор) или все более уточняют эту фокусную область знаний конкретной предметной области. Этот и есть «эффект гребня»

Такое построение базы знаний обеспечивает возможность вывода необходимого источника в виде близком к исходному тексту, достаточно задать номер исходного текста из словаря введенных исходного текстов.

Режим логического вывода 21 реализуется машиной логического вывода 9 с участием блока базы знаний 10 и блока рабочей части диалога 11, приведен на фиг.5.

Машина логического вывода 9 выполняет две функции:

- просмотр существующих фактов (у нас - терминов) из рабочей памяти 30 машины логического вьюода 9 и молинг из блока базы знаний 10 и добавление (при возможности) в рабочую память 30 новых терминов (для вывода);

- определение порядка просмотра и применения молинг.Этот механизм управляет процессом вывода, сохраняя для пользователя информацию о полученных заключениях в блоке рабочей части диалога 14.

Логический вывод основан на правиле modus ponens, - «если известно, что истинно утверждение А и истинно правило вида «ЕСЛИ А, ТО В», тогда утверждение В также истинно». Применительно к молингам, которые представимы короткой семантической сетью в виде связанного графа (где вершинами являются термины из блока БД словарей 12), оно имеет вид, - «если имеет место определенный уровень истинности утверждения (термина) А и существует цепь в молинге, связывающая А с утверждением (термином) В, то имеет место определенный уровень истинности (достоверности) утверждения (термина) В». Этот уровень достоверности определяется уровнем достоверности (код 5) молинги.

Пример вывода показан на фиг.6. Предположим, пользователь задал запрос - найти связь между двумя разными терминами - термин 1 и термин9. Ищется на основе прямого вывода с ограниченным перебором (с количеством промежуточных терминов не более шести). Вводится вначале исходный термин 1, ищется какая-то первая молинга с ядром молинги, где есть термин 1 (или его синоним) и термин9 (или его синоним) одновременно. Если находится, то вводится в блок рабочей части диалога 14, где выстраиваются по мере уменьшения уровня достоверности найденных молинг. Если не находится, далее ищется некая (i-я) молинга с термин 1 с самым высоким уровнем достоверности и есть другие термины. Молинга срабатывает и выбираются другие термины, находящиеся в молинге для дальнейшего поиска, это термины - термин 2 и термин 3. Вначале ищется цепочка связи с термин 9 по первому термин 2 (и его синониму), выбирается (i+k)-я молинга, в ней ищется следующий ближайший термин - термин 6. Ищется следующая молинга, имеющая терминб (или его синоним) и термин9, и она находится (i+k+r) -я молинга. Результат вывода - последовательность молинг с порядковыми номерами (i), (i+k) (i+k+r) помещается блок рабочей части диалога 14.

Машина логического вывода должна функционировать даже при недостатке информации. Полученное решение может и не быть точным, однако система не должна останавливаться из-за того, что отсутствует какая-либо часть входной информации.

Машина логического вывода определяет порядок применения правил и выполняет четыре функции (см. фиг.5.)

1. Сопоставление (блок программы 31 машины логического вывода 9) - выбранная молинга сопоставляется с имеющимися терминами, выбранные поступают в конфликтное множество - блок программы 32.

2. Выбор (блок программы 33) - если в конкретной ситуации может быть применено сразу несколько молинг, то из них выбирается одна, наиболее подходящее по заданному критерию выбора молинг (блок программы 34) и происходит разрешение конфликта. Этим критерием является более высокий уровень достоверности и при равных величинах - первая по порядку.

3. Срабатывание (блок программы 35) - если молинга при сопоставлении совпала с какими-либо терминами из блока рабочей части диалога 14, то молинга срабатывает.

4. Действие (блок программы 36) - блок рабочей части диалога 14 подвергается изменению путем добавления в него сработавшей молинги и новых терминов для дальнейшего вывода. Если в правой части молинги содержится указание на какое-либо действие -постусловие, то оно выполняется.

Машина логического вывода 9 циклична. В каждом цикле просматриваются молинги, чтобы выявить те, где термины совпадают с известными на данный момент терминами из блока рабочей памяти 30 (кроме уже просмотренных). После выбора (блок программы 33) молинга срабатывает, и новый термин заносится в блок рабочей части диалога 14 для дальнейшего вывода, и цикл повторяется.

В одном цикле может сработать только одна молинга. Если несколько молинг успешно сопоставлены с терминами, то машина логического вывода 9 производит выбор по заданным критериям единственной молинги, которая срабатывает в данном цикле.

В режиме работы с диалогом 20, реализуемым блоком рабочей части диалога 14, всю необходимую информацию выдают пользователю 4 через компьютер 1. Пользователю 4 поступают по группам все последовательности логического вывода ядер молинг с номерами (i), (i+k), (i+k+r) разной длины в порядке убывания уровня достоверности (код 5) при заданном запросе для вывода на основе термин 1 - термин9

Уровень достоверности последовательности молинг упосл рассчитывается следующим образом.

Пусть

у; - уровень достоверности в виде фактора уверенности в пределах от -1 до 1 для начальной i -и молинги (где 1<i<n);

У i+k - уровень достоверности в виде фактора уверенности в пределах от -1 до 1 для некоторой промежуточной i+k -и молинги (где 1<k<n);;

yi+k+r- уровень достоверности в виде фактора уверенности в пределах от -1 до 1 для некоторой конечной i+k+г -и молинги (где i+k<г<n -(i+k));.Тогда

Упосл=П у; х х y;+k х х yi+k+r если все у;, y;+k, y;+k+r>0 (1)

1 ^ i<. n, 1<k<n, i+k<г<n - (i+k)

Если какое-то из значений у;, y;+k, y;+k+r окажется ^ 0, то и все значение Упосл указывается сразу равным=0 без дальнейшего расчета. Пользователь, читая последовательность этих ядер молинг, а фактически это группы последовательностей простых предложений, семантически связанных между собой, сам решает, удовлетворяет его этот результат -текст или нет.Выбирает необходимую ему группу (или группы) и фиксирует ее (или их) в блок сохраненной части диалога (вместе с терминами запроса) 15, вместе с со всеми результатами постусловий -визуальными и графическими образами из блока визуальных и графических образов 13. Если ответ его полностью не устраивает, пользователь имеет возможность или снова повторить логический вывод (режим логического вывода 21) с новыми вариантами запроса (с новыми терминами для логического вывода) или по какому-то ядру молинги запустить режим когезии 23 (локальной связанности текста относительного конкретного исходного текста (одного из используемых для конкретной молинги идентификаторов исходного текста, соответствует абзацу исходного текста) на небольшом расстоянии от исходного предложения) или когерентности (глобальной связанности текста через одинаковые термины (заголовки), относительного конкретного упомянутого и выбранного исходного текста из нескольких идентификаторов),

Режим когезии 23 обеспечивает вывод в блок рабочей части диалога 14 из блока базы знаний 10 последовательностей ядер молинг, имеющих, как минимум, один идентификатор, соответствующий заданному пользователем (через представленному ему перечню исходных текстов, их глав, параграфов из словаря введенных исходных текстов из блока БД словарей 12). Вывод ядер молинг в режиме когезии при одинаковом идентификаторе соответствует выводу абзаца исходного текста (блоки 24 или 25 или 26). Запрос пользователя о выводе всего исходного текста, соответствующего интересующему его ядра молинги (простого предложения) соответствует использованию эффекта когерентности исходного текста или режима вывода исходного текста 22. Объем может задаваться пользователем 4 - или в объеме параграфа, или в объеме главы, или в объеме всего исходного текста со всеми главами и параграфами.

Весь необходимый пользователю текст, который оказался необходим пользователю и полученный им в режиме работы с диалогом 20 в блоке рабочая часть диалога 14, может быть сохранен пользователем в блоке сохраненной части диалога 15. Причем блоки исходного текста (в виде последовательностей ядер молинг), полученных в режиме когезии 23, могут непосредственно в блоке сохраненной части диалога 15 запоминаться, а также полученные в режиме вывода исходных текстов (обеспечения когерентности) 22, только с указанием выделенных пользователем необходимых идентификаторов.

В дальнейшем при работе пользователя с блоком сохраненной части диалога 15 необходимые последовательности ядер молинг будут подгружаться в блок сохраненной части диалога 15 из блока базы знаний 10, также как и необходимые визуальные и графические образы из блока визуальных и графических образов 13. Соответственно, все это будет выводиться по запросу пользователя в компьютер 1 для пользователя.

Режим вывода текстов 22 может задаваться пользователем через блок распределения заданий 8. Последний активизирует блок рабочей части диалога 14 и по запросу пользователя производится вывод из блока базы знаний 10 тех или иных исходных текстов в виде последовательности ядер молинг по подобранным идентификаторам, начиная с одинакового номера ссылки в словаре исходных текстов в коде 1. Все это передается в компьютер 1 для пользователя.

Подробнее программная реализация режима вывода текстов 22 и режима когезии 23 в машине логического вывода 9 рассмотрены на фиг.7.

В режиме когезии 23 пользователь при работе с результатами, выдаваемыми элингой в блок рабочей части диалога 14, может выбрать интересующее его простое предложение (ядро некоторой молинги) и для уточнения выбрать поясняющий абзац, выбрав один из идентификаторов молинги, в виде - код 1.1.код 1.2. код 1.3. код 1.4. Он поступает в машину логического вывода 9 в блок программы 37, а из него в блок программы 38, который ищет все молинги, находящиеся в блоке базы знаний 10 с заданным идентификатором. Если молинга найдена, то блоком программы 39 копия молинги отправляется в блок рабочей части диалога 14, если "нет" - проверяется блоком программы 40 все ли просмотрено. Если "нет", просмотр продолжается, если "да", то проверяют в блоке программы 41 -это был запущен режим когезии 23 или нет.Если "да", то сообщают в блок рабочей части диалога 14, что задание выполнено.

Если "нет", то - машина логического вывода 9 инициирована или блоком распределения заданий 8 или блоком рабочей части диалога 14 (в обоих случаях пользователем) в режиме вывода исходных текстов 22.

Режим вывода исходных текстов 22 задается или из блока распределения заданий 8 или блока рабочей части диалога 14. В блок программы 42 машины логического вывода 9 в виде запроса текста который надо вывести - код 1.1.x.x.x, т.е. надо вывести весь текст близкий к исходному тексту, который содержится в блоке базы знаний 10 в форме молинг. Код 1.1 соответствует номеру исходного текста из словаря исходных текстов, который находится в блоке БД словарей 12. Возможны варианты задания в виде код 1.1.код 1.2.х.х, когда задается вывод только конкретной главы конкретного исходного текста, и код 1.1.код 1.2.код 1.3.х - когда задается вывод только конкретного параграфа конкретной главы.

Поиск молинг начинается с задания поиска главы с номером 1 в виде задания

код 1.1.х.х.х=код 1.1.1.х.х. Задается начальный код параграфа, который ищется с номером 1 в виде

код 1.1.х.код 1.3..х=код 1.1.x.1.x

в блоке программы 44.

Далее задается начальный номер абзаца с номером 0 (это - заголовок) в начальном параграфе начальной главы в блоке программы 45 в виде код 1.1.х.х.х=код 1.1.х.х.О.

И затем начинается поиск молинг для 0-го абзаца. Дальше все проходит, как и в режиме когезии 23. Если в блоке программы 41 идет выход "нет", то происходит переход к блоку программы 46, в котором определяется все ли абзацы в параграфе просмотрены. Если выход блока программы 46 -"нет", то в блоке 47 увеличивается номер кода для поиска нового абзаца

код 1.1.х.х.код1.4=код 1.1.х.х. (код 1.4+1).

Если в качестве выхода блока программы 46 используется "да", то идет переход к блоку программы 48. При этом проверяются все ли номера параграфов просмотрены, если "нет", то идет присвоение нового номера параграфа в блоке программы 49 в виде

код 1.1.х.код1.3.х=код 1.1.х.(код1.3+1).х

и далее по циклу.

Если в блоке программы 48 был выход "да", то означает, что просмотрены все параграфы заданной главы заданного исходного текста и идет переход к блоку программы 50. Если из него выход "нет", т.е. не просмотрены все главы заданного исходного текста, то номер главы в блоке программы 51 увеличивается

код 1.1.код1.2.х.х=код 1.1.(код1.2+1).х.х. Если выход из блока программы 50 "да", то это означает, что все молинги данного номера текста с кодом код 1.1. выбраны и отправлены в блок рабочей части диалога 14. При этом происходит возврат к блокам распределения заданий 8 или блоку рабочей части диалога 14 с сообщением, что задание по блоку 42 закончено.

Для снижения опасности копирования элинг и времени реакции на задаваемые вопросы (в процессе эксплуатации) используется специальное устройство считывания эллинг 2 для запуска машиночитаемых носителей 5 с элингами и специальные методы защиты машиночитаемых носителей,

- как механическим путем, программным, так и организационным. А именно:

- с целью затруднения копирования, - машиночитаемый носитель 5 имеет механические изменения, препятствующие его считыванию на иных устройствах считывания (отличных от устройств считывания 2) -разъемы 3, 6 имеют размеры отличные от стандартных;

- все содержимое блоков на машиночитаемом носителе 5 с каждой новой версией шифруется с использованием блоков шифратор/дешифратор 7, препятствуя считыванию элинг, в т.ч. на иных устройствах считывания, отличных от устройств считывания 2;

- набор молинг в блоке базы знаний 10 каждой новой версии имеет небольшие изменения, препятствующие работу со старой машиной логического вывода 9, в частности, изменяются разделители кодов молинг и их последовательность.

-Ядро ПС, которое обеспечивает работу с элингой считывается в оперативную память компьютера 1 с машиночитаемого носителя 5 и оно находится в самом начале в блоке распределения заданий 8 машиночитаемого носителя 5.

Система для работы с интеллектуальной электронной книгой - элингой - носителем знаний, состоящая из компьютера, устройства считывания элинги и машиночитаемого носителя, соединяемых через разъемы, отличающаяся тем, что на машиночитаемом носителе находятся - блок машины логического вывода, блок базы знаний, шифратор/дешифратор, блок распределения заданий, блок рабочей части диалога, блок сохраненной части диалога, блок ввода знаний, блок БД словарей, блок визуальных и графических образов, причем машина логического вывода связана с разъемом через блок распределения заданий и шифратор/дешифратор, а также связана с блоком рабочей части диалога и блоком базы знаний, блок распределения заданий связан с блоком рабочей части диалога, блоком сохраненной части диалога и блоком ввода знаний, который, в свою очередь, связан с блоком базы знаний, блоком БД словарей, блоком визуальных и графических образов, блок базы знаний дополнительно связан с блоком рабочей части диалога, блоком сохраненной части диалога, блоком БД словарей, блоком визуальных и графических образов, который, в свою очередь, связан с блоком рабочей части диалога.



 

Похожие патенты:

Мультимедийный лазерный уличный проектор для рекламы на зданиях с лампой и настенным или потолочным кронштейном для крепления относится к рекламе, в частности к проекционным устройствам для визуализации рекламных сообщений.

Полезная модель относится к области электроники, а также к области обработки и передачи данных для специальных применений и может быть использована для создания централизованных систем контроля и интеллектуального управления инфраструктурой жилых, офисных и общественных зданий и помещений, включающих системы электроснабжения, водоснабжения, теплоснабжения, газоснабжения, вентиляции, и т.п.
Наверх