Устройство для орфографического контроля слов русского языка

 

Заявленное устройство относится к автоматике и цифровой вычислительной технике и может быть использовано в различного рода электронных информационных системах автоматического орфографического контроля. Целью предлагаемого устройства является совершенствование устройств обработки информации путем расширения функциональных возможностей средств автоматического смыслового анализа. Устройство для орфографического контроля слов русского языка содержит: блок дешифраторов, в состав которого входит дешифратор гласных, дешифратор согласных, дешифратор символов пробел, дешифратор биграмм, не встречающихся в русском языке, дешифратор триграмм, не встречающихся или редко встречающихся в русском языке; блок анализа, в состав которого входит четыре логических элементов ИЛИ и счетчики: гласных, встречающихся в слове подряд, согласных, встречающихся в слове подряд, длины слова, которые формируют сигнал-признак при достижении состояния «3», «5», «15» и «3», а также выходной блок, в составе которого имеется два логических элемента ИЛИ и счетчики признаков, вырабатывающий сигнал об ошибке при достижении состояния «1», который снимается с выхода счетчика признаков, выходы которого подключены: суммирующий вход к выходу первого логического элемента ИЛИ, входы которого подключены к выходам счетчиков гласных, согласных, длины слова, прямому дешифратору биграмм и прямому выходу дешифратора триграмм, установочный вход к выходу второго элемента ИЛИ, входы которого соединены с выходом счетчика слов и шиной сброс; входы счетчика гласных соединены: суммирующий вход - с прямым входом дешифратора гласных, установочный вход с выходом логического элемента ИЛИ, входы которого

соединены с шиной сброс, выходом дешифратора согласных и прямым входом дешифратора символа пробел, а входы счетчика согласных соединены соответственно: суммирующий вход с выходом дешифратора согласных, установочный вход с выходом логического элемента ИЛИ, выходы которого соединены с шиной сброс, выходом дешифратора гласных и прямым выходом дешифратора символа пробел; входы счетчика длины слова соединены: суммирующий вход с инверсным выходом дешифратора символа пробел, установочный вход - через логический элемент ИЛИ с прямым выходом дешифратора символа пробел и шиной сброс, входы счетчика слов соединены: суммирующий с прямым выходом дешифратора символа пробел, установочный - с выходом логического элемента ИЛИ, входы которого соединены с шиной сброс и выходом счетчика сброс; входы дешифраторов гласных, согласных, символов пробел, биграмм и триграмм соединены с информационной шиной.

Изобретение относится к автоматике и цифровой вычислительной технике и может быть использовано в различного рода электронных информационных системах автоматического орфографического контроля.

Известно устройство для обнаружения искажений в тексте (А.с 1056198 СССР, МКИ4 G06F 11/00, 1983).

Недостатоком известного устройства является отсутствие возможности осуществлять смысловой анализ текста.

Наиболее близким техническим решением к заявляемому и принятым за прототип является устройство для орфографического контроля слов русского языка. (А.с. 1283773 СССР, МКИ4 G06F 11/00. Устройство для орфографического контроля слов русского языка [Текст] / В.В.Возняк, А.А.Попыркин (СССР); опубл. 15.01.87, Бюл. №2).

Недостатком данного устройства является отсутствие возможности выявления запрещенных и редко встречающихся в русском языке трехчленных сочетаний букв (триграмм).

Целью предлагаемого устройства является совершенствование устройств обработки информации путем расширения функциональных возможностей средств автоматического смыслового анализа.

Цель достигается тем, что в устройстве орфографического контроля слов русского языка, содержащем: блок дешифраторов, в состав которого входит дешифратор гласных, дешифратор согласных, дешифратор символов пробел, дешифратор биграмм, не встречающихся в русском языке, дешифратор триграмм, не встречающихся или редко встречающихся в русском языке; блок анализа, в состав которого входит четыре логических элементов ИЛИ и счетчики: гласных, встречающихся в слове подряд, согласных, встречающихся в слове подряд, длины слова, которые формируют сигнал-признак при достижении состояния «3», «5», «15» и «3», а также

выходной блок, в составе которого имеется два логических элемента ИЛИ и счетчики признаков, вырабатывающий сигнал об ошибке при достижении состояния «1», который снимается с выхода счетчика признаков, выходы которого подключены: суммирующий вход к выходу первого логического элемента ИЛИ, входы которого подключены к выходам счетчиков гласных, согласных, длины слова, прямому дешифратору биграмм и прямому выходу дешифратора триграмм, установочный вход к выходу второго элемента ИЛИ, входы которого соединены с выходом счетчика слов и шиной сброс; входы счетчика гласных соединены: суммирующий вход - с прямым входом дешифратора гласных, установочный вход с выходом логического элемента ИЛИ, входы которого соединены с шиной сброс, выходом дешифратора согласных и прямым входом дешифратора символа пробел, а входы счетчика согласных соединены соответственно: суммирующий вход с выходом дешифратора согласных, установочный вход с выходом логического элемента ИЛИ, выходы которого соединены с шиной сброс, выходом дешифратора гласных и прямым выходом дешифратора символа пробел; входы счетчика длины слова соединены: суммирующий вход с инверсным выходом дешифратора символа пробел, установочный вход - через логический элемент ИЛИ с прямым выходом дешифратора символа пробел и шиной сброс, входы счетчика слов соединены: суммирующий с прямым выходом дешифратора символа пробел, установочный - с выходом логического элемента ИЛИ, входы которого соединены с шиной сброс и выходом счетчика сброс; входы дешифраторов гласных, согласных, символов пробел, биграмм и триграмм соединены с информационной шиной.

В известном техническом решении (А.с. 1283773 СССР, МКИ4 G06F 11/00. Устройство для орфографического контроля слов русского языка [Текст] / В.В.Возняк, А.А.Попыркин (СССР); опубл. 15.01.87, Бюл. №2). имеются признаки сходные с признаками, присущими заявляемому решению. Это наличие блоков дешифрации гласных, согласных, символа пробел, количества слов, биграмм.

Однако свойства заявляемого решения отличаются от свойств известного решения тем, что в известном устройстве для орфографического контроля слов русского языка вывод о наличии ошибок в словах осуществляется на основании анализа четырех признаков: наличие допустимых биграмм, появлением трех и более гласных следующих подряд, появление слова длиной более 15 символов.

В заявляемом устройстве используются пять признаков: наличие допустимых биграмм, наличие допустимых триграмм, появлением трех и более гласных следующих подряд, появление слова длиной более 15 символов.

Таким образом, введенный блок дешифрации триграмм соответствует признакам «существенные отличия» и обеспечивает достижение положительного эффекта.

На рисунке 1 представлена схема устройства. Устройство содержит: информационную шину 1, шину «сброс» 2, блок дешифраторов 3, в состав которого входят: дешифратор гласных 4, дешифратор согласных 5, дешифратор символа пробел 6, дешифратор запрещенных биграмм 7, дешифратор запрещенных триграмм 8; блок анализа 9, в составе: логические элементы ИЛИ 10, 11, 12, 13, счетчик гласных 14, счетчик согласных 15, счетчик длины слова 16, счетчик слов 17, выходной блок 18, в составе: логические элементы ИЛИ 19, 20 и счетчик признаков 21. Сигнал об ошибке снимается с выхода 22.

Работа устройства заключается в следующем. В исходном состоянии устройство устанавливается импульсом, подаваемым по шине 2, который приводит в нулевое состояние счетчики 14, 15, 16, 17, 19, 20. При поступлении на шину 1 сигналов первого информационного символа дешифраторы 4, 5, 6, 7, 8 включаются в работу. При этом дешифратор 4 распознает гласные буквы, дешифратор 5 - согласные, дешифратор 6 - символ пробел, дешифратор 7 - запрещенные биграммы, дешифратор 8 - запрещенные и редко встречаемые в русском языке триграммы. С

поступлением на шину 1 символа гласной, счетчик 14 увеличивает свое состояние на единицу, а счетчик 15 обнуляется. При поступлении по входу 1 согласной, счетчик 14 обнуляется, а счетчик согласных увеличивает свое состояние на единицу. При поступлении на вход 1 любого символа кроме «пробел», счетчик 16 увеличивает свое состояние на единицу. При поступлении на вход 1 символа «пробел» счетчики 14, 15, 16 обнуляются, а счетчик 17 увеличивает свое состояние на единицу. Сигналы - признак вырабатываются счетчиками: 14 при достижении состояния «3», счетчиком 15 при достижении состояния «5», счетчиком 16 при достижении состояния «15». Кроме этого сигнал ошибки вырабатывается дешифраторами 7 и 8 при обнаружении запрещенной биграммы или триграммы.

Сигнал - признак поступает через логический элемент ИЛИ 19 на счетчик ошибок 21. Счетчик 21 подсчитывает количество обнаруженных ошибок и при достижении состояния «1» выдает сигнал о не читаемости слова. Счетчик 17 подсчитывает количество анализируемых слов. При достижении состояния «3» счетчик 17 через элемент ИЛИ 13 обнуляется, а через элемент ИЛИ 20 обнуляется счетчик 21.

Использование данного устройства позволяет повысить оперативность анализа искаженных слов. При этом вероятность ошибки при принятии решения об искажении слова не превышает 0,85·10 -3

Устройство для орфографического контроля слов русского языка, содержащее информационную шину, шину сброса, блок дешифраторов, блок анализа и выходной блок, отличающееся тем, что, с целью расширения функциональных возможностей устройств обработки информации путем введения средств, позволяющих осуществлять ее смысловой анализ, введены дешифратор гласных, дешифратор согласных, дешифратор символа «пробел», дешифратор запрещенных биграмм, дешифратор запрещенных и редко встречающихся триграмм, причем входы дешифраторов соединены с информационной шиной, а выход дешифратора гласных - с суммирующим входом счетчика гласных и через второй элемент ИЛИ - с установочным входом счетчика согласных; выход дешифратора согласных соединен с установочным входом счетчика согласных и через первый элемент ИЛИ - с установочным входом счетчика гласных; выходы дешифратора символа пробел соединены: прямой - с суммирующим входом счетчика слов и через первый, второй и третий элементы ИЛИ - с установочными входами счетчиков гласных, согласных и длины слова, инверсный - с суммирующим входом счетчика длины слова; выход дешифратора биграмм и дешифратора триграмм соединен через пятый элемент ИЛИ с суммирующим входом счетчика признаков.



 

Похожие патенты:

Изобретение относится к контрольно-измерительной технике, конкретно к программно-диагностическим комплексам позволяющим производить разработку контрольных (диагностических) тестов, диагностировать радиоэлектронные изделия (РЭИ) на основе разработанных тестов и обнаруживать места локализации неисправностей в дефектных РЭИ
Наверх