US 6263335 B1, 17.07.2001. RU 2273879 C2, 10.04.2006. RU 2236699 C1, 20.09.2004. WO 2005/062202 A2, 07.07.2005. US 6006221 A, 21.12.1999.
Имя заявителя:
Государственное образовательное учреждение высшего профессионального образования "Мордовский государственный университет им. Н.П. Огарева" (RU)
Изобретатели:
Циликов Илья Сергеевич (RU)
Патентообладатели:
Государственное образовательное учреждение высшего профессионального образования "Мордовский государственный университет им. Н.П. Огарева" (RU)
Реферат
Изобретение относится к обработке естественно-языковых текстов и может быть использовано для автоматизации поиска необходимых документов в большой их коллекции. Изобретение позволяет проводить сравнение фраз по смыслу. При поступлении запроса его содержимое обрабатывают по предложениям, происходит попарное сопоставление предложений массива текстов и поискового запроса, по результатам которого вычисляют релевантность каждого документа массива текстов запросу на основе входящих в документы предложений. Индексирование массива текста происходит по отдельным предложениям. В предложениях вначале распознают точные значения слов и устанавливают семантические связи между ними, затем точные значения слов заменяют их разложением на элементарные значения, которые хранятся для каждого значения в тезаурусе, после чего для каждого предложения строят матрицу, содержащую связи между всеми парами объектов, входящих в предложение, затем составляют инвертированный индекс, где для каждого объекта, входящего в массив текста, указано в каких документах и в каких предложениях сколько раз он встречается. 1 з.п. ф-лы.