US 2002/0178152 A1, 28.11.2002. RU 2236699 C1, 20.09.2004. JP 2000029902 A, 28.01.2000. KR 20030044949 A, 09.06.2003.
Имя заявителя:
МАЙКРОСОФТ КОРПОРЕЙШН (US)
Изобретатели:
АЗЗАМ Салиха (US) ХАМФРИЗ Кевин Уилльям (US)
Патентообладатели:
МАЙКРОСОФТ КОРПОРЕЙШН (US)
Приоритетные данные:
31.07.2006 US 11/496,650
Реферат
Изобретение относится к способу и устройству для проведения информационного поиска. Техническим результатом является повышение достоверности результатов поиска. Из электронных документов извлекаются факты посредством распознавания фактографических описаний с использованием таблицы слов факта, сопоставляемых со словами электронных документов. Слова этих фактографических описаний могут быть обеспечены признаком соответствующей части речи. Далее выполняется более подробный анализ этих фактографических описаний, а не всего электронного документа, и, в частности, текста, окружающего соответствующие слова факта. Анализ может включать в себя идентификацию лингвистических элементов каждого словосочетания и определение их роли как подлежащего или как дополнения. Могут применяться правила исключения для удаления тех словосочетаний, которые, скорее всего, не являются частью фактов, причем эти правила исключения частично основаны на лингвистических элементах. К оставшимся словосочетаниям могут быть применены правила оценки, и для тех словосочетаний, которые имеют оценку, превышающую порог, соответствующая часть предложения, целое предложение, абзац или другая часть документа могут быть представлены как представляющие один или несколько фактов. 3 н. и 17 з.п. ф-лы, 6 ил., 4 табл.