Главная Патентный отдел Технологии Справочник ГРНТИ Прием Наши координаты Обратная связь

Поиск патентов

Оформить заказ и задать интересующие Вас вопросы Вы можете напрямую c 6-00 до 14-30 по московскому времени кроме сб, вс. whatsapp 8-950-950-9888

Патентный отдел

На данной странице представлена ознакомительная часть выбранного Вами патента

Для получения более подробной информации о патенте (полное описание, формула изобретения и т.д.) Вам необходимо сделать заказ. Нажмите на «Корзину»

Вернуться к списку

ДВУХПРОХОДНОЕ ХЕШ ИЗВЛЕЧЕНИЕ ТЕКСТОВЫХ СТРОК

Номер публикации патента: 2464630

Вид документа:	C2
Страна публикации:	RU
Рег. номер заявки:	2010111780/08

Получить полное описание патента

Редакция МПК:	6
Основные коды МПК:	G06F017/21
Аналоги изобретения:	JP 2007094838 А, 12.04.2007. KR 1020040011769 А, 11.02.2004. US 7031910 В2, 18.04.2006. RU 2266560 С1, 20.12.2005. RU 2004108667 А, 27.09.2005.

Имя заявителя:	МАЙКРОСОФТ КОРПОРЕЙШН (US)
Изобретатели:	ПАУЗИН Доминик (US)
Патентообладатели:	МАЙКРОСОФТ КОРПОРЕЙШН (US)
Приоритетные данные:	28.09.2007 US 11/863,680

Реферат

Изобретение относится к сжатию данных. Техническим результатом является уменьшение объема памяти, требуемой для хранения данных, и уменьшение времени восстановления сжатых данных. В способе распознавания текста сначала генерируют множество терминов, используемых в текстовой строке, и вычисляют множество хеш значений из множества генерированных терминов. Для каждого хеш значения может быть создан хеш сегмент, в котором может поддерживаться ассоциированный счет происшествий. Хеш сегменты могут быть сортированы счетом происшествия и несколько наивысших сегментов могут храниться. Как только упомянутые наивысшие сегменты известны, второй проход может пройти текстовую строку, сгенерировать термины, вычислить хеш значение для каждого термина. Если хеш значения для терминов подходят хеш значениям тех, которые хранятся в сегменте, тогда термин может считаться частым термином. Следовательно, термин может быть добавлен в словарь вместе с соответствующим счетом частоты. Затем словарь может быть проверен для удаления терминов, которые могут быть не частыми, но появились в виду хеш противоречий. 3 н. и 17 з.п. ф-лы, 6 ил.

Вернуться к списку

Дирекция сайта "Промышленная Сибирь"
Россия, г.Омск, ул.Учебная, 199-Б, к.408А
Сайт открыт 01.11.2000
© 2000-2018 Промышленная Сибирь

Разработка дизайна сайта:
Дизайн-студия "RayStudio"