WOLF J.L. et al. Optimal Crawling Strategies for Web Search Engines, опуб. 7-11 мая 2002, найденная по адресу URL:. http://ww.columbia.edu/~jsl353/pubs/wolf-www02.pdf, с.136-147. СНО J et al. Effective Page Refrash Policies For Web Crawlers, ACM Transactions on Database System, December 2003, vol. 28, 4, найденная по адресуURL:http:oak.cs.ucla.edu/~cho/papers/cho-tods03.pdf, с.390-426. RU 2177638 C2 (ЗОММЕРС О.Х.), 27.12.2001. RU 2210871 C2 (ТЭЧЙОН, ИНК.), 20.08.2003.
Имя заявителя:
МАЙКРОСОФТ КОРПОРЕЙШН (US)
Изобретатели:
КЭДИ Карл М. (US) МИК Кристофер А. (US)
Патентообладатели:
МАЙКРОСОФТ КОРПОРЕЙШН (US)
Приоритетные данные:
12.02.2004 US 10/777,365
Реферат
Изобретение относится к устройствам анализа данных, в частности к системам и способам получения информации из сетевой системы с использованием распределенного веб-кролинга. Техническим результатом является облегчение упреждающего веб-кролинга в компьютерной среде. Аспекты изобретения предусматривают оценки, на основании прогноза, полезности и теории статистических решений, изменений в подмножествах веб-страниц, увеличивающие возможности веб-кролинга и гарантирующие поддержание актуальности информации веб-страниц. Кроме того, изобретение облегчает избирательный кролинг страниц с более высокой вероятностью изменения. 7 з.п. ф-лы, 11 ил.