9. Сетевые ИТ

Тенденция развития ПС такова, что наиболее быстродействующие ПС стремятся произвести индексацию всего документа, а не только его названия и первых предложений текста. Наиболее совершенные роботы при индексации сканируют не только главную (домашнюю) страницу, но и по гиперссылкам заходят в глубь сайта (узла). Ограничивается такая идеалистическая картина индексации лишь скоростью работы современных ПС и общим быстродействием всей сети.
Предварительная индексация хранящихся в сети документов позволяет впоследствии за несколько секунд обслуживания запроса обработать (отсортировать) гигабайты разнообразной информации.
С помощью механизма предварительной индексации можно получить хороший результат поиска в случаях, когда удается точно сформировать запрос с помощью небольшого числа ключевых слов. В иных случаях пользователь либо получит большое число ссылок (иногда говорят, линков, т. е. связей), которые являются лишь «информационным шумом», либо вовсе не удастся найти необходимый документ.
Значительно повышают избирательность поиска фильтры, которыми снабжаются поисковые системы.
Фильтры позволяют:
– ограничить список отбираемых документов с помощью логических операторов (выполнить так называемый сложный или расширенный поиск);
– ограничить пространство поиска типом протокола, с помощью которого был создан документ (поиск на Web-сайтах или в телеконференциях);
– ограничить отбираемый материал временным отрезком, определенными датами создания разыскиваемого документа (например, между 18 июня 1998 г. и 7 октября 2001 г.);
– отобрать документы, составленные только на определенном языке (русский, английский);
– ограничить отбор документов территорией размещения серверов (например, только Европа);
– ограничить поиск определенной частью документа (заголовок, доменный адрес);
– отобрать документы, которые содержат фразу с заданным порядком расположения ключевых слов.



Сайт управляется системой uCoz