9. Сетевые ИТ
Поиск – это процедура отбора нужных документов, хранящихся в сети.
Поиск осуществляется либо автоматически с помощью ключевых слов в ПС, либо путем последовательного ручного прохода по рубрикам в каталогах.
Поиск с помощью ключевых слов сводится к их вводу (формированию запроса) в специальное поле Поиск и последующему нажатию кнопки Найти. Кнопка Найти в разных ПС может называться Search, Find, Go, Go Get it, Suchen.
На рисунке приведены фрагменты трех поисковых систем с изображением полей для ввода запросов и командных кнопок.
Для ускорения процедуры поиска ПС производит предварительную смысловую обработку хранящихся в сети документов – индексацию.
В процессе индексации каждому документу, хранящемуся в сети, ставится в соответствие свой набор ключевых слов. Когда идет обслуживание конкретного запроса на поиск нужной информации, то ПС сравнивает ключевые слова, введенные пользователем, с ключевыми словами, полученными в процессе индексации и хранящимися в базе данных ПС. При совпадении этих слов пользователю выдается доменный адрес данного документа, т. е. указывается место его хранения в сети.
Процедура поиска по ключевым словам очень напоминает работу с обычной книгой, в которой есть алфавитный указатель. Читатель с помощью алфавитного указателя определяет номер страницы книги, на которых присутствует нужное ключевое слово. Этим ускоряется поиск нужной информации. В данном случае номер страницы книги – это как бы доменный адрес Web-страницы.
Индексация документов, размещенных на различных серверах, производится поисковыми системами автоматически с помощью специальных программ – роботов (Robots). Другое название этих программ – пауки (Spiders) или черви (Worms).
Паук (робот, червь) – программа, которая автоматически периодически «посещает» сайты и индексирует их (т. е. собирает сведения о их содержимом и местоположении).
Назначение роботов очевидно: эти программы постоянно «осматривают», сканируют сеть, запоминают, что где лежит, чтобы в нужный момент времени показать пользователю точное место хранения документа (т. е. его доменный адрес). Этим объясняется потрясающе высокая скорость поиска нужной информации. Фактически роботы начинают поиск задолго до обслуживания конкретного запроса.