9. Сетевые ИТ
Как правило, чем ближе к началу страницы располагается ключевое слово, тем точнее документ соответствует запросу.
Частота ключевого слова (keyword frequency) – показатель, учитывающий абсолютную частоту использования ключевых слов (т. е. сколько раз встречается данное ключевое слово на странице).
Наибольший «вес» при ранжировании документов имеют слова, расположенные в заголовке Web-страницы (так называемый титул). Именно этот заголовок отображается в строке заголовка браузера при просмотре страницы, и приведенные там слова имеют наибольшую ценность для ПС.
Некоторые поисковые системы при ранжировании учитывают индекс цитирования (link popularity) – количество сайтов, которые ссылаются на данный сайт.
Не всякий запрос можно четко сформулировать с помощью небольшого числа ключевых слов. Поэтому, кроме индексного механизма, используются и другие механизмы поиска и хранения информации в сети.
Как отмечалось ранее, поиск информации в Интернете можно производить с помощью поисковых систем и каталогов. Другое нередко используемое название поисковых систем, построенных с помощью каталогов, – иерархические ПС.
Термин «иерархия» означает: расположение частей или элементов целого в порядке от высшего к низшему. В данном случае правильнее говорить: иерархия – это уточнение содержания документа от его общих характеристик к частным характеристикам.
Синонимами термина «каталог» являются слова: директория, справочник, категория, рубрикатор. Каталоги представляют собой тематически подобранные сетевые адреса, которые сопровождаются краткими комментариями (аннотациями).
Каталоги появились самым естественным путем: пользователи отбирали для себя ссылки на любимые места в Интернете и составляли упорядоченные тематические списки с детализацией каждого раздела (рубрики). Именно так возник всемирно известный каталог Yahoo!, созданный студентами Стэндфордского университета Дэвидом Фило и Джерри Янгом.
В каталогах размещение информации ведется с помощью многоуровневой рубрикации, причем на каждом уровне происходит все большая детализация (уточнение) сведений об искомом (хранящемся) документе.