9. Сетевые ИТ
Чем выше чувствительность, тем меньше вероятность пропуска нужного документа.
Релевантность – степень (мера) соответствия (адекватности) найденного в процессе поиска документа сделанному запросу.
Уточнить запрос (говорят: отфильтровать информацию) позволяют логические операторы OR, AND, NOT.
Использование логического оператора AND (И) приводит к отбору документов, которые обязательно содержат все перечисленные в запросе ключевые слова, соединенные этим оператором.
Оператор NOT (НЕТ) позволяет исключить документы, которые содержат ключевое слово, указанное после этого оператора.
С помощью оператора NEAR (вблизи, рядом) пользователь может отбирать документы, в которых ключевые слова, соединенные этим оператором, будут находиться поблизости друг от друга, а не в разных концах документа.
Оператор FOLLOWED BY позволяет отбирать документы, в которых ключевые слова следуют друг за другом в заданном порядке.
Оператор ADJ отбирает документы, в которых ключевые слова являются смежными (следуют один за другим).
К сожалению, каждая ПС имеет собственный синтаксис запросов. Поэтому перед формированием расширенных запросов необходимо уточнить правила использования логических и других операторов.
В настоящее время ведутся работы по унификации приемов работы на различных ПС. В 1999 г. началась разработка проекта SESP (Search Engine Standards Project), который призван стандартизировать работу поисковых служб.
Современные ПС становятся интеллектуальными. Используя принципы искусственного интеллекта, они ранжируют (располагают) выводимый список документов (ссылок на них) в зависимости от степени их релевантности. При этом ПС анализируют положение найденных ключевых слов в документе (заголовок или текст), число повторений ключевых слов, их взаимное расположение в документе. Наиболее точно отобранные документы располагаются в начале списка найденных в процессе поиска документов.
Для ранжирования найденных документов используют следующие показатели.
Положение ключевого слова на странице (keyword prominence) – показатель, определяющий, как близко к началу документа находится заданное ключевое слово.