Авторизация

Математические модели поисковых систем

Математические модели поисковых систем

В алгоритм поиска любой поисковой системы включены математические модели, которые упрощают систематизацию документов при их выдаче пользователю.
Математическая модель поисковых систем - это упрощенная реальность на основе формулы, которая позволяет ранжировать документы и считать их найденными.

Сегодня количество документов хранящихся в базах поисковых систем исчисляются миллиардами, для их обработки конечно нужна стабильно работающая математическая модель ранжирования и обработки данных.
Рассмотрим три вида математических моделей, которыми пользуются основные поисковые системы.

Булевская модель, наиболее простая, работает на первом этапе сортировки документов. Если в документе существует слово из ключевого запроса, значит он считается найденным. Таким образом в результате поиска могут быть отфильтрованы сотни миллионов запросов. Это не устраивает пользователя, должен получать более конкретный результат выдачи по своему запросу. А следовательно переходим к следующему виду математической модели.

Векторная математическая модель определяет весомость документа, по отношению к поисковому запросу. Принцип ее действия проще понять, просмотрев описание значений формулы ниже.
Формулу для определения веса документа можно визуально представить так:
WWW=TF*IDF
WWW - вес документа;
TF – уникальность слова в документе;
IDF – редкость слова в базе документов поисковика, находящихся в индексе.

Это сильно упрощенный вариант формулы, в которой не предусмотрены сотни показателей и коэффициентов, по которым происходит истинная фильтрация документов при поиске. Не учтен основной показатель, РЕЛЕВАНТНОСТЬ - (адекватность) соответствие поискового запроса математическому образу документа.

Математическая модель, основанная на вероятности соответствия эталону.
Работники поисковых систем определяют и разрабатывают определенные шаблоны моделей, с которыми сравнивается оригинал документа. Этих сотрудников называют асессоры, например в Яндексе их около 60 человек. Это количество определено тем, что мнения асессоров отличаются друг от друг и при разработке модели вырабатывается усредненный шаблон модели.
Асессор – это сотрудник поисковой системы, занимающийся оценкой поисковой выдачи поисковых роботов.

Вероятностная математическая модель работает по принципу: чем больше документ похож на эталонный документ, тем выше возможность того, что он будет востребован пользователем.

При своей работе поисковики используют совокупность многих видов математических моделей, которые держатся в строгом секрете.

Знания математической модели работы поисковых систем помогает WEB-разработчикам и специалистам IT аутсорсинга, поддерживать и вести рекламные компании в сети Интернет.

Оставить комментарий
Навигация по сайту
  • Скачать 1
  • Скачать 2
  • Скачать 3
Универсальный шаблон готового сайта UseSite

Универсальный шаблон готового сайта UseSite


Полностью готовый к применению в качестве сайта шаблон UseSite является универсальным инструментом для быстрого создания Интернет проекта. В нем предусмотрены все основные модули необходимые современному сайту: фотогалерея,...

Подробнее →  

  • Просмотров: 26 343
Готовый сайт оплаты и доставки электронного товара. OnPay Система платежей

Готовый сайт оплаты и доставки электронного товара. OnPay Система платежей


Готовый шаблон сайта для продажи и доставки электронных товаров. Автоматическая оплата товара и мгновенная его отправка покупателю. Шаблон настроен для работы с платежной системой OnPay. Персональный аттестат WebMoney не...

Подробнее →  

  • Просмотров: 8 076
Редактируем шаблоны готового сайта. Скачать книгу для начинающих вебмастеров

Редактируем шаблоны готового сайта. Скачать книгу для начинающих вебмастеров


Вам не обязательно быть программистом, достаточно научиться понимать и редактировать уже написанный код. Данное руководство предназначено для новичков в вебстроительстве. Рассчитано на работу со специально созданными шаблонами...

Подробнее →  

  • Просмотров: 14 019

 

 

Нименование Количество Цена / 1 шт.
Всего: 0 руб.