Классификация алгоритмов ранжирования

Для продвижения сайта важно понимать то, как именно и по каким принципам формируются списки выдачи в поисковых системах.
Поэтому необходимо Изучение Ранжирования Применительно к Информационному Поиску (Learning to Rank for Information Retrieval).

Методы ранжирования можно условно классифицировать на три вида:
1. Поточечный подход (pointwise approach) - в этом подходе для каждой пары запрос-документ выдается какое-то численное значение, характеризующая релевантность (та самая дырка в XML выдаче и значение Relevance). И сам Поточечный подход может использоваться в методах машинного обучения.
2. Попарный подход (pairwise approach) - в попарном подходе на вход системы подаются два документа, которые необходимо сравнить. Т.е. из двух документов выбирается документ, который наилучшим образом выдает ответ на запрос.
3. Списочный подход (listwise approach) - в данном случае на вход поступают сразу все документы, которые отвечают на запрос-документ. Дальше применяется какая-либо ранжирующая модель, благодаря которой на выходе получаем отранжированный список.

Например, Матрикснет ложится в классификацию Learning to Rank for Information Retrieval, т.е. его можно причислить к Поточечному подходу, однако сама технология Спектр не ложится в классификацию Learning to Rank for Information Retrieval.

Да и в итоге сам Спектр является гибридным методом, т.к. условно говоря, на входе модель ранжируется по Поточечному подходу, а на выходе, при построении итоговой выдачи, список формируется по Списочному подходу.

Т.е. сами по себе поисковые системы не используют в чистом виде какой-то конкретный подход, а на различных этапах расчета могут применяться различные классификаторы ранжирования.

Классификация документов в поиске

Комментарии:

Velik18.02.15 07:39

Понятно, что сами классификаторы в методах ранжирования весьма различны, тем более существует еще и спектральная примесь и быстророботы и колдунщики, как под это все подстроиться, вот в чем вопрос?

Лиза26.01.15 02:39

Спасибо за информацию!!

Оставить комментарий

наверх