Новый подход к определению релевантности. Или Яндекс лукавит?

Наконец Яндекс рассказал, что происходит с выдачей в последнее время. Причиной ее ухудшения стал эксперимент с релевантностью. Но можно ли верить ответу, который поисковик дал только через три месяца?

По официальной версии, все это время Яндекс специально подмешивал в выдачу сайты с низких позиций и собирал по ним дополнительную пользовательскую информацию, т.к. по-другому это сделать невозможно. Т.к. среди подмешанных сайтов могли быть как качественные, так и некачественные, выдача выглядела не всегда релевантной. И такое краткосрочное снижение качества выдачи должно помочь поисковику выиграть стратегически.

Версия стройная, настораживает только одно. Заявление про «новый подход к определению релевантности» последовало только после того, как SEO-специалисты предположили свои версии происходящего и даже «угадали» или подсказали варианты ответа Яндексу.

Почему Яндекс не рассказал об этом эксперименте раньше? Ведь SEO-сообщество уже несколько месяцев обсуждает прыгающие позиции и спрашивает Яндекс про ухудшившуюся выдачу. Отметим, что это время техподдержка отвечала, что дело в текущем внедрении новой формулы ранжирования. Возможно, дело не только в эксперименте, но и неких технологических проблемах с ранжированием в рамках «Минусинска». Будем наблюдать!

Ниже приводим полный ответ Яндекса:

Традиционный подход заключается в использовании заранее имеющейся информации о факторах, извлекаемых непосредственно после индексации документа, а также последующей "корректировке" релевантного топа с учетом пользовательского поведения на сайте.

Однако априорной информации о документе иногда недостаточно для определения потенциальной пользы в решении поисковой задачи. Некоторые полезные или просто новые документы могут из-за этого ранжироваться низко и, следовательно, потребуется много времени для накопления достаточного количества данных об удовлетворенности пользователя.

Поэтому имеет смысл периодически показывать в области видимости документы, по которым пользовательской информации недостаточно для принятия решения о полезности документа; при этом априорная релевантность такого документа может оказаться не самой высокой.

Таким образом, за счет возможного краткосрочного снижения качества удается получить информацию о документах, участвующих в поиске, и выиграть в качестве стратегически.

На практике невозможно для получения обратной связи от пользователей показать на топовых позициях всё множество документов, которое попадает в выдачу. Поэтому мы применяем комбинацию эксплуатирующего подхода, основанного исключительно на априорной релевантности документа, и экспериментирующего, - целью которого является сбор максимума информации о документах на основе поведения пользователей.

Сегодня многие компании проводят исследования в этой актуальной области информационного поиска. На конференции WWW'15 во Флоренции статья наших сотрудников, посвященная онлайн-обучению алгоритма ранжирования в терминах задачи о многоруких бандитах, была номинирована на Best Paper Award. Мы гордимся их достижением и рекомендуем статью всем заинтересованным специалистам.

Новый подход к определению релевантности. Или Яндекс лукавит?

Оценить статью

Это интересно