January 28, 2023

Полный список факторов ранжирования в Яндекс 2023

  1. # Contains human-readable representation of NFactor::TCodeGenInput message (defined in factors_metadata.proto)
  2. Page rank. Фактор ремапится.
  3. Текстовая релевантность (maxfreq – частота самого частого слова, которая имеет смысл длины документа).
  4. Линковая релевантность. Фактор ремапится.
  5. Priority bonus, приоритет 7 - текстовый приоритет. Фактор бинарный, имеет значение 0 для всех однословных запросов, и значение 1 практически для всех двух и более словных, кроме очень маленького количества ответов, для которых нет ни одной ссылки, прошедшей кворум, и текст тоже не прошел кворум.
  6. Приоритет strict для TR - текстовый приоритет - есть все слова запроса где-то в документе (при этом они проходят контекстные ограничения запроса, например, оба слова д.б. в одном предложении).
  7. Приоритет phrase для TR - текстовый приоритет - есть все слова запроса подряд в документе.
  8. (strict) есть все слова запроса в одном линке.
  9. (phrase) есть все слова запроса подряд в одном линке.
  10. Наличие точной фразы (текста запроса) в заголовке (если точнее, в первом предложении документа). Контекстные ограничения и стоп слова учитываются в точности как в TRp2, т.е. factor[8] minors factor[5]
  11. Встретился участок, прошедший кворум, в котором все словопозиции обозначены как имеющие релевантность BEST_RELEV (заголовок или meta keywords).
  12. Это новости (определяется по характерным ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-3 паттернам в url`е)) ).
  13. Это магазин предложение (определяется по характерным ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-4 паттернам в url`е)) ). Не используется (deprecated)
  14. Это каталог (определяется по характерным ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-2 паттернам в url`е)) или по яндекс-каталогу).
  15. Посещаемость из Бара - ((http://wiki.yandex-team.ru/AndrejjKostjagin/YaBarLog/HostStat Описание данных)). Фактор ремапится.
  16. Длинный документ (чем длиннее документ, тем больше значение фактора).
  17. Hitweigt - вариант текстовой релевантности, в которой веса всех хитов считаются равными (т.е. не учитывают надбавки за title и за близость слов). При этом соответствующие хиты должны пройти ограничения синтаксического колдунщика, т.е. можно считать, что фактор TRhitw равен 0 тогда и только тогда, когда SoftAndOk равен 0
  18. Сумма idf слов запроса. Название не отражает суть: например, для запроса 'Гадяч' этот фактор будет больше, чем для запроса 'Москва Питер Екатеринбург Самара'.
  19. Длинный текст без ссылок.
  20. Это морда.
  21. Означает совпадение региона пользователя и сайта на уровне стран. Фактор бинарный: 1-совпадает, 0-нет. Основан на ((http://wiki.yandex-team.ru/ЯндексПоиск/КлассификацияСайтовИСтраниц/Географическая/ИспользованиеВПоиске геоклассификации сайтов))
  22. Совпадение тематических спектров запроса и документа. Тематика запроса - результат работы ((http://wiki.yandex-team.ru/EvgenijjKroxalev/subquery правила колдунщика SubquerySearch )) Тематика документа берется из яндекс-каталога
  23. Сложносоставной static rank, собирается из статических компонентов по отдельной формуле((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/#oftnd1 *)).
  24. Фактор про число refines. В языке запросов есть фича user refines ('слово, перед которым стоит знак процентика'). По задумке это означает что-то вроде 'хорошо бы, чтобы слово в документе было'. Единственное известное ((http://staff.yandex-team.ru/gulin Андрей Гулин)) ценное использование данной фичи - это запрос [%официальный %сайт НазваниеФирмы]. Пользователям данная фича неизвестна, т.к. не описана ни в какой документации. Планируется, что она исчезнет из языка запросов, но в колдунщике слова с приоритетом USER_REFINE останутся. Фактор говорит о том, сколько максимум USER_REFINE-слов одновременно встречалось в рамках единого попадания в кворум. Считается, что их от 0 до 3 (если >3, то считается, что 3). Это число мапится в полуинтервал [0,1)
  25. Число, на которое умножаются некоторые линковые факторы (именно, факторы номер 6, 7, 47, 66), если текстовая релевантность 0, и ссылок мало
  26. В текстовой релевантности произошло совпадение леммы.
  27. Remapped mascot feature TrafgraphOutAll_share_d
  28. Dssm модель, обучена на переформулировки, в документной части использует релевантные запросу предложения
  29. Значение детектора новостей, рассчитываемого в бегемоте. Всегда 0 при значении детектора меньше порога.
  30. Преобразованное количество слов запроса во всех линках url`а.
  31. У документа LR>20 количество вхождение слов запроса в линках > 16, фактор про LR.
  32. Для документов с высокой LR - нормированная линковая релевантность без учета близости, для документов с низкой LR 0
  33. Url высокую LR.
  34. Качество входящих ссылок (классификатор Лещинера) - сломан, см [405]
  35. Значение фактора CosineMatchMaxPrediction для стрима AliceMusic
  36. Число входящих ссылок. Ремапится.
  37. Популярность запроса
  38. TR деленный на куб количества слов в запросе и преобразованный стандартным remapTR.
  39. Язык документа - русский.
  40. Время добавления страницы, больше - более старый документ; кладется корень из времени, отображенный на интервал [0,1] так, чтобы 3+ года давало 1.
  41. Если главная страница владельца (чаще всего домен второго уровня, например xxxx.ru), то фактор равен 1. Для бомжатников, хостингов, личных блогов и т.д. (например, лайфджорнал, народ.ру и пр.) - домены третьего уровня (типа xxxxx.narod.ru) так же будут иметь фактор равный 1.
  42. Время добавления главной страницы владельца (хоста?), ремапится так же, как AddTime.
  43. Значение фактора AnnotationMaxValueWeighted для стрима AliceMusic
  44. Насколько часто кликают в данный URL по данному запросу - CTR домноженный на поправочный коэффициент
  45. Простой BM25 по тексту.
  46. Простой BM25 по линкам, веса линков не учитываются.
  47. Простой BM25 по тексту и линкам одновременно.
  48. Все слова запроса есть в тексте + линках.
  49. На сайте есть реклама.
  50. На сайте есть реклама Яндекса.
  51. Классификатор спама по фичам из антиспама признал сайт НЕ(!) спамом. Т.е. 0=спам, 1=хороший.
  52. Простой BM25 по парам слов - берем все пары слов запроса и считаем число их вхождений в текст документа. В качества веса пары используем сумму весов слов. Комм Не работает, если в запросе есть стоп-слово
  53. То же, что TxtPair, но для линков; веса линков не учитываются.
  54. BM25 от количества предложений в документе, в которых встречается.
  55. BM25 по словам только в заголовке.
  56. BM25 по словам только с high rel-битиками ('значимым', с выделением (<b> итп)).
  57. Min(число слов запроса/10, 1.f)
  58. 1 / количество_слов_в_запросе.
  59. У документа нет TR.
  60. У документа нет LR.
  61. Для данного урла для данного запроса нет информации о кликабельности 1 - запроса или запроса-urla нет в базе кликов, 0 - запрос-url есть в базе кликов
  62. Для данного запроса нет информации о кликабельности 1 - запроса нет в базе кликов, 0 - запрос есть в базе кликов.
  63. Количество хопов урла в обходе (типа меньше - ближе к морде, тем меньше значение (0 - морда, 1 - с морды добраться нельзя, 0 < можно добраться с морды < 1). Нормальное значение для корня носта 0.0039).
  64. Логарифм от LR, линейно отображенный в [0,1].
  65. наличие пар слов по точной форме
  66. количество предложений, в которых встречается много слов по точной форме
  67. наличие слов в заголовке по точной форме
  68. BM25 по точной форме
  69. Простой BM25 по точной форме.
  70. наличие пар слов c учетом синонимов (>=TxtPair)
  71. количество предложений, в которых встречается много слов c учетом синонимов
  72. наличие слов в заголовке c учетом синонимов
  73. BM25 c учетом синонимов
  74. Простой BM25 c учетом синонимов.
  75. Насколько часто кликают в URLы данного domainId по данному запросу - CTR domainId домноженный на поправочный коэффициент
  76. Для данного domainId для данного запроса нет информации о кликабельности 1 - запроса или запроса-владельца нет в базе кликов, 0 - запрос-владелец есть в базе кликов
  77. Кликабельность владельца независимо от запроса
  78. Относительная частота слов запроса в ссылках (1 - слова запроса часто встречаются в ссылках, 0.3 - редко); если точнее, значение этого фактора пессимизируется при условии: TR=0 && LR=0 && (нет ни одной ссылки со всеми словами запроса) && (не прошёл кворум) && (в тексте встречается хотя бы одна пара слов запроса)
  79. В ссылках есть все слова запроса
  80. В одной ссылке есть все слова запроса
  81. Есть ссылка, прошедшая кворум
  82. Какая доля ссылок “хорошая”
  83. Насколько много “плохих” ссылок (плохой = dpr = 0)
  84. Максимальный dpr ссылки
  85. TfIdf обычный TF*IDF по ссылкам. Частота слова в ссылках умножается на обратную документную частоту и суммируется по всем словам, потом нормируется на длину документа.
  86. Линковая релевантность от Гулина
  87. Линковая релевантность от Гулина
  88. Линковая релевантность от Гулина
  89. Есть точная форма всех слов запроса в тексте/линках
  90. Есть лемма всех слов запроса в тексте/линках
  91. Документ прошел softand по ограничениям синтаксического колдунщика. Только для документов, имеющих текстовую релевантность. Для однословных запросов всегда 1.
  92. Классификатор качества входящих ссылок 2 - сломан, см [407]
  93. равен единице, если у сайта стоит украинский гео-атрибут(т.е 1 - украинский сайт)
  94. Страница с блогохостинга
  95. Страница с livejournal.com
  96. Автоматичемкий классификатор спама им. Алексеева, вероятность того, что сайт спам (0 не спам, 1- спам)
  97. Качество текста. Считается по довольно сложной формуле
  98. Качество текста (классификатор Алексеева)
  99. Ядро аудитории владельцев по данным Яндекс.Браузинга
  100. Ядро аудитории хостов по данным Яндекс.Браузинга
  101. Имеет ли хост ядро
  102. Спам карма имени антиспамеров - вероятность того, что хост – спам; основан на информации whois
  103. музыкальность запроса. Результаты работы колдунщика Антона Коныгина.
  104. число ссылок, точно совпадающих с запросом
  105. Длина документа в предложениях
  106. Длина URL'а, делённая на 5
  107. Коммерческость запроса по словарю фраз от Директа: 0 - максимальная коммерческость, 1 - минимальная.
  108. Размер хоста имени Расковалова в документах без учета дублей (каждый дубль учитывается в факторе самостоятельным документом)
  109. Тип документа - HTML
  110. Число обратное дисперсии временам появления ссылок со словами запроса
  111. Линковая релевантность с учетом тематичности
  112. Линковая релевантность с учетом тематичности
  113. Линковая релевантность с учетом тематичности
  114. Линковая релевантность с учетом качества каждой ссылки
  115. Линковая релевантность с учетом качества каждой ссылки
  116. Линковая релевантность с учетом качества каждой ссылки
  117. Линковая релевантность с учетом качества каждой ссылки и тематичности каждой ссылки
  118. Линковая релевантность с учетом некоммерческости каждой ссылки
  119. Линковая релевантность с учетом некоммерческости каждой ссылки и тематичности
  120. Линковая релевантность с учетом некоммерческости каждой ссылки и качества каждой ссылки
  121. Линковая релевантность с учетом некоммерческости каждой ссылки, качества каждой ссылки и тематичности
  122. Означает совпадение региона, упомянутого в запросе и найденных сайтов на уровне областей. Фактор бинарный: 1-совпадает, 0-нет. Основан на ((http://wiki.yandex-team.ru/ЯндексПоиск/КлассификацияСайтовИСтраниц/Географическая/ИспользованиеВПоиске геоклассификации сайтов))
  123. Процент входящих ссылок со словами запроса
  124. Процент входящих ссылок со всеми словами запроса
  125. Есть ли в запросе слова из yweb/pornofilter/porno.query.
  126. документ из порно-кишки
  127. документ из коммерческой-кишки. Не используется (deprecated)
  128. фэйковый документ
  129. заголовок страницы содержит коммерческую лексику. Не используется (deprecated)
  130. страница из ru.wikipedia.org
  131. коммерческая страница (классификатор Савина)
  132. в документе нет всех слов запроса (с точностью до синонима)
  133. процент слов запроса в документе (с точностью до синонима)
  134. в документе есть все слова запроса (с точностью до синонима)
  135. процент слов запроса в ссылках (с точностью до синонима)
  136. в ссылках есть все слова запроса (с точностью до синонима)
  137. Значение детектора коммерции, рассчитываемого в бегемоте.
  138. TR по парам слов запроса в обратном порядке
  139. LR по парам слов запроса в обратном порядке
  140. TR по парам слов запроса через одно слово в текстах
  141. LR по парам слов запроса через одно слово в текстах
  142. процент всех слова запроса в тексте (с точностью до формы)
  143. в документе есть все слова запроса (с точностью до формы)
  144. Степень централизации точек, из которой задается запрос
  145. Содержит ли запрос блоговую лексику
  146. log(LR, суженной на страну пользователя)
  147. log(LerfLR, суженной на страну пользователя)
  148. Бинарная некоммерческость запроса: QueryNonCommerciality > 0.965.
  149. Число ссылок, совпадающих с текстом запроса (другой remap)
  150. XLerfLRlogRelev (нормированное на сумму Lerf-весов всех ссылок, а не на сумму их исходных весов)
  151. XNonCommLRlogRelev (нормированное на сумму NonComm-весов всех ссылок, а не на сумму их исходных весов)
  152. Линковая релевантность с учетом некоммерческости каждой ссылки и тематичности
  153. XNonCommLerfNormLRlogRelev (нормированное на сумму NonCommLerf-весов всех ссылок, а не на сумму их исходных весов)
  154. Линковая релевантность с учетом некоммерческости каждой ссылки, качества каждой ссылки и тематичности
  155. Не используется Дуплицированность контента. 'Хорошесть' хоста (от 0 до 1), посчитанная исходя из того, сколько и каких хостов заимствуют контент у данного.
  156. Не используется Дуплицированность контента. 'Плохость' хоста (от 0 до 1) – пропорциональна числу вторичного контента на хосте.'Плохость' хоста (от 0 до 1) – пропорциональна числу вторичного контента на хосте.
  157. Средний возраст ссылок, внесших что-то в LR LinkAge=Min(log(средний возраст ссылки)/7, 1), за 1 принято 3 года
  158. Длина текста страницы в словах TLen = Map(число слов, 1/400), где Map(x, y) = x*y / (1 + x*y)
  159. Страница недостижима по ссылкам с морды.
  160. LR с учетом совпадения языка ссылки и запроса
  161. LR с учетом совпадения языка ссылки и запроса и накрученности
  162. отношение числа кликов по данному урлу ко всем кликам по запросу
  163. отношение числа кликов по данному domainId ко всем кликам по запросу
  164. [Bug: Копия фактора 45] Насколько часто кликают в данный URL по данному запросу - CTR домноженный на поправочный коэффициент
  165. Какую часть (в среднем по сессии) от кликнутых по данному запросу с дописанным к нему городом пользователя урлов составляет данный url. Считается по пользовательским сессиям.
  166. Насколько часто кликают в данный URL по данному запросу - CTR домноженный на поправочный коэффициент, по мелким регионам из relev_regions.web.txt
  167. Насколько часто кликают в URLы данного domainId по данному запросу - CTR domainId домноженный на поправочный коэффициент, по мелким регионам из relev_regions.web.txt
  168. отношение числа кликов по данному урлу ко всем кликам по запросу, по мелким регионам из relev_regions.web.txt
  169. отношение числа кликов по данному domainId ко всем кликам по запросу, по мелким регионам из relev_regions.web.txt
  170. Query URL Clicks Combo, по мелким регионам из relev_regions.web.txt
  171. Query DOwner Clicks Combo, по мелким регионам из relev_regions.web.txt
  172. LR по каталожным описаниям
  173. LR по отписанию в Яндекс.Каталоге
  174. Длина максимального совпадения форм в тексте и запросе
  175. Вес максимального совпадения форм в тексте и запросе
  176. Длина максимального совпадения по лемме в тексте и запросе
  177. Вес максимального совпадения по лемме в тексте и запросе
  178. Маскимальный возраст значимого скопления ссылок, внесших что-то в LR
  179. Варианты соответствующих факторов с учетом стоп слов
  180. Варианты соответствующих факторов с учетом стоп слов
  181. Варианты соответствующих факторов с учетом стоп слов
  182. Варианты соответствующих факторов с учетом стоп слов
  183. Варианты соответствующих факторов с учетом стоп слов
  184. TR лучшего пассажа - насколько качественный сниппет может получиться
  185. TR с дисконтом за номер предложения
  186. Хост ранк по максимально выраженному слову запроса (обычно это название сайта)
  187. Кликабельность domAttr по максимальномо выраженному слову. Например для всех запросов в которых есть слово википедия кликают на странцы википедии.
  188. HostRank по отдельным словам
  189. Кликабельность домена по словам
  190. URL удовлетворяет регулярке FORUM_DETECTOR
  191. Значение фактора AnnotationMatchWeightedValue для стрима AliceMusic
  192. В URL есть древняя дата. Распознаются древние новости. Фактор 1 если в урле есть год <=2007.
  193. Вес максимального совпадения форм в тексте и запросе
  194. Вес максимального совпадения форм в тексте и запросе
  195. На странице есть про 'оплату SMS'.
  196. Антиспамеры пессимизировали сайт - все динамические линковые факторы обнуляются. zerolnk.flt
  197. Магазинность страницы
  198. Порнографичность страницы
  199. Remapped mascot feature TrafgraphOutAll_share_m
  200. Remapped mascot feature TrafgraphOutAllSE_share_d
  201. Remapped mascot feature TrafgraphOutAllSE_share_m
  202. Remapped mascot feature NoExtClicksShare
  203. Поисковый трафик - переходы с поисковых систем на сайт (2-ая формула)
  204. Поисковый трафик - переходы с поисковых систем на сайт (2-ая формула)
  205. Переходы на сайт из поисковиков по отдельным словам, по данным бара
  206. Значение фактора BclmMixPlainK000001 для стрима AliceMusic
  207. Наибольшая общая подстрока урла и запроса, нормированная длиной урла
  208. Все совпадения только в URL'е, в тексте страницы совпадений нет
  209. Три уровня совпадения географии пользователя и страницы
  210. Три уровня совпадения региона ссылок и запроса
  211. Географическая близость
  212. Является ли запрос навигационным, по кликабельности ответов
  213. Наиболее характерное слово запроса, соответствующее сайту, по данным бара
  214. Кликабельность хоста по первому слову запроса. Достаточно часто первое (последнее) слово запроса - явное указание сайта, на котором следует искать информацию.
  215. Значение фактора CMMatchTop5AvgMatch для стрима AliceMusic
  216. среднее по пользователям активное непрерывное время нахождения пользователя (в сек) на страницах хоста после перехода по запросу из поисковой системы (фактор зависит от пары (запрос,domAttr)).
  217. среднее по пользователям активное непрерывное время нахождения пользователя (в сек) на страницах хоста после перехода по запросу из поисковой системы (фактор зависит от пары (запрос,domAttr)). По внутр счетчику Яндекс.Бара/Элементов/Браузера
  218. среднее по пользователям число активных действий (клики, нажатия клавиш) при непрерывном нахождении пользователя на страницах хоста после перехода по запросу из поисковой системы (фактор зависит от пары (запрос,domAttr)). . По внутр счетчику Яндекс.Бара/Элементов/Браузера
  219. Кол-во уникальных посетителей из поисковиков по конкретному запросу
  220. среднее по пользователям активное непрерывное время нахождения пользователя (в сек) на странице после перехода по запросу из поисковой системы (фактор зависит от пары (запрос,урл)).
  221. среднее по пользователям активное непрерывное время нахождения пользователя (в сек) на странице после перехода по запросу из поисковой системы (фактор зависит от пары (запрос,урл)). По внутр счетчику Яндекс.Бара/Элементов/Браузера
  222. среднее по пользователям число активных действий (клики, нажатия клавиш) на странице после перехода по запросу из поисковой системы (фактор зависит от пары (запрос,урл))
  223. Размечается пул из PRS логов при помощи Bert, обученного на sinsig. На этом пуле обучается dssm модель, с использованием BaseRegionChain
  224. Размечается пул из PRS логов при помощи Bert, обученного на релевантность. На этом пуле обучается dssm модель, с использованием BaseRegionChain
  225. Значение фактора PerWordCMMaxMatchMin для стрима AliceMusic
  226. Значение фактора AttenV1_Bm15_K05 для стрима AliceMusic
  227. Значение фактора AnnotationMaxValueWeighted для стрима AliceMusic
  228. Запрос не на русском языке
  229. документ из зарубежного кластера
  230. Размер региона страницы
  231. Фактор обратно пропорционален размеру региона страницы
  232. Размер региона запроса
  233. Фактор обратно пропорционален размеру региона запроса
  234. Географическая близость пользователя и сайта
  235. Характеризует раскрученность сайта линковыми кольцами. Значение - доля внешних ссылок, которые входят в линковые кольца и линкообменники.
  236. кол-во уникальных посетителей, ремапится экспоненциально
  237. Доля трафика с поисковых систем
  238. доля заходов на сайт не по ссылкам (набор руками или с закладок)
  239. среднее по пользователям активное непрерывное время нахождения пользователя (в сек) на страницах хоста
  240. среднее по пользователям активное непрерывное время нахождения пользователя (в сек) на страницах хоста. По внутр счетчику Яндекс.Бара/Элементов/Браузера
  241. среднее по пользователям число активных действий (клики, нажатия клавиш) при непрерывном нахождении пользователя (в сек) на страницах хоста.
  242. реализация алгоритма описанного в статье ((http://wiki.yandex-team.ru//h.yandex.net/?http%3A%2F%2Fresearch.microsoft.com%2Fen-us%2Fpeople%2Ftyliu%2Ffp032-liu.pdf http://research.microsoft.com/en-us/people/tyliu/fp032-liu.pdf))
  243. Посещаемость урла по данным я-бара
  244. Количество уникальных посетителей урла
  245. среднее по пользователям время нахождении пользователя на странице. Cчитается как разница между соседними переходами.
  246. Это SEA фактор = s4_r/ (k_r+10) где s4_r - число кликов > 180 сек, k_r - общее число кликов. Считается с учётом переформулировок.
  247. Это SEA фактор = s4_r/ (k_r+10) где s4_r - число кликов > 180 сек, k_r - общее число кликов. Считается с учётом переформулировок. Локализованная версия
  248. Степень разнообразия запросов, по которым кликают данный урла
  249. Страница коммерческая по ключевым словам. Не используется (deprecated)
  250. Idf по различным частям документа, сломаны, не используются
  251. Idf по различным частям документа, сломаны, не используются
  252. Idf по различным частям документа, сломаны, не используются
  253. Idf по различным частям документа, сломаны, не используются
  254. Линковый фактор про наличие видео на странице.
  255. BM25 по региону пользователя для локализуемых запросов, для нелокализуемых в КУБе - страна. Тексты отправляемых для регионов запросов можно посмотреть в relev_regions.txt в колдунщике
  256. То же самое для линковой релевантности
  257. Доля входящих продажных ссылок. Реализован алгоритм распознавания коммерческих ссылок. Фактор ремапится на [0,1] если доля таких ссылок > 50%, иначе 0. ((http://wiki.yandex-team.ru/SvetlanaShorina/topseolinks выборка накрученных сайтов))
  258. Предыдущий фактор умноженный на PornoQuery
  259. Фактор CommLinksSEOHosts умноженный на NonCommercialQuery
  260. В запросе упоминается товарная категория. Не используется (deprecated)
  261. В запросе упоминается вендор. Не используется (deprecated)
  262. Географическая распределенность запроса
  263. Запрос задают преимущественно ночью
  264. Запрос задают преимущественно утром
  265. Запрос задают преимущественно днем
  266. Запрос задают преимущественно вечером
  267. Степень выраженности задания запросов в разное время суток
  268. Характеризует частоту слов в ссылках. Фактор большой, если слово, сыгравшее в линковой релевантности, редкое для ссылок.
  269. Совпадение тематических спектров запроса и документа. Тематика запроса - результат работы ((http://wiki.yandex-team.ru/EvgenijjKroxalev/subquery правила колдунщика SubquerySearch )) Тематика документа определяется автоматическим классификатором
  270. Вес слов запроса, которые есть в тексте
  271. Вес слов запроса, которые есть в линках
  272. Вес слов запроса, которые есть в тексте и линках
  273. Энтропия - распределение кликов
  274. Энтропия - распределение показов
  275. Энтропия - распределение отношения клики/показы
  276. Документ порно по тексту ссылкок
  277. Документ порно по тексту ссылкок, другая нормировка
  278. Классификатор порно-запросов, другой словарь чем PornoQuery
  279. Значение фактора AttenV1_Bm15_K05 для стрима AliceMusic
  280. Географическая близость страны сайта и страны запроса
  281. Покрытие домена трехбуквиями из запроса. (Челябинская лотерея - chelloto. Переводим запрос в транслит, находим трехбуквия которые покрываются (che, hel, lot, olo), смотрим какую долю от всех трехбуквиев покрыли )
  282. То же, что и предыдущий фактор, но про весь урл кроме домена
  283. Запрос является локально-специфическим. Запрос часто переформулируют с явным заданием региона. ((https://ml.yandex-team.ru/archive/thread1433892/#message1433892 подробнее))
  284. Считаем текстовые фичи, считая что тайтл страницы приписан к каждому ее предложению, т.е. расстояние между словом из тайтла и любым другим словом 1 предложение. Len- максимальное отношение слов из запроса встретившихся в каком-то предложении текста (с приписанным тайтлом) в отношении к длине запроса. Пример [Хармс цирк Вертунов] для ((http://wiki.yandex-team.ru//h.yandex.net/?http%3A%2F%2Fwww.wikilivres.info%2Fwiki%2F%25D0%25A6%25D0%25B8%25D1%2580%25D0%25BA_%25D0%25A8%25D0%25B0%25D1%2580%25D0%25B4%25D0%25B0%25D0%25BC_%28%25D0%25A5%25D0%25B0%25D1%2580%25D0%25BC%25D1%2581%29 этого документа))
  285. Отношение суммы idf встретившихся слов в предложении+тайтл ко всем словам.
  286. То же самое что JokerLen, по точным формам
  287. То же самое что JokerWeight, по точным формам
  288. Remapped mascot feature More120SecVisitsNotSearchShare
  289. Аналоги соответствующих текстовых факторов для линков. BM25 от количества ссылок, в которых произошло совпадение.
  290. Простой BM25 по точной форме в текстах ссылок
  291. Наличие в ссылках пар слов c учетом синонимов
  292. Количество ссылок, прошедших порог
  293. Простой BM25 по ссылкам c учетом синонимов
  294. Запрос про видео
  295. Кликабельность владельца независимо от запроса, отдельно по регионам
  296. Энтропия - распределение кликов. Регионализованный
  297. Энтропия - распределение показов. Регионализованный
  298. Энтропия - распределение отношения клики/показы. Регионализованный
  299. equals 2 * NastyContent
  300. equals 2 * NastyContent
  301. always zero
  302. Домен в зоне .com
  303. Домен в зоне .ua
  304. Домен не в зоне .ru
  305. LR по ссылкам из Яндекс.Маркета
  306. Стихотворность документа
  307. Максимальная стихотворность четверостишья
  308. Язык документа - английский
  309. Запрос полностью покрывается двумя точными группами, состоящими из exact match слов запроса подряд ((http://wiki.yandex-team.ru/poiskovajaplatforma/tr/CoverageByGroups Про покрытие группами))
  310. Cуществует группа, состоящая из exact match слов запроса, покрывающая запрос (возможно, с пропуском, добавлением или заменой слова)
  311. Доля запроса, покрываемая самой длинной группой, состоящей из любых хитов (в т.ч. словоформ и синонимов). Возможно, с пропуском, добавлением или заменой слова
  312. Характеризует близости временных профилей запроса и документов по рабочим дням
  313. Характеризует близости временных профилей запроса и документов по выходным дням
  314. Язык документа кириллический
  315. Запросные факторы - результат работы ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/GeoRegionality классификатора геолокализованности запроса))U- геобесполезные - региональная выдача по запросу бессмысленна
  316. R- георелевантные - региональные результаты в выдаче могли бы быть полезны, но не более того
  317. V- геовитальные - региональная выдача имеет принципиальное значение
  318. В урле нет цифр
  319. Значение фактора AllWcmMaxMatch для стрима AliceMusic
  320. Значение фактора CosineMatchMaxPrediction для стрима AliceMusic
  321. Показывают насколько текст является неестественным с точки зрения русского языка. Оценка того, насколько можно считать текст документа сгенерированным синонимайзером либо вообще автоматическим. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=1il#h58953-2 подробнее))
  322. Показывают насколько текст является неестественным с точки зрения русского языка. Оценка того, насколько можно считать текст документа сгенерированным синонимайзером либо вообще автоматическим. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=1il#h58953-2 подробнее))
  323. Показывают насколько текст является неестественным с точки зрения русского языка. Оценка того, насколько можно считать текст документа сгенерированным синонимайзером либо вообще автоматическим. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=1il#h58953-2 подробнее))
  324. nd/k нормированное время до клика
  325. nd/i
  326. nd/k
  327. w/k
  328. o/i
  329. подобранная формула
  330. r_s4b/(r_k + 10)
  331. Имеет ли запрос полный синтаксический разбор
  332. Дата документа которая прописана на странице, ремапится квадратным корнем
  333. Remapped mascot feature VisitsPVisitors
  334. Дополнительные факторы про раскрученность сайта линковыми кольцами , ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=181r#h58953-4 подробнее))
  335. Дополнительные факторы про раскрученность сайта линковыми кольцами , ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=181r#h58953-4 подробнее))
  336. Дополнительные факторы про раскрученность сайта линковыми кольцами , ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=181r#h58953-4 подробнее))
  337. У документа есть текстовая релевантность
  338. BM25, где в качестве 'слов' выступают выделенные сегменты запроса
  339. 'Вес' сегментов запроса в тексте
  340. Показатель неестественности текста с точки зрения русского языка. Число плохих пар слов в тексте, перенормированное в отрезок [0,1] по формуле z/(z+10)
  341. Доля плохих пар среди всех найденных в таблице: z/(x+1), где z – число плохих пар в тексте, а x – число ((http://wiki.yandex-team.ru/EvgenijjGrechnikov/TestSynonimizers 2000-релевантных)) пар
  342. число латинских букв в тексте (не считая разметки), загнанное в [0,1] формулой n/(n+100)
  343. Дополнительные факторы про раскрученность сайта линковыми кольцами , ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=181r#h58953-4 подробнее))
  344. Предыдущие факторы - исправленные
  345. Предыдущие факторы - исправленные
  346. Предыдущие факторы - исправленные
  347. Предыдущие факторы - исправленные
  348. фактор, хитрым образом скомбинированный из FRC и псевдо-CTR
  349. фактор, хитрым образом скомбинированный из FRC и псевдо-CTR
  350. Линковая релевантность с пессимизацией за большой возраст линка
  351. Число слов в тексте (Слово - то, что выделил леммер), отображается в [0,1] по формуле x/(x+A)
  352. Число слов русского языка в заголовке
  353. Средняя длина слова
  354. Процент числа слов внутри тега <a>..</a> от числа всех слов
  355. Процент числа слов вне тегов (вне скобок <>) от числа всех слов
  356. Процент числа слов, являющихся 200 самыми частыми словами языка, от числа всех слов текста
  357. Число использованных в тексте 500 самых популярных слов языка, деленное на 500
  358. Логарифм среднего геометрического вероятностей триграмм в тексте. (вероятность триграммы - число ее встречаний в тексте, деленное на число всех триграмм) , отображается в [0,1] по формуле -x(x+A)
  359. Логарифм среднего геометрического условных вероятностей триграмм. условная вероятность триграммы - ее вероятность, деленная на вероятность биграммы из первых двух слов
  360. Аналог фактора QueryDOwnerClicksPCTR, отличается от него тем, что запросы нормализуются по доппельгагерам (подробности такой нормализации - у ((http://staff.yandex-team.ru/finder Андрея Плахова)), код -ysite/yandex/doppelgangers)
  361. Аналог фактора QueryDOwnerClicksPCTR, отличается от него тем, что запросы нормализуются по доппельгагерам (подробности такой нормализации - у ((http://staff.yandex-team.ru/finder Андрея Плахова)), код -ysite/yandex/doppelgangers). Локализованный до relev_regions.web.txt
  362. Аналог фактора QueryUrlClicksPCTR, отличается от него тем, что запросы нормализуются по доппельгагерам (подробности такой нормализации - у ((http://staff.yandex-team.ru/finder Андрея Плахова)), код - ysite/yandex/doppelgangers)
  363. Аналог фактора QueryUrlClicksPCTR, отличается от него тем, что запросы нормализуются по доппельгагерам (подробности такой нормализации - у ((http://staff.yandex-team.ru/finder Андрея Плахова)), код - ysite/yandex/doppelgangers). Локализованный до relev_regions.web.txt
  364. BM25 по URL'у
  365. На странице есть большая картинка
  366. Ко всем факторам применяется MatrixNet - формула (TG_UNUSED - чтобы предотвратить вхождние в какие-либо формулы)
  367. Разница между текущей датой и датой документа, определённой датировщиком, 1 - дата документа равна текущей, 0 - документу 10 лет или более, Если дата не определена, равен 0. Внимание!((1 - DaterAge)*60)^2 = возраст страницы в днях.
  368. жесткая пессимизация (aka PR=0), бинарный фактор, считается в антиспаме
  369. Хостовые факторы, определяют сайты, накрученные линками - вторая и третья входящие степени ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=181rh58953-4#cindegree12 подробнее))
  370. Хостовые факторы, определяют сайты, накрученные линками - вторая и третья входящие степени ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=181rh58953-4#cindegree12 подробнее))
  371. Число входящих ссылок без русских букв. Ремапится.
  372. Максимальное число форм по всем словам запроса - max по всем словам запроса числа_форм_для_слова/64
  373. Взвешенная по весам слов сумма числа форм - сумма по всем словам запроса числа_форм_для_слова/64*вес_слова; remap вида x/(1 + x).
  374. Невзвешенная сумма числа форм - сумма по всем словам запроса числа_форм_для_слова/64/число_слов_запроса
  375. Максимальное число форм по всем словам запроса
  376. Взвешенная по весам слов сумма числа форм
  377. Невзвешенная сумма числа форм
  378. Аналоги одноименных факторов, вес слова = 1
  379. Аналоги одноименных факторов, вес слова = 1
  380. Аналоги одноименных факторов, вес слова = 1
  381. Аналоги одноименных факторов, вес слова = 1
  382. Аналоги одноименных факторов, вес слова = 1
  383. Аналоги одноименных факторов, вес слова = 1
  384. Сегменты запроса - это части запроса, которые сами по себе являются частотными запросами. Фактор показывает, насколько сегменты бьются в тексте. значение 0 - все слова встречаются только в рамках обозначенных сегментов, 1 -- все вхождения разбивают сегменты
  385. Значение фактора CMMatchTop5AvgMatch для стрима AliceMusic
  386. Доля разных частей речи в тексте. доля числительных (среди всех слов, у которых удалось распознать часть речи)
  387. доля частиц
  388. доля местоименных прилагательных
  389. доля местоименных существительных
  390. доля глаголов
  391. доля слов, которые могут быть как существительными мужского рода, так и существительными женского рода, но не среднего рода, среди всех существительных (примеры: 'колибри' - пример неопределённого рода, который можно определять двумя способами, 'Александра' - омонимия).
  392. Качество входящих ссылок (классификатор Лещинера) исправленный
  393. Считали LinkQuality для этой страницы или нет (не считали, если ссылок мало) исправленный
  394. Классификатор качества входящих ссылок 2 исправленный
  395. В запросе название организации (пример: Газпром, газпрома) ((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares Описание))
  396. Значение фактора CMMatchTop5AvgMatchValue для стрима AliceMusic
  397. Размер самого большого текстового сегмента страницы (из фактора [18] PureText)
  398. линковая релевантность без учета редких слов
  399. Количество различных внутренних ссылок на страницу
  400. Для сайта определен город
  401. Запросные факторы - результат работы ((http://wiki.yandex-team.ru/PoiskovajaPlatforma/Lingvistika/ZaprosnyjeFactory/LocalizovannyjeZaprosy классификатора геолокализованности запроса)) - новая версия факторов [328]-[330]: U - геобесполезные - региональная выдача по запросу бессмысленна;
  402. Запросные факторы - результат работы ((http://wiki.yandex-team.ru/PoiskovajaPlatforma/Lingvistika/ZaprosnyjeFactory/LocalizovannyjeZaprosy классификатора геолокализованности запроса)) - новая версия факторов [328]-[330]: R - георелевантные - региональные результаты в выдаче могли бы быть полезны, но не более того;
  403. Запросные факторы - результат работы ((http://wiki.yandex-team.ru/PoiskovajaPlatforma/Lingvistika/ZaprosnyjeFactory/LocalizovannyjeZaprosy классификатора геолокализованности запроса)) - новая версия факторов [328]-[330]: V - геовитальные - региональная выдача имеет принципиальное значение.
  404. Значение фактора PerWordCMMaxPredictionMin для стрима AliceMusic
  405. Украинский Page rank
  406. =1 - вкл. формула Download. Запросы класса: скачать/смотреть онлайн/играть/фото/слушать
  407. Результат классификатора запроса - в запросе есть слова из соответствующего словаря. бренд
  408. медицинсий словарь
  409. вопрос
  410. запрос специфический для Москвы
  411. организация
  412. порно
  413. путешествия
  414. Популярность видео-ролика, приходит от видео
  415. Периодичность ссылок на сайт
  416. Количество почти-периодических ссылок
  417. Количество показов owner'а по запросу, нормировка x/(100 + x).
  418. Количество показов url'а по запросу, нормировка x/(100 + x).
  419. Наличие счетчика LiveInternet
  420. Популярность owner'а в запросах
  421. DSSM модель с ранним связыванием, обученная на реформулировках и дообученная на ASR гипотезы музыкальных запросов к Алисе
  422. Модель, обученная на пуле по PRS-логу на предсказание Bert, обученного на sinsig_ce с пороговым значениeм 0.5, с использованием цепочки регионов до страны
  423. DSSM модель с ранним связыванием, обученная на реформулировках и дообученная на музыкальные запросы к Алисе
  424. Одиннадцать факторов основанных на статистических свойствах распределений входящих степеней вершин, ссылающихся на фиксированную вершину хостграфа.((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/hostdegree подробнее))
  425. Значение детектора пиратскости, рассчитываемого в бегемоте.
  426. Тип канонизированного урла яндекс музыки - альбом
  427. Считается как (10-x) где x — возвраст документа в днях (непрерывно) относительно времени валидности документа в самоваре
  428. Хост документа распознан в запросе
  429. URL состоит только из хоста, который распознан в запросе
  430. URL является сюжетом Яндекс новостей
  431. URL feature computed from rapid clicks spy_log counters with decay of 1 day
  432. URL feature computed from rapid clicks spy_log counters with decay of 1 day
  433. URL feature computed from rapid clicks spy_log counters with decay of 0.5 days
  434. URL feature computed from rapid clicks spy_log counters with decay of 0.5 day
  435. Считаются как (80 - x) / 80, где x — возраст документа в часах. Факторы имеют смысл только для базы быстробота (последние 80 часов). Не используются в ранжировании. Используются в переранжировании.
  436. Считаются как (80 - x) / 80, где x — возраст документа в часах. Факторы имеют смысл только для базы быстробота (последние 80 часов). Не используются в ранжировании. Используются в переранжировании.
  437. Хитрый BM25 в скользящем окне. Размер окна задается в предложениях. Используются «джокеры» для заголовков и начала документа. Учитывается морфологическая близость и структура текста. Вес окна затухает с удалением от начала документа.
  438. Фактор про то, наскоько хороший сниппет может получиться.
  439. Простой BM25 по парам слов - берем все пары слов запроса и считаем число их вхождений в текст документа. Вес =1. Комм Не работает, если в запросе есть стоп-слово
  440. Логарифм числа шинглов, на которых данный документ не уникален
  441. Логарифм числа шинглов, на которых данный владелец документа признан автором
  442. Средний вес не-уникальных шинглов данного документа
  443. Mascot feature MarketQualityRating
  444. Medical host quality for new marks.
  445. Medical host quality for new marks for experiments.
  446. Finance or law host quality for new marks.
  447. Finance or law host quality for new marks for experiments.
  448. Finance or law host quality for new marks.
  449. Finance or law host quality for new marks for experiments.
  450. Factor for host in list of documentation cs hosts for experiments
  451. Cчитается так же, как и фактор HostRank, но не на всём owner-графе, а на его подграфе, состоящем из owner'ов данного региона. Принадлежность к региону определяется по TLD, либо по наличию в индексе страниц с данного owner'а, про которые geo или geoa классификатор говорит, что они из этого региона. Маппируется точно так же, как и фактор HostRank, в число от 0 до 1 с 256 градациями
  452. Документ из языкового раздела википедии, соответствующего пользовательскому региону
  453. Язык документа соответствует языку запроса
  454. Популярность запроса внутри страны
  455. Степень централизации точек, из которой задается запрос (внутри страны)
  456. Географическая распределенность запроса внутри страны
  457. Час, в который больше всего задают этот запрос
  458. Степень выраженности задания запросов в разное время суток (внутри страны)
  459. Страна документа (домен) и страна пользователя совпадают ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/OpisanijaFaktorov#nationaldomain подробнее))
  460. На странице порно реклама
  461. URL feature computed from rapid clicks spy_log counters with decay of 3 days
  462. Страновый классификатор локализуемости - насколько запрос подразумевает контекст страны
  463. Число слешей в урле
  464. BM25 с разными параметрами для разных полей, включая входящий анкортекст. Веса текста входящих на страницу ссылок нормируются в зависимости от delta page rank ссылки
  465. Наличие встроенного видеоплеера на странице
  466. Видео для скачивания
  467. URL feature computed from rapid clicks spy_log counters with decay of 3 days
  468. URL feature computed from rapid clicks spy_log counters with decay of 14 days
  469. Служебный фактор, который нужен был для поиска по сайту, и в будущем еще будет нужен.
  470. Фактор вычисляется из текста урла с помощью классификатора последовательностей quality/seq/gsk
  471. Модель с обучением каждой триграммы на '+' и '-' урлах. Не зависит от запроса.
  472. URL feature computed from rapid clicks spy_log counters with decay of 14 days
  473. Age of rapid clicks spy_log update, in seconds
  474. Freshness of rapid clicks spy_log update
  475. Размер минимального куска текста, включающего все встречающиеся в документе слова запроса. Сейчас не используется. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/YMW подробнее))
  476. Фактор имени Buettcher, Clarke и Lushman (модифицированный) ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/BCLm подробнее))
  477. Мера 'коммерческости' запроса. Является комплексно рассчитываемым фактором MatrixNet формулой по словарю закупок в директе + по логам пользовательских запросов + доп. интентные словари. Запросы с интентом купить фактор стремится в ->1 товарные запросы ->0.6 с интентом не купить, обзоры и тп -> 0 ((http://wiki.yandex-team.ru/AntonNeljubin/FaktorydljaNovogoKlassifikatorazaprosov факторы классификатора))((http://wiki.yandex-team.ru/JandeksPoisk/Antispam/AntiSEO/KlassifikatorKommercheskixZaprosov еще про него))
  478. Униграммная языковая модель. Моделируется языковая по документу, сглаживается общеязыковой моделью. При построении модели по документу используется информацию о том, в каком поле документа встретилось слово запроса (Title, head или plain text)
  479. Совпадение географии, определённой из урла документа и города запроса (ip или lr)
  480. Совпадение географии, определённой из урла документа и области запроса (ip или lr)
  481. Совпадение географии, определённой из урла документа и страны запроса (ip или lr). Актуально для России и Украины.
  482. Совпадение географии, определённой из урла документа и города в запросе (правило GeoCity)
  483. Значение форкнутого детектора коммерции, рассчитываемого в бегемоте.
  484. Вычисляет покрытие запроса буквенными триграммами заголовка документа
  485. Вычисляет покрытие заголовка буквенными триграммами заголовка документа
  486. Вероятностная модель, построенная по текстам входящих ссылок
  487. Считает сумму вхождений следующего вида: последовательность слов запроса длиной больше двух, встретившихся в одном предложении; нормировано на длину документа.
  488. Считает сумму вхождений следующего вида: последовательность слов запроса длиной больше двух, встретившихся в одной ссылке; нормировано на кол-во ссылок.
  489. Доля кликов по навигационным запросам
  490. Результат имеет геопривязку, не совпадающую с географией пользователя на уровне города ([415]==1 && [215]==0)
  491. Геовитальность запроса для результатов из региона пользователя
  492. Геовитальность запроса для результатов не из региона пользователя
  493. доля урлов, которые отвечают без ошибок
  494. Совпадение тематического спектра (по DMOZ) запроса и документа. Тема запроса определяется ((http://wiki.yandex-team.ru/JandeksPoisk/ZarubezhnyjjInternet/DMOZqueryClassifier1 правилом колдунщика DMOZTheme )) Тематика документа определяется автоматическим классификатором
  495. Совпадение тематического спектра (по DMOZ) запроса и документа. Тема запроса определяется лучшим результатом ((http://wiki.yandex-team.ru/JandeksPoisk/ZarubezhnyjjInternet/DMOZqueryClassifier1 правила колдунщика DMOZTheme )) Тематика документа определяется автоматическим классификатором
  496. Оценивает минимальное расстояние между парами слов запроса с учетом удаленности пары от начала документа (Minimal Pair Size with Attenuation). Под парами понимаются все последовательные биграммы слов запроса. Таким образом, количество пар равно количеству слов в запросе, уменьшенному на 1. Соответственно, фактор имеет смысл для запросов, состоящих более чем из одного слова.((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/MPSA MPSA))
  497. Отличается от BCLm тем, что веса всех слов считаются одинаковыми. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/BCLm2 BCLm2))
  498. Текстовая релевантность на основе языковой модели, учитывающая абсолютную позицию. Идем по тексту с окошком 20 слов, строим по каждому окошку языковую модель (то есть распределение вероятностей на словах русского языка) и вычисляем вероятность порождения запроса. За удаление от начала документа штрафуем модель.
  499. Размер региона страницы
  500. Freshness of rapid clicks spy_log update, calculated at the request time
  501. Cпускает на базовые поиски под именем isgeo максимальный вес встреченного геообъекта в запросе. Под геообъектом понимается объект категории Geo, Geo1, GeoAddr, GeoAddr1, LandMark, LandMark1 (см. ((http://wiki.yandex-team.ru/AlekseySokirko/QueryObjects som-овскую разметку))).((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares Подробнее))
  502. Cпускает на базовые поиски под именем ismusic максимальный вес встреченного объекта категории Music или Music1 в запросе. (см. ((http://wiki.yandex-team.ru/AlekseySokirko/QueryObjects som-овскую разметку))).((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares Подробнее))
  503. Модификация фактора Bclm2, облегченная для использования в фастранке. Основное отличие состоит в том, что в BclmLite не используются абсолютные смещения слов относительно начала документа. Вместо этого фактор работает с обычными позициями вида <Номер_предложения, Позиция_в_предложении>. При этом близость между словами учитывается только внутри предложения.((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/BCLmLite BCLmLite))
  504. При ответе на запрос важны результаты в непосредственной близости ([аптеки], [детская поликлиника])
  505. При ответе на запрос важны результаты внутри города (основная масса локализуемых запросов)
  506. При ответе на запрос важны результаты из области, региона пользователя ([аэропорт], [молокозавод])
  507. Число входящих ссылок с морд
  508. Исправленный YmwFull. Отличается от предыдущей версии только поведением на 2хсловных запросах. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/YMW подробнее))
  509. Бинарный фактор, каждое слово запроса есть в тексте или в линках
  510. uses 'country aux tree' (auxqc)
  511. uses 'country aux tree' (auxqc)
  512. Страница — '404' (доля токенов '404' по отношению к общему числу токенов на странице)
  513. URL feature computed at the request time from rapid clicks spy_log counters with decay of 1 day
  514. BM25, в котором вес слова машинноподобран
  515. Фактор оценивает как слова запроса группируются друг с другом в тексте документа без учета их порядка. ((http://wiki.yandex-team.ru/SergejjKrylov/QueryWordCohesionTR описание))
  516. nd/k нормированное время до клика
  517. URL feature computed at the request time from rapid clicks spy_log counters with decay of 0.5 days
  518. nd/k
  519. w/k
  520. o/i
  521. подобранная формула
  522. r_s4b/(r_k + 10)
  523. Количество букв в сегменте Aux
  524. Количество пробелов в сегменте Aux
  525. Количество запятых в сегменте Content
  526. Страница — магазин. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/OpisanijaFaktorov#isshop описание)). Не используется (deprecated)
  527. Логарифм числа шинглов в документе, добавленных хозяином сайта как оригинальные тексты в ((http://wiki.yandex-team.ru/JandeksPoisk/Jekosistema/MarketingPR/Webmasters/plan/vtorcontect Плагин Оригинальности)). В формуле не участвует, нужен для переранжирования дублей
  528. Среднее фильтрованное число источников авторства документа. В формуле не участвует, нужен для переранжирования дублей
  529. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/OpisanijaFaktorov#queryreftrigrams описание))
  530. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/OpisanijaFaktorov#queryreftrigrams описание))
  531. Дисперсия IDF слов запроса при условии наличия текстовых хитов в документе (смешанный запросно-текстовый фактор)
  532. Фактор ранжирования UrlNGramsModel в erf
  533. Язык документа соответствует стране запроса
  534. Порядок слов в ссылках.
  535. Степень разнообразия запросов, по которым кликают данный урла, cчитается по регионам
  536. nd/i
  537. Доля сегментов запроса, присутствующая в тексте
  538. Язык документа - один из допустимых для Турции (турецкий, английский, немецкий, французский, арабский, азербайджанский) либо документ имеет нулевую длину. На поисковой стадии вычисляется только для IsRealGeoLocal запросов.
  539. Вариация на тему ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/DBM25 DBM25)), см. ysite/yandex/relevance/dbm25.cpp
  540. Дисперсия регионов ссылок на документ
  541. Количество кликов по владельцу и количество кликов по запросу больше 5
  542. BM25FdPR с нормировкой на среднюю длину документа, зависящую от языка документа. ((http://wiki.yandex-team.ru/BM25FRework Результаты тестирования.))
  543. Популярность языка документа. Число от 0 до 1. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/LanguagePopularity LanguagePopularity))
  544. Сумма факторов QueryDOwnerClicksFRC и BM25FdPRFixed с весами 0.358449 и 0.184922 соответственно. '565' в названии фактора не надо воспринимать буквально, это легаси либо опечатка.
  545. Сумма факторов 192 и 341 с весами 0.298942 и 0.454625 соответственно.
  546. URL feature computed at the request time from rapid clicks spy_log counters with decay of 3 days
  547. URL feature computed at the request time from rapid clicks spy_log counters with decay of 14 days
  548. Фактор оценивает отличия позиций слов в заголовке от позий слов в запросе
  549. Дисперсия языков в xmap
  550. В запросе есть опечатка
  551. Вариация на тему ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/DBM25 DBM25)), см. ysite/yandex/relevance/dbm25.cpp
  552. Про урл известно что он показывается слишком часто с очень низкой релевантностью (по берту и/или по bm25)
  553. Отношение числа входящих ссылок, текст которых является URL, к числу всех входящих ссылок
  554. Размечается пул из PRS логов при помощи Bert, обученного на sinsig. На этом пуле обучается dssm модель, с использованием BaseRegionChain
  555. Количество 'небукв' в урле
  556. Длина URL'а с точностью до символа. Отключено в продакшн.
  557. Хабовость страницы
  558. Степень комерческости заголовка страницы. Не используется (deprecated)
  559. BM25 заголовка страницы по её тексту
  560. BM25 заголовка страницы по текстам ссылок на неё
  561. Количество входящих сео-треш ссылок между хостами
  562. Статический URL фактор по поисковым сессиям за 1600 дней рассчитанный по мобильным сессиям. Средний DwellTime, причем DwellTime из сессии обрезается, если больше 180 секунд
  563. Статический URL фактор по поисковым сессиям за 1600 дней рассчитанный по мобильным сессиям. Вероятность что клик по URL будет больше 120 секунд
  564. Статический URL фактор по поисковым сессиям за 1600 дней рассчитанный по мобильным сессиям. Вероятность что на URL не кликнут, если кликнут хотя бы на один URL ниже.
  565. Статический URL фактор по поисковым сессиям за 1600 дней рассчитанный по мобильным сессиям. Средний DwellTime, причем DwellTime из сессии обрезается, если больше 3600 секунд. Локализация до уровня стран.
  566. Статический URL фактор по поисковым сессиям за 1600 дней рассчитанный по мобильным сессиям. Средний DwellTime, причем DwellTime из сессии обрезается, если больше 180 секунд. Локализация до уровня стран.
  567. Значение детектора здоровья, рассчитываемого в бегемоте.
  568. OffersBase feature for ecoboost.
  569. OffersBase feature for ecoboost.
  570. OffersBase feature for ecoboost.
  571. OffersBase feature for ecoboost.
  572. Доля уникальных триграмм заголовка в триграммах ссылок
  573. Доля уникальных триграмм ссылок в триграммах заголовка
  574. Зарекламленность страницы
  575. Аналогичный YabarUrlVisits
  576. URL документа соответствует региону(области) пользователя ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/geo/RegNavQueries /JandeksPoisk/KachestvoPoiska/geo/RegNavQueries))
  577. URL документа соответствует городу пользователя
  578. Регионально-навигационный запрос - в регионе пользователя есть один или несколько навигационных результатов по нему
  579. Число сессий в которых урл являлся последним, отнесенное к числу сессий в которых урл появлялся
  580. Сумма максимальных значений SourceRank'ов для каждой входящей ссылки с учётом уникальности владельца.
  581. BM25 по текстам и линкам со спец. весами по уровню совпадения (форма, лемма, синоним)
  582. Вес слов запроса, которые есть в тексте в точной форме
  583. Вес слов запроса, которые есть в тексте с точностью до леммы
  584. Вес слов запроса, которые есть в тексте
  585. Cпускает на базовые поиски под именем ishum максимальный вес встреченного объекта категории Hum или Hum1 в запросе. (см. ((http://wiki.yandex-team.ru/AlekseySokirko/QueryObjects som-овскую разметку))).((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares#ishum Подробнее))
  586. Cпускает на базовые поиски под именем istext максимальный вес встреченного объекта категории Text или Text1 в запросе. (см. ((http://wiki.yandex-team.ru/AlekseySokirko/QueryObjects som-овскую разметку))).((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares#istext Подробнее))
  587. Cпускает на базовые поиски под именем ispicture максимальный вес встреченного объекта категории Picture или Picture1 в запросе. (см. ((http://wiki.yandex-team.ru/AlekseySokirko/QueryObjects som-овскую разметку))).((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares#ispicture Подробнее))
  588. Возвращает под именем wmaxone максимальную степень нарицательности встреченных объектов в запросе. (см. ((http://wiki.yandex-team.ru/AlekseySokirko/QueryObjects som-овскую разметку))).((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares#maxone Подробнее))
  589. Возвращает под именем wminone максимальную степень нарицательности встреченных объектов в запросе. (см. ((http://wiki.yandex-team.ru/AlekseySokirko/QueryObjects som-овскую разметку))).((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares#minone Подробнее))
  590. Bm25 по запросному индексу для domAttr
  591. Bm25 по запросному индексу для domAttr
  592. Bm25 по запросному индексу для domAttr
  593. BCLM по запросному индексу для domAttr
  594. BCLM по запросному индексу для владельцев
  595. Позволяет оценить является ли документ 'живым' с точки зрения ссылок на него приходящих.
  596. Максимальная сумма вес слов запроса в окне в 50 слов
  597. Аналогичный YabarUrlVisitors
  598. Аналогичный YabarUrlAvgTime
  599. Ядро аудитории страниц на которых есть счетчик Метрики
  600. Доля кликов по данному урлу среди всех кликов по похожим запросам
  601. corrected CTR данного урла по всем похожим запросам
  602. Кликабельность домена по биграммам (без учёта тезаурусных расширений запросов)
  603. Переходы на сайт из поисковиков по биграммам, по данным Бара (без учёта тезаурусных расширений запросов)
  604. Кликабельность хоста по последнему слову запроса (без учёта тезаурусных расширений запросов)
  605. OffersBase feature for ecoboost.
  606. OffersBase feature for ecoboost.
  607. Business kernel.
  608. Business kernel.
  609. Business kernel.
  610. URL feature computed at the request time from rapid clicks search counters with decay of 1 day
  611. Копия фактора ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Locm LOCM)) для((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Synset синсетов)).
  612. Копия фактора LinkBM25 для ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Synset синсетов)).
  613. URL feature computed at the request time from rapid clicks search counters with decay of 30 days
  614. Наиболее вероятная тема запроса, определяемая ((http://wiki.yandex-team.ru/JandeksPoisk/ZarubezhnyjjInternet/DMOZqueryClassifier1 правилом колдунщика DMOZTheme)), учитываются только самые популярные темы (но здесь их больше чем в факторе DmozQueryThemes). Фактор содержит вероятность соотвествия запроса тематике, но для каждой темы берётся свой интервал на отрезке [0..1]
  615. Тема запроса, определяемая ((http://wiki.yandex-team.ru/JandeksPoisk/ZarubezhnyjjInternet/DMOZqueryClassifier1 правилом колдунщика DMOZTheme)), учитываются только несколько самых популярных тем.
  616. 0 или 1 в зависимости от наличия в запросе явно выраженного интента need_photo из разнообразия
  617. 0 или 1 в зависимости от наличия в запросе явно выраженного интента need_map из разнообразия
  618. Фактор -- аналог LongQuery (сумма idf слов запроса), но с 'корректным' учетом синонимов. Конкретно -- выбирается минимум по idf (т.е. самое частое) из синонимов и слова.
  619. Урл содержит токен, совпадающий с коротким названием страны пользователя. Фактор считается только на EU потоке.
  620. Персонализированный турецкий PageRank
  621. Ожидаемое количество найденного по запросу
  622. Доля уникальных триграмм фрагмента футера в триграммах ссылок
  623. Доля уникальных триграмм ссылок среди фрагмента триграмм футера
  624. Двоичный логарифм вероятности запроса по языковой модели сервиса опечаток erratum
  625. Url является оффером в последней версии базы маркета.
  626. Вариация на тему ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/DBM25 DBM25)), см. ysite/yandex/relevance/dbm25.cpp
  627. Вариация на тему BM25
  628. Вариация на тему BM25
  629. Вариация на тему BM25
  630. 'Исправленные' клики, посчитанные с помощью RequestAggregateLib
  631. 'Исправленные' клики, посчитанные с помощью RequestAggregateLib. Региональная версия
  632. Региональная Посещаемость урла по данным я-бара
  633. Среднее время пребывания юзера на хосте при внешнем (с другого не-поискового сайта) заходе с конкретного URL
  634. Средняя 'глубина' (количество переходов в рамках хоста) пребывания юзера на хосте при внешнем (с другого не-поискового сайта) заходе с конкретного URL
  635. DBM отдельно по числам
  636. DBM отдельно по гео-объектам запроса
  637. DBM отдельно по существительным
  638. Средняя длина логической сессии, в которой был запрос
  639. Bclm (weighted) по текстам из хопов.
  640. оценка вероятности скачки с документа
  641. Оценивает соответствие позиций слов в предложениях документа позициям слов в запросе.
  642. Коэффициент оттока пользователей из поиска после визита на сайт
  643. В документе присутствует ФИО из запроса.
  644. Это index.(html/php/aspx?/...), без cgi параметров. Считается по всем дублям.
  645. Это index.(html/php/aspx?/...), возможно с cgi параметрами. Считается по всем дублям.
  646. Является ли хост сам себе владельцем, условно Host == Owner(Host).
  647. Минимальная длина PathAndQuery по всем полудублям.
  648. Регионализированный (берутся только ссылки из страны запроса) вариант фактора XLerfGeoLRlogRelev
  649. Регионализированный (берутся только ссылки из страны запроса) вариант фактора XNonCommLerfNormLRlogRelev
  650. Регионализированный (берутся только ссылки из страны запроса) вариант фактора Locm
  651. Регионализированный (берутся только ссылки из страны запроса) вариант фактора XLRrelev
  652. Регионализированный (берутся только ссылки из страны запроса) вариант фактора XLerfLRrelev200
  653. ((http://wiki.yandex-team.ru/JandeksPoisk/Antispam/polunavigacionnyezaprosy#faktornavigacionnostiparyurl-zapros классификатор)) пар витальников [запрос-урл], урл витальный для запроса, если значение на нём >0.5
  654. Классификатор по оценкам коммерческих сайтов
  655. На документе есть прямая ссылка на файл
  656. На документе есть ссылка на файлхостинг
  657. 0 или 1 - матчится ли запрос регулярке из тикета
  658. 0 или 1 - матчится ли запрос регулярке из тикета
  659. 0 или 1 - матчится ли запрос регулярке из тикета
  660. Предсказание доли «хороших»(хотя бы с двумя разными городами и частотой>=10) упоминаний запроса с географией в Турции
  661. Результат работы лексического классификатора запросов, предсказывающего вероятность клика по странице тематики 3561
  662. Результат работы лексического классификатора запросов, предсказывающего вероятность клика по странице тематики 3973
  663. Ранг 'навигационности' запроса
  664. региональная посещаемость из поисковиков по конкретному запросу
  665. Клики по урлам показываемых в выдаче для запросов, по которым ушли искать в другие поисковики
  666. Показы урлов в выдаче для запросов, по которым ушли искать в другие поисковики
  667. Классификатор коммерческости сайта
  668. В последней версии базы маркета есть офферы с данного хоста.
  669. Близость слов запроса к самому тяжелому слову.
  670. Урл удовлетворяет regexp-выражению, заданному в проне
  671. Документ содержит пользовательский отзыв/комментарий
  672. Доля кликов по данному урлу среди всех кликов по похожим запросам, страновая версия, см. ((http://wiki.yandex-team.ru/Development/Poisk/arcadia/indexregex indexregex))
  673. corrected CTR данного урла по всем похожим запросам, страновая версия, см. ((http://wiki.yandex-team.ru/Development/Poisk/arcadia/indexregex indexregex))
  674. Среднее количество найденного по запросу
  675. Угол в пространстве Depth Nodes, посчитанный только по словам (Min по всем)
  676. Классификатор, аппроксимирующий качество коммерческих сайтов на основе данных о пользовательском поведении
  677. Время создания документа с точностью до месяца 1.0 -- текущий месяц, 0 —- 10 лет назад и старше. Временно отключен
  678. Время обновления документа с точностью до месяца 1.0 -- текущий месяц, 0 —- 10 лет назад и старше. Временно отключен
  679. Функция правдоподобия распределения годов в документе. Временно отключен
  680. Num of Sovetnik urls
  681. Дисперсия количества слов запроса в ссылках.
  682. Среднее арифметическое позиций дат в документе. Временно отключен
  683. BM с затуханием по тексту каталожных ссылок.
  684. Средняя позиция урла по нормализованному запросу
  685. Средняя позиция domAttr по нормализованному запросу
  686. Средняя позиция урла по всем запросам
  687. Средняя позиция хоста по всем запросам
  688. Количество запросов на урл
  689. Количество запросов на хост
  690. реализация алгоритма описанного в статье ((http://wiki.yandex-team.ru//h.yandex.net/?http%3A%2F%2Fresearch.microsoft.com%2Fen-us%2Fpeople%2Ftyliu%2Ffp032-liu.pdf http://research.microsoft.com/en-us/people/tyliu/fp032-liu.pdf)) по крупным регионам (ТРУБК)
  691. Доля слов документа из сегментов со score > 2.
  692. Ранг качества сайта, используемый для бустов московской коммерческой формулы
  693. Фактор используется в SelectionRank. TG_UNUSED: не должен входить в формулы во избежание обратной связи
  694. URL feature computed at the request time from rapid clicks search counters with decay of 3 days
  695. Вес документа по однословному словарю коммерческой лексики
  696. Показывает, что запрос на украинском языке
  697. Average query commerciality
  698. Количество запросов в группе частотных запросов похожих на заданный
  699. FRC группы частотных запросов похожих на заданный, с усреднением через сумму кликов и показов
  700. FRC группы частотных запросов похожих на заданный, с усреднением через сумму кликов и показов, по региональной статистике
  701. URL feature computed from rapid clicks search frozen counters with decay of 1 day
  702. Относительная популярность пары word-host, где word - слово из title статьи в Википедии, а host - хост, на который ссылаются в данной статье.
  703. Относительная кликабельность тройки countryId-word-host по данным поисков в Яндексе.
  704. Относительная кликабельность тройки countryId-word-host по данным с популярных поисковиков по логам Бара и SimilarGroup.
  705. Доля кликов по данному урлу среди всех кликов по похожим запросам, посчитанная по popular search engine
  706. Длина лепестка Depth Nodes, посчитанная для хостов
  707. Дисперсия угла в пространстве Nodes Time, посчитанная для хостов
  708. 0.9-квантиль длины лепестка в пространстве Nodes Time, посчитанная для хостов
  709. Средняя по словам запроса вероятность скачать файл с хоста после клика.
  710. Фактор гадкости контента.
  711. CTR по кликовым данным, запрос нормализованы по синсетам
  712. Региональный CTR по кликовым данным, запрос нормализованы по синсетам
  713. Static trigrams intercection of url and queries by which users visited the url.
  714. Результат работы adult правила колдунщика.
  715. Взвешенный BM15 для запроса по индексу документ - список запросов по которым на него переходили.
  716. Вероятность скачки с хоста после клика (по логам Бара).
  717. Количество цепочек по запросу / (количество цепочек, в которых участвовал урл + количество цепочек по запросу).
  718. Количество цепочек, в которых урл был последним, нормированное на общее количество цепочек, в которых был данный урл.
  719. Количество переходов на урл с Википедии
  720. URL feature computed from rapid clicks search frozen counters with decay of 30 days
  721. Показатель страницы как хаба (на какое число страниц пользователи Бара переходят с неё).
  722. Считается TextBM25 в тайтле по тексту названия региона пользователя - аналогично фактору 268.
  723. BCLM for Annotation index, doc text and links.
  724. Dssm предсказание вероятности по url + title, что на странице нет товаров.
  725. FRC популярной поисковой системы по логам браузера
  726. Weighted mean of log(query_clicks)/log(query_shows) for given host. Weights are proportional to log(query_shows) + 0.2.
  727. Количество переходов по запросу на урл, встречающийся в цепочек хопов, нормированное на общее чесло переходов по запросу.
  728. Вероятность урла быть последним по запросу в цепочке хопов.
  729. Dssm предсказание вероятности по url + title, что на странице один товар.
  730. Dssm предсказание вероятности по url + title, что на странице много товаров.
  731. URL feature computed from rapid clicks search frozen counters with decay of 3 days
  732. Для урла определена геопривязка уровня города по правилам BUKI-1125
  733. Для урла определена геопривязка уровня страны по правилам BUKI-1125
  734. Фактор GeoRelevRegionCity по аттрибуту geoa
  735. Фактор GeoRelevRegionRegion по аттрибуту geoa
  736. Фактор GeoGeometryProxim по аттрибуту geoa
  737. Фактор GeoRelevAlienCity по аттрибуту geoa
  738. Фактор GeoVQueryInUserCity по аттрибуту geoa
  739. Фактор GeoVQueryInAlienCity по аттрибуту geoa
  740. Фактор PageRegionSize по атрибуту geo
  741. Фактор PageRegionCoverage по атрибуту geo
  742. Фактор PageRegionCoverage по атрибуту adresa
  743. Фактор GeoRelevRegionCity по атрибуту adresa
  744. Какую часть (в среднем по сессии) от кликнутых по данному query урлов составляет данный url. Считается по пользовательским сессиям.
  745. Овнер является магазином
  746. Овнер является сервисом
  747. Bclm (plane) по текстам из хопов.
  748. FRC по переходам с запросов, которые были заданы пользователем несколько раз
  749. Средний вес показов на первой странице; клик весит 1, не-клик - согласно таблице SBM_GAMMAS
  750. Средний вес показов на первой странице; клик весит 1, не-клик - согласно таблице SBM_GAMMAS. Региональная версия
  751. полусумма оценки позиции урла с медианной позицией по всем похожим запросам по бистам
  752. Host feature computed at the request time from rapid clicks spy_log counters with decay of 3 days
  753. Host feature computed at the request time from rapid clicks spy_log counters with decay of 3 days
  754. Host feature computed at the request time from rapid clicks spy_log counters with decay of 14 days
  755. Host feature computed at the request time from rapid clicks spy_log counters with decay of 14 days
  756. Host feature computed at the request time from rapid clicks spy_log counters with decay of 3 days
  757. Host feature computed at the request time from rapid clicks spy_log counters with decay of 14 days
  758. Host feature computed from rapid clicks spy_log counters with decay of 3 days
  759. Host feature computed from rapid clicks spy_log counters with decay of 3 days
  760. Host feature computed from rapid clicks spy_log counters with decay of 14 days
  761. Host feature computed from rapid clicks spy_log counters with decay of 14 days
  762. Host feature computed from rapid clicks spy_log counters with decay of 3 days
  763. Host feature computed from rapid clicks spy_log counters with decay of 14 days
  764. Finetuned reformulations DSSM to commercial clicked bargain odd-like target from visit log
  765. Is legal video distributor
  766. Average value of feature OneProductProbability
  767. Average value of feature ManyProductsProbability
  768. Average value of feature PayDetectorPredict
  769. Овнер является партнером
  770. Документ является ShopInShop
  771. Значение конверсионности запроса, рассчитываемого в бегемоте.
  772. Фактор по ФИО из оригинального запроса Считается по содержимому документа. Алгоритм: Chain0Wcm
  773. Хотя бы у одного оффера из распаршенной схемы есть статус о доступности.
  774. В распаршенной схеме нет ни одного оффера.
  775. Для урла из ytier известно что у него контент низкого качества
  776. Для урла из ytier известно что у него контент приемлимого качества
  777. Для урла из ytier известно что у него контент хорошего качества
  778. Для урла из ytier известно что у него контент отличного качества
  779. На хосте есть покупка по ECOMу.
  780. На хосте есть покупка по VISIT LOGу.
  781. URL является продуктом на Маркете.
  782. URL является продуктом на Маркете и имеет offerid.
  783. URL является ShopInShopCPA.
  784. Хотя бы у одного оффера из распаршенной схемы есть статус о недоступности.
  785. На owner'е есть покупка по ECOMу.
  786. На owner'е есть покупка по VISIT LOGу.
  787. Dssm предсказание вероятности по url + title, что документ нахлебник.
  788. В оффере из нового парсера выставлено поле PartnerOfferContent available.
  789. В оффере из нового парсера поле PartnerOfferContent available == true.
  790. Normalized corrected clicks count by query with user's city(gc=) mentioned
  791. Normalized corrected clicks maximum ratio by query with user's city(gc=) mentioned
  792. Normalized corrected clicks maximum ratio by query with not user's city(gc=) mentioned
  793. Значение PurchaseTotalPredict, рассчитываемого в бегемоте.
  794. Значение SerpSummarySurplusPredict, рассчитываемого в бегемоте.
  795. Возвращаемость пользователя на url
  796. Значение RequestWith120D3ClickPartPredict, рассчитываемого в бегемоте.
  797. Значение запросного детектора нахлебников, рассчитываемого в бегемоте.
  798. Логарифм среднего времени нахождения пользователя на хосте с локализацией по стране; считается по данным логов Yabar
  799. Отношение dwell time на хосте в данном регионе к dwell time на хосте по всем регионам
  800. Отношение dwell time на странице в данном регионе к dwell time на странице по всем регионам
  801. The more users add to bookmarks a url, the more factor value it has
  802. Предсказание sos.dssm модели по url + title.
  803. Предсказание med.dssm модели по url + title.
  804. Предсказание fin_law.dssm модели по url + title.
  805. На данный урл есть ссылка из Infobox-ов в Википедии.
  806. Предсказание cruelty.dssm модели по url + title.
  807. Значение HalfEcomPredict, рассчитываемого в бегемоте.
  808. Фактор, аналогичный RegexMaxClickPercentReg, но расчитанный по preffix-suffix генерализации.
  809. Фактор, аналогичный RegexMaxClickPercentYabarReg, но расчитанный по preffix-suffix генерализации.
  810. Запросно-документная модель навигационности.
  811. Средний угод наклона в плоскости вершины-зависания
  812. Запросно-урловый фактор. Значение - результат коллаборативной фильтрации данных для фактора QueryUrlCorrectedCtr
  813. Значение MatrixNet медленной модели ранжирования.
  814. Значение MatrixNet быстрой модели ранжирования.
  815. Значение MatrixNet фильтрующей модели.
  816. Фактор по тексту запроса и заголовку (title) документа, оценка соответствия числовых диапазонов при словах-маркерах
  817. Значение Polynom медленной модели ранжирования.
  818. Значение Polynom быстрой модели ранжирования.
  819. Значение Polynom фильтрующей модели ранжирования.
  820. Признак, что документ был получен машинным переводом
  821. Предсказание med_with_trash.dssm (мед. документная модель с доливкой треша в лерн) модели по url + title.
  822. Предсказание fin_law_with_trash.dssm (фин-юр. документная модель с доливкой треша в лерн) модели по url + title.
  823. Фактор по ФИО из оригинального запроса Считается по содержимому документа. Минимальный размер окна, в которой входят все слова запроса. Нормировано на число слов в запросе.
  824. Фактор по ФИО из оригинального запроса Текст документа. Алгоритм CosineMatchMaxPrediction.
  825. Фактор по всем ФИО из оригинального запроса Агрегация по всем расширениям. Тип аггрегации по расширениям: наибольшее значение фактора; Считается по содержимому документа. Алгоритм: Chain0Wcm
  826. Фактор по всем ФИО из оригинального запроса Агрегация по всем расширениям. Тип аггрегации по расширениям: наибольшее значение фактора; Считается по содержимому документа. Минимальный размер окна, в которой входят все слова запроса. Нормировано на число слов в запросе.
  827. Доля урла в общем числе кликнутых за сессию урлов по запросу (synnorm).
  828. Средняя доля кликов по данному урлу по данному запросу среди всех кликов по данному запросу (synnorm) в течение дня.
  829. Средняя доля кликов по данному урлу по данному запросу среди всех кликов по данному запросу (qnorm) в течение дня.
  830. QI version of factor 861. MaxValue over the set of popular similar queries.
  831. QI version of factor 798. MaxValue over the set of popular similar queries.
  832. Фактор по всем ФИО из оригинального запроса Агрегация по всем расширениям. Тип аггрегации по расширениям: наибольшее значение фактора; Текст документа. Алгоритм CosineMatchMaxPrediction.
  833. Dssm, предсказывающая оценку page quality для документа
  834. Запросно-урловый фактор. Значение - результат коллаборативной фильтрации данных для фактора SamplePeriodDayFrc
  835. Значение MatrixNet быстрой фильтрующей модели.
  836. Значение Polynom быстрой фильтрующей модели ранжирования.
  837. QI version of factor 879.
  838. Значение MatrixNet на мете.
  839. Значение Polynom на мете.
  840. Документ - это короткое видео (тикток, reels, shorts).
  841. Документ - телеграмм-канал в веб-формате.
  842. Документ - пост в телеграмме.
  843. CorrectedCtrReg фактор в аннотационном индексе, фактор AnnotationMatchPrediction
  844. CorrectedCtrReg фактор в аннотационном индексе, фактор QueryMatchPrediction
  845. CorrectedCtrReg фактор в аннотационном индексе, фактор ValueWcmAvg
  846. CorrectedCtrReg фактор в аннотационном индексе, фактор Bm15V4K5
  847. Фактор о наличии символа '?' в урле. Равен нулю, если урл имеет cgi-параметры (точнее: все дубли имеют символ '?' в урле).
  848. DSSMное предсказание клика по данным, специфичным для Алисы
  849. Фактор по телефонным аттрибутам tel_full из оригинального запроса Текст документа. Алгоритм агрегации весов слов Bocm15. Коэффициент нормализации 0.01.
  850. SamplePeriodDayFrc фактор в аннотационном индексе, фактор QueryMatchPrediction
  851. SamplePeriodDayFrc фактор в аннотационном индексе, фактор AnnotationMatchPrediction
  852. OneClick фактор в аннотационном индексе, фактор QueryMatchPrediction
  853. OneClick фактор в аннотационном индексе, фактор AnnotationMatchPrediction
  854. OneClick фактор в аннотационном индексе, фактор Bm15AK4
  855. OneClick фактор в аннотационном индексе, фактор BocmWeightedW1K3
  856. LongClick фактор в аннотационном индексе, фактор QueryMatchPrediction
  857. LongClick фактор в аннотационном индексе, фактор AnnotationMatchPrediction
  858. LongClick фактор в аннотационном индексе, фактор Bm15AK4
  859. LongClick фактор в аннотационном индексе, фактор BocmWeightedW1K3
  860. SplitDwellTime фактор в аннотационном индексе, фактор QueryMatchPrediction
  861. SplitDwellTime фактор в аннотационном индексе, фактор AnnotationMatchPrediction
  862. BQPR фактор в аннотационном индексе, фактор QueryMatchPrediction
  863. BQPR фактор в аннотационном индексе, фактор AnnotationMatchPrediction
  864. YabarVisits фактор в аннотационном индексе, фактор QueryMatchPrediction
  865. YabarVisits фактор в аннотационном индексе, фактор AnnotationMatchPrediction
  866. YabarTime фактор в аннотационном индексе, фактор QueryMatchPrediction
  867. YabarTime фактор в аннотационном индексе, фактор AnnotationMatchPrediction
  868. SimpleClick фактор в аннотационном индексе, фактор QueryMatchPrediction
  869. SimpleClick фактор в аннотационном индексе, фактор AnnotationMatchPrediction
  870. LongClick фактор в аннотационном индексе, фактор BocmPlain
  871. Результат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор FullMatchPrediction
  872. Результат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор AnnotationMatchPrediction
  873. OneClick фактор в аннотационном индексе, фактор SynonymMatchPrediction
  874. OneClick фактор в аннотационном индексе, фактор FullMatchPrediction
  875. OneClick фактор в аннотационном индексе, фактор ValueWcmAvg
  876. OneClick фактор в аннотационном индексе, фактор BocmWeightedMaxK1
  877. OneClick фактор в аннотационном индексе, фактор Bm15StrictK2
  878. OneClick фактор в аннотационном индексе, фактор Bm15MaxK3
  879. OneClick фактор в аннотационном индексе, фактор BclmPlainW1K3
  880. OneClick фактор в аннотационном индексе, фактор ValueWcmMax
  881. OneClick фактор в аннотационном индексе, фактор ValueWcmPrediction
  882. OneClick фактор в аннотационном индексе, фактор BclmWeightedK3
  883. BQPR фактор в аннотационном индексе, фактор BocmWeightedW1K3
  884. BQPR фактор в аннотационном индексе, фактор Bm15StrictK2
  885. SplitDwellTime фактор в аннотационном индексе, фактор BocmWeightedMaxK1
  886. SplitDwellTime фактор в аннотационном индексе, фактор FullMatchPrediction
  887. SplitDwellTime фактор в аннотационном индексе, фактор ValueWcmAvg
  888. CorrectedCtrReg фактор в аннотационном индексе, фактор Bm15StrictK2
  889. Предсказание доли запросов с географией по мешку слов, построенному для запроса
  890. Запрос является урлом с точностью до простановки точек и пробельных символов - используется правило колдунщика isurl
  891. Результат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор ValueWcmMax
  892. Результат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор ValueWcmAvg
  893. Результат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор Bm15StrictK2
  894. Результат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор BclmPlainW1K3
  895. Результат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор BclmWeightedK3
  896. Результат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор BocmWeightedW1K3
  897. CorrectedCtrXfactor в аннотационном индексе, фактор AnnotationMatchPrediction
  898. CorrectedCtrXfactor в аннотационном индексе, фактор QueryMatchPrediction
  899. CorrectedCtrXfactor в аннотационном индексе, фактор ValueWcmMax
  900. CorrectedCtrXfactor в аннотационном индексе, фактор ValueWcmAvg
  901. CorrectedCtrXfactor в аннотационном индексе, фактор BocmWeightedW1K3
  902. CorrectedCtrXfactor в аннотационном индексе, фактор BclmPlainK3
  903. CorrectedCtrXfactor в аннотационном индексе, фактор BclmMixPlainW1K1
  904. Предсказание суммарного таймспента до конца сессии при условии реализации этой пары запрос-документ
  905. Предсказание вклада этой пары запрос-документ в таймспент
  906. SamplePeriodDayFrc фактор в аннотационном индексе, фактор ValueWcmAvg
  907. SamplePeriodDayFrc фактор в аннотационном индексе, фактор Bm15MaxK3
  908. SamplePeriodDayFrc фактор в аннотационном индексе, фактор BocmWeightedK3
  909. SamplePeriodDayFrc фактор в аннотационном индексе, фактор BocmDoubleK5
  910. SplitDwellTime фактор в аннотационном индексе, фактор Bm15MaxK3
  911. SimpleClick фактор в аннотационном индексе, фактор BclmWeightedK3
  912. Предсказание процента длины трека, который будет проигран при условии реализации этой пары запрос-трек
  913. Вероятность того, что предсказанный моделью yweb/robot/urlgeo_ml регион - корректен, при условии, что предсказан город
  914. PopularSEFRCBrowser фактор в аннотационном индексе, фактор AnnotationMatchPrediction
  915. PopularSEFRCBrowser фактор в аннотационном индексе, фактор SynonymMatchPrediction
  916. PopularSEFRCBrowser фактор в аннотационном индексе, фактор ValueWcmPrediction
  917. PopularSEFRCBrowser фактор в аннотационном индексе, фактор BclmWeightedV2K3
  918. PopularSEFRCBrowser фактор в аннотационном индексе, фактор BclmMixPlainW1K1
  919. Считается по линковому индексу. Max(sum(idf)) по всем линкам которые являются подмножествами query / sum(idf) для query
  920. OneClick фактор в аннотационном индексе, фактор AnnotationMatchPredictionWeighted
  921. LongClick фактор в аннотационном индексе, фактор AnnotationMatchPredictionWeighted
  922. YabarTime фактор в аннотационном индексе, фактор AnnotationMatchPredictionWeighted
  923. Равен единице, если страница подключает js-api какого либо поставщика гео-данных
  924. LongClickSamplePeriod фактор в аннотационном индексе, фактор AnnotationMatchPrediction
  925. LongClickSamplePeriod фактор в аннотационном индексе, фактор QueryMatchPrediction
  926. LongClickSamplePeriod фактор в аннотационном индексе, фактор ValueWcmAvg
  927. LongClickSamplePeriod фактор в аннотационном индексе, фактор ValueWcmPrediction
  928. LongClickSamplePeriod фактор в аннотационном индексе, фактор BclmPlainW1K3
  929. LongClickSamplePeriod фактор в аннотационном индексе, фактор BclmWeightedK3
  930. LongClickSamplePeriod фактор в аннотационном индексе, фактор BocmWeightedW1K3
  931. LongClickSamplePeriod фактор в аннотационном индексе, фактор BclmPlainK5
  932. LongClickSamplePeriod фактор в аннотационном индексе, фактор BclmWeightedV2K3
  933. LongClickSamplePeriod фактор в аннотационном индексе, фактор BocmDoubleK5
  934. LongClickSamplePeriod фактор в аннотационном индексе, фактор Bm15StrictK2
  935. Normalized corrected clicks maximum ratio by query with user's city(gc=) mentioned equal by region
  936. Normalized corrected clicks maximum ratio by query with user's city(gc=) mentioned equal to user's region
  937. BQPR на семплированном периоде. Аннотационный индекс. Фактор WcmCoverageMax
  938. BQPR на семплированном периоде. Аннотационный индекс. Фактор FullMatchPrediction
  939. BQPR на семплированном периоде. Аннотационный индекс. Фактор AnnotationMatchPredictionWeighted
  940. BQPR на семплированном периоде. Аннотационный индекс. Фактор ValuePcmAvg
  941. BQPR на семплированном периоде. Аннотационный индекс. Фактор ValueWcmAvg
  942. BQPR на семплированном периоде. Аннотационный индекс. Фактор Bm15V4K8
  943. BQPR на семплированном периоде. Аннотационный индекс. Фактор BocmWeightedV4K8
  944. BQPR на семплированном периоде. Аннотационный индекс. Фактор SampleWcmMax
  945. BQPR на семплированном периоде. Аннотационный индекс. Фактор SynonymMatchPrediction
  946. BQPR на семплированном периоде. Аннотационный индекс. Фактор AnnotationMatchPrediction
  947. BQPR на семплированном периоде. Аннотационный индекс. Фактор SuffixMatchCount
  948. BQPR на семплированном периоде. Аннотационный индекс. Фактор WcmCoveragePrediction
  949. DoubleFrc в аннотационном индексе, фактор FullMatchPrediction
  950. DoubleFrc в аннотационном индексе, фактор SynonymMatchPrediction
  951. DoubleFrc в аннотационном индексе, фактор AnnotationMatchPrediction
  952. DoubleFrc в аннотационном индексе, фактор AnnotationMatchPredictionWeighted
  953. DoubleFrc в аннотационном индексе, фактор QueryMatchPrediction
  954. DoubleFrc в аннотационном индексе, фактор ValueWcmAvg
  955. DoubleFrc в аннотационном индексе, фактор BocmWeightedMaxK1
  956. DoubleFrc в аннотационном индексе, фактор Bm15V4K5
  957. DoubleFrc в аннотационном индексе, фактор BocmWeightedV4K5
  958. DoubleFrc в аннотационном индексе, фактор BocmDoubleK1
  959. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: минимальный вес расширения.
  960. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: Bm15 по группе стримов 2. Максимальное значение фактора по расширениям.
  961. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: BclmWeightedFLogW0 по группе стримов 3. Максимальное значение фактора по расширениям.
  962. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: Bm15FLogW0 по урлу и тайтлу. Максимальное значение фактора по расширениям.
  963. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: CosineMaxMatchPrediction по тексту и тайтлу. Максимальное значение фактора по расширениям.
  964. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: Bm15 по урлу. Максимальное значение фактора по расширениям.
  965. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: FullMatchValue по стриму LongClickSP. Максимальное взвешенное значение фактора по расширениям.
  966. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: FullMatchValue по стриму OneClick. Максимальное взвешенное значение фактора по расширениям.
  967. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: Bm15FLog по группе стримов 1. Среднее взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по расширениям.
  968. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: Bm15FLogW0 по урлу и тайтлу. Среднее взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по расширениям.
  969. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: MinWindowSize по тексту. Среднее взвешенное значений фактора по расширениям.
  970. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: мешочный OriginalRequestFractionExact по группе стримов для мешочных факторов (текст, тайтл, аннотационные стримы).
  971. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: мешочный CosineMaxMatchPrediction по стриму LongClickSP.
  972. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: мешочный CosineMatchWeightedValue по стриму LongClickSP.
  973. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: мешочный AnnotationMatchAvgValue по стриму SimpleClick.
  974. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: мешочный CosineMaxMatcg по тайтлу.
  975. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: BclmWeightedFLogW0 по группе стримов 3. Минимальное взвешенное значение фактора по топу расширений.
  976. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: AnnotationMatchWeightedValue по стриму LongClickSP. Минимальное взвешенное значение фактора по топу расширений.
  977. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: AnnotationMatchWeightedValue по стриму LongClickSP. Минимальное взвешенное значение фактора по топу расширений нормированное на максимальный вес по топу расширений.
  978. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: Chain0WCM по тексту. Среднее взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по топу расширений.
  979. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: FullMatchValue по стриму LongClickSP. Среднее взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по топу расширений.
  980. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: FullMatchValue по стриму OneClick. Среднее взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по топу расширений.
  981. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: BclmWeightedFLogW0 по группе стримов 3. Среднее взвешенное значений фактора по топу расширений.
  982. OneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор FullMatchPrediction
  983. OneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор AnnotationMatchPredictionWeighted
  984. OneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор ValueWcmAvg
  985. OneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор WcmMax
  986. OneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор WcmCoveragePrediction
  987. OneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор WcmCoverageMax
  988. OneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор PcmMax
  989. OneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор PrefixMatchCount
  990. OneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор SuffixMatchCount
  991. OneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор Bm15V0W1K1
  992. Значение классификатора локализуемости для запроса
  993. relev_locale == ru
  994. relev_locale == ua
  995. relev_locale == by
  996. relev_locale == kz
  997. relev_locale == tr
  998. relev_locale == world
  999. Porn query classification result from Wizard (iad_vw flag, based on Vowpal Wabbit)
  1000. Покрытие URL триграммами из запроса. Аналог UrlDomainFraction,UrlPathAndParamsFraction факторов.
  1001. QueryDwellTime, фактор FullMatchPrediction
  1002. QueryDwellTime, фактор SynonymMatchPrediction
  1003. QueryDwellTime, фактор AnnotationMatchPrediction
  1004. QueryDwellTime, фактор AnnotationMatchPredictionWeighted
  1005. QueryDwellTime, фактор QueryMatchPrediction
  1006. QueryDwellTime, фактор ValueWcmAvg
  1007. QueryDwellTime, фактор BclmPlainW1K3
  1008. QueryDwellTime, фактор Bm15CoverageV4K3
  1009. QueryDwellTime, фактор BclmPlainK4
  1010. QueryDwellTime, фактор BocmWeightedV4K5
  1011. Доля посещений, для которых время нахождения в течение дня на хосте больше 90 сек
  1012. Доля посещений, для которых время нахождения в течение дня на хосте больше 160 сек
  1013. Ранк взломанных сайтов
  1014. Ранк ags4
  1015. Максимальный QsRank на владельце
  1016. Средний QsRank на основном домене
  1017. Доля возвратившихся в течение месяца пользователей
  1018. Количество возвратившихся в течение месяца пользователей
  1019. Ранк дорвеев
  1020. Доля заглавных букв в Title
  1021. Доля входящего трафика с поисковых систем среди всего входящего трафика
  1022. Доля прямых заходов среди всего входящего трафика
  1023. Средний QsRank в скользящем окне
  1024. Минимальный QsRank
  1025. Средний Hops
  1026. Bm15K01 factor over hits from Url
  1027. Bm15K01 factor over hits from Title
  1028. Bocm15K001 factor over hits from Title
  1029. Bm11Norm16384 factor over hits from Text
  1030. Bocm11Norm256 factor over hits from Text
  1031. CosineMatchMaxPrediction factor over hits from Text
  1032. Bm15FLogK0001 factor over hits from FieldSet1 stream
  1033. Bm15FLogK0001 factor over hits from FieldSet2 stream
  1034. BclmWeightedFLogW0K0001 factor over hits from FieldSet3 stream
  1035. Bm15FLogW0K00001 factor over hits from FieldSetUT stream
  1036. Chain0Wcm factor over hits from Body
  1037. PairMinProximity factor over hits from Body
  1038. MinWindowSize factor over hits from Body
  1039. CosineMatchMaxPrediction factor over hits from PopularSeFrcBrowser stream
  1040. MixMatchWeightedValue factor over hits from DoubleFrc stream
  1041. AnnotationMaxValueWeighted factor over hits from DoubleFrc stream
  1042. AnnotationMaxValue factor over hits from DoubleFrc stream
  1043. AnnotationMatchWeightedValue factor over hits from DoubleFrc stream
  1044. AllWcmWeightedValue factor over hits from DoubleFrc stream
  1045. AllWcmMatch95AvgValue factor over hits from DoubleFrc stream
  1046. AllWcmWeightedPrediction factor over hits from DoubleFrc stream
  1047. AllWcmMatch80AvgValue factor over hits from DoubleFrc stream
  1048. FullMatchValue factor over hits from DoubleFrc stream
  1049. FullMatchAnyValue factor over hits from DoubleFrc stream
  1050. ExactQueryMatchAvgValue factor over hits from DoubleFrc stream
  1051. BclmMixPlainKE5 factor over hits from OneClickFrcXfSp stream
  1052. Bm15StrictAnnotationK01 factor over hits from OneClickFrcXfSp stream
  1053. AllWcmWeightedValue factor over hits from OneClickFrcXfSp stream
  1054. AllWcmWeightedPrediction factor over hits from OneClickFrcXfSp stream
  1055. AllWcmMatch80AvgValue factor over hits from OneClickFrcXfSp stream
  1056. MixMatchWeightedValue factor over hits from OneClickFrcXfSp stream
  1057. AnnotationMatchWeightedValue factor over hits from OneClickFrcXfSp stream
  1058. BclmPlaneProximity1Bm15W0Size1K0001 factor over hits from OneClickFrcXfSp stream
  1059. BclmWeightedProximity1Bm15Size1K001 factor over hits from OneClickFrcXfSp stream
  1060. BclmMixPlainKE5 factor over hits from BQPRSample stream
  1061. AllWcmWeightedValue factor over hits from BQPRSample stream
  1062. AllWcmWeightedPrediction factor over hits from BQPRSample stream
  1063. AllWcmMaxPrediction factor over hits from BQPRSample stream
  1064. AllWcmMatch80AvgValue factor over hits from BQPRSample stream
  1065. MixMatchWeightedValue factor over hits from BQPRSample stream
  1066. CosineMatchMaxPrediction factor over hits from BQPRSample stream
  1067. AnnotationMaxValueWeighted factor over hits from BQPRSample stream
  1068. AnnotationMaxValue factor over hits from BQPRSample stream
  1069. AnnotationMatchWeightedValue factor over hits from BQPRSample stream
  1070. Bocm15K001 factor over hits from BQPRSample stream
  1071. BclmPlaneProximity1Bm15W0Size1K0001 factor over hits from BQPRSample stream
  1072. BclmWeightedProximity1Bm15Size1K001 factor over hits from BQPRSample stream
  1073. BclmPlaneProximity1Bm15W0Size1K0001 factor over hits from LongClickSP stream
  1074. Bm15MaxAnnotationK001 factor over hits from LongClickSP stream
  1075. FullMatchValue factor over hits from LongClickSP stream
  1076. MixMatchWeightedValue factor over hits from LongClickSP stream
  1077. CosineMatchMaxPrediction factor over hits from LongClickSP stream
  1078. AnnotationMaxValue factor over hits from LongClickSP stream
  1079. AnnotationMaxValueWeighted factor over hits from LongClickSP stream
  1080. AnnotationMatchWeightedValue factor over hits from LongClickSP stream
  1081. AllWcmMatch95AvgValue factor over hits from LongClickSP stream
  1082. AllWcmWeightedValue factor over hits from LongClickSP stream
  1083. AllWcmMaxMatch factor over hits from LongClickSP stream
  1084. AllWcmWeightedPrediction factor over hits from LongClickSP stream
  1085. Bocm15K001 factor over hits from LongClickSP stream
  1086. QueryPrefixMatchOriginalWordValue factor over hits from LongClickSP stream
  1087. BclmPlaneProximity1Bm15W0Size1K0001 factor over hits from SamplePeriodDayFrc stream
  1088. AttenV1Bm15K05 factor over hits from SamplePeriodDayFrc stream
  1089. FullMatchValue factor over hits from SamplePeriodDayFrc stream
  1090. FullMatchAnyValue factor over hits from SamplePeriodDayFrc stream
  1091. AllWcmWeightedValue factor over hits from SamplePeriodDayFrc stream
  1092. AllWcmWeightedPrediction factor over hits from SamplePeriodDayFrc stream
  1093. AllWcmMatch95AvgValue factor over hits from SamplePeriodDayFrc stream
  1094. AllWcmMatch80AvgValue factor over hits from SamplePeriodDayFrc stream
  1095. MixMatchWeightedValue factor over hits from SamplePeriodDayFrc stream
  1096. AnnotationMatchWeightedValue factor over hits from SamplePeriodDayFrc stream
  1097. AnnotationMaxValue factor over hits from SamplePeriodDayFrc stream
  1098. AnnotationMaxValueWeighted factor over hits from SamplePeriodDayFrc stream
  1099. Bocm15K001 factor over hits from SamplePeriodDayFrc stream
  1100. AllWcmWeightedValue factor over hits from CorrectedCtrXFactor stream
  1101. AllWcmMaxPrediction factor over hits from CorrectedCtrXFactor stream
  1102. AllWcmWeightedPrediction factor over hits from CorrectedCtrXFactor stream
  1103. AllWcmMatch80AvgValue factor over hits from CorrectedCtrXFactor stream
  1104. MixMatchWeightedValue factor over hits from CorrectedCtrXFactor stream
  1105. AnnotationMatchWeightedValue factor over hits from CorrectedCtrXFactor stream
  1106. BclmPlaneProximity1Bm15W0Size1K001 factor over hits from CorrectedCtrXFactor stream
  1107. BclmWeightedProximity1Bm15Size1K001 factor over hits from CorrectedCtrXFactor stream
  1108. AllWcmMaxPrediction factor over hits from LongClick stream
  1109. MixMatchWeightedValue factor over hits from LongClick stream
  1110. AnnotationMaxValueWeighted factor over hits from LongClick stream
  1111. FullMatchValue factor over hits from LongClick stream
  1112. AnnotationMatchWeightedValue factor over hits from LongClick stream
  1113. AllWcmWeightedValue factor over hits from SimpleClick stream
  1114. AllWcmWeightedPrediction factor over hits from SimpleClick stream
  1115. AllWcmMaxPrediction factor over hits from SimpleClick stream
  1116. MixMatchWeightedValue factor over hits from SimpleClick stream
  1117. AnnotationMatchWeightedValue factor over hits from SimpleClick stream
  1118. AnnotationMaxValueWeighted factor over hits from BrowserPageRank stream
  1119. AnnotationMatchWeightedValue factor over hits from BrowserPageRank stream
  1120. AnnotationMaxValue factor over hits from BrowserPageRank stream
  1121. Bocm15K001 factor over hits from BrowserPageRank stream
  1122. MixMatchWeightedValue factor over hits from OneClick stream
  1123. FullMatchValue factor over hits from OneClick stream
  1124. AnnotationMatchWeightedValue factor over hits from OneClick stream
  1125. AllWcmWeightedPrediction factor over hits from SplitDwellTime stream
  1126. Bm15MaxAnnotationK001 factor over hits from SplitDwellTime stream
  1127. BclmWeightedProximity1Bm15Size1K0001 factor over hits from QueryDwellTime stream
  1128. AttenV1Bm15K001 factor over hits from QueryDwellTime stream
  1129. MixMatchWeightedValue factor over hits from QueryDwellTime stream
  1130. AnnotationMaxValueWeighted factor over hits from QueryDwellTime stream
  1131. AnnotationMaxValue factor over hits from QueryDwellTime stream
  1132. AnnotationMatchWeightedValue factor over hits from QueryDwellTime stream
  1133. AllWcmWeightedValue factor over hits from QueryDwellTime stream
  1134. AllWcmMatch80AvgValue factor over hits from QueryDwellTime stream
  1135. BclmPlaneProximity1Bm15W0Size1K0001 factor over hits from RandomLogDBM35 stream
  1136. Bm15StrictAnnotationK001 factor over hits from RandomLogDBM35 stream
  1137. MixMatchWeightedValue factor over hits from RandomLogDBM35 stream
  1138. AnnotationMaxValueWeighted factor over hits from RandomLogDBM35 stream
  1139. AnnotationMatchWeightedValue factor over hits from RandomLogDBM35 stream
  1140. AllWcmWeightedValue factor over hits from RandomLogDBM35 stream
  1141. FullMatchValue factor over hits from RandomLogDBM35 stream
  1142. ExactQueryMatchAvgValue factor over hits from RandomLogDBM35 stream
  1143. relev_locale == id
  1144. Бинарный фактор про мобильную адаптивность документа. Берётся из erf
  1145. В тех случаях когда FI_NATIONAL_DOMAIN равен 0, а herf.NationalDomainId заполнен ставим 1
  1146. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: MixMatchWeightedValue по стриму QueryDwellTime. Максимальное взвешенное значение фактора по расширениям.
  1147. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: MixMatchWeightedValue по стриму QueryDwellTime. Среднее взвешенное значение фактора по расширениям.
  1148. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: MixMatchWeightedValue по стриму QueryDwellTime. Минимальное взвешенное значение фактора по топу расширений.
  1149. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: AnnotationMatchWeightedValue по стриму QueryDwellTime. Минимальное взвешенное значение фактора по топу расширений.
  1150. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: AnnotationMatchWeightedValue по стриму QueryDwellTime. Максимальное взвешенное значение фактора по расширениям.
  1151. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: AllWcmMatch95AvgValue по стриму QueryDwellTime. Среднее взвешенное значение фактора по топу расширений.
  1152. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: MixMatchWeightedValue по стриму BQPRSample. Максимальное взвешенное значение фактора по расширениям.
  1153. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: MixMatchWeightedValue по стриму DoubleFrc. Максимальное взвешенное значение фактора по расширениям.
  1154. DSSM model trained on clicks.
  1155. DSSM model trained on clicks.
  1156. DSSM model trained on clicks.
  1157. DSSM model trained on clicks.
  1158. DSSM model trained on clicks.
  1159. DSSM model trained on clicks.
  1160. DSSM model trained on clicks.
  1161. DSSM model trained on clicks.
  1162. Нейронная модель качества контента для медицинской тематики
  1163. request came from yandsearch (rearr.is_desktop == 1)
  1164. request came from touchsearch (rearr.is_mobile == 1)
  1165. request came from padsearch (rearr.is_tablet == 1)
  1166. request came from device with Android OS (rearr.dd_osfamily == Android)
  1167. request came from device with iOS (rearr.dd_osfamily == iOS)
  1168. request came from device with Windows OS (rearr.dd_osfamily == Windows)
  1169. request does not come from devices with Android, iOS or Windows OS (rearr.dd_osfamily != [Android, iOS, Windows])
  1170. Битое встроенное видео на странице.
  1171. FullMatchValue factor over hits from CorrectedCtrLongPeriod stream
  1172. MixMatchWeightedValue factor over hits from CorrectedCtrLongPeriod stream
  1173. AnnotationMaxValueWeighted factor over hits from CorrectedCtrLongPeriod stream
  1174. AnnotationMatchWeightedValue factor over hits from CorrectedCtrLongPeriod stream
  1175. AllWcmMatch95AvgValue factor over hits from CorrectedCtrLongPeriod stream
  1176. AllWcmMatch80AvgValue factor over hits from CorrectedCtrLongPeriod stream
  1177. AllWcmWeightedValue factor over hits from CorrectedCtrLongPeriod stream
  1178. AllWcmWeightedPrediction factor over hits from CorrectedCtrLongPeriod stream
  1179. Нейронная модель качества контента для медицинской тематики (для экспов)
  1180. BclmMixPlainKE5 factor over hits from NHopSumDwellTime stream
  1181. Match80AvgValue factor over hits from NHopSumDwellTime stream
  1182. Нейронная модель качества контента для финансовой и юридической тематик
  1183. MixMatchWeightedValue factor over hits from NHopSumDwellTime stream
  1184. Нейронная модель качества контента для финансовой и юридической тематик (для экспов)
  1185. BclmMixPlainKE5 factor over hits from FirstClickDtXf stream
  1186. FullMatchValue factor over hits from FirstClickDtXf stream
  1187. AnnotationMaxValueWeighted factor over hits from FirstClickDtXf stream
  1188. AnnotationMatchWeightedValue factor over hits from FirstClickDtXf stream
  1189. BclmPlaneProximity1Bm15W0Size1K001 factor over hits from FirstClickDtXf stream
  1190. Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Bm11 по тексту и тайтлу документа
  1191. Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. CosineMatchMaxPrediction по тексту и тайтлу документа
  1192. Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: AnnotationMatchWeightedValue по стриму LongClick.
  1193. Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: FullMatchValue по стриму OneClick.
  1194. Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: AnnotationMatchValue по стриму OneClick.
  1195. Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: AnnotationMatchWeightedValue по стриму LongClickSP.
  1196. Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: FullMatchValue по стриму LongClickSP.
  1197. Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: AnnotationMaxValueWeighted по стриму BQPRSample.
  1198. Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: Bm15 по группе стримов 1.
  1199. Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: Bm15 по группе стримов 2.
  1200. Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: BclmWeightedFLogW0 по группе стримов 3.
  1201. Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор Chain0Wcm по тексту документа
  1202. Random float in [0,1] by user request and document
  1203. Нейронная модель качества контента для sos тематики
  1204. отношение суммарной площади всех Flash-блоков к площади экрана
  1205. Нейронная модель качества контента для sos тематики (для экспов)
  1206. Copy of old version No.294 factor. Added for use on L3 stage only. Покрытие домена трехбуквиями из запроса. (Челябинская лотерея - chelloto. Переводим запрос в транслит, находим трехбуквия которые покрываются (che, hel, lot, olo), смотрим какую долю от всех трехбуквиев покрыли)
  1207. Fast version of FI_URL_DOMAIN_FRACTION
  1208. Предсказание таймспента сессии при условии реализации данной пары запрос-документ
  1209. Запросно-документная dssm, предсказывающая собачность документа
  1210. Документ - это подборка из тиктока /tag
  1211. Документ - это подборка из тиктока /discovery
  1212. Документ - это подборка из тиктока /music
  1213. Запросно-документная модель синсига.
  1214. Фактор по оригинальному запросу. Считается по токенезированному урлу. Алгоритм CosineMatchMaxPrediction.
  1215. Фактор по оригинальному запросу. Считается по токенезированному урлу. Вес хита умножается на 1/ (1 + позиция слова в предложении) Алгоритм агрегации весов слов: Bm15. Коэффициент нормализации 0.5.
  1216. Фактор по оригинальному запросу. Считается по заголовку документа. Алгоритм агрегации весов слов - BclmMixPlain: линейная смесь аннотационного Bclm веса и взвешенного Positionless веса слова, затем пословные счётчики агрегируются через bm15. Коэффициент нормализации 10^(-5).
  1217. Фактор по оригинальному запросу. Считается по заголовку документа. Алгоритм CMMatchTop5AvgMatchValue.
  1218. Фактор по оригинальному запросу. Считается по заголовку документа. Степень покрытия слов запроса с точностью до формы (без синонимов).
  1219. Фактор по оригинальному запросу. Считается по заголовку документа. Вес хита умножается на 1/ (1 + позиция слова в предложении) Алгоритм агрегации весов слов: Bm15. Коэффициент нормализации 0.5.
  1220. Фактор по оригинальному запросу. Считается по содержимому документа. Алгоритм агрегации весов слов - BclmMixPlain: линейная смесь аннотационного Bclm веса и взвешенного Positionless веса слова, затем пословные счётчики агрегируются через bm15. Коэффициент нормализации 10^(-5).
  1221. Фактор по оригинальному запросу. Считается по содержимому документа. Алгоритм CosineMatchMaxPrediction.
  1222. Фактор по оригинальному запросу. Считается по содержимому документа. Алгоритм AllWcmWeightedPrediction.
  1223. Фактор по оригинальному запросу. Считается по содержимому документа. Алгоритм агрегации весов слов Bocm15. Коэффициент нормализации 0.01.
  1224. Фактор по оригинальному запросу. Считается по содержимому документа. Алгоритм: QueryPartMatchSumValueAny.
  1225. Фактор по оригинальному запросу. Считается по содержимому документа. Степень покрытия слов запроса с точностью до формы (без синонимов).
  1226. Фактор по оригинальному запросу. Считается по содержимому документа. Степень покрытия слов запроса в точной форме.
  1227. Фактор по оригинальному запросу. Считается по содержимому документа. Алгоритм аггрегации весов: Bm15MaxAnnotation Коэффициент нормализации 0.01.
  1228. Url является каналом/постом из верифицированного аккаунта социальной сети
  1229. Dssm, предсказывающая является ли сайт мимикришником
  1230. MetaPolyGen8
  1231. CMMatch80AvgValue factor over hits from QueryDwellTime stream
  1232. CMMatchTop5AvgMatch factor over hits from DoubleFrc stream
  1233. PerWordCMMaxMatchMin factor over hits from OneClickFrcXfSp stream
  1234. PerWordCMMaxMatchMin factor over hits from FirstClickDtXf stream
  1235. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: PerWordCMMaxMatchMin по стриму LongClickSP. Максимальное взвешенное значение фактора по расширениям.
  1236. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: PerWordCMMaxMatchMin по стриму OneClick. Максимальное взвешенное значение фактора по расширениям.
  1237. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: PerWordCMMaxMatchMin по стриму FirstClickDtXf. Минимальное взвешенное значение фактора по топу расширений.
  1238. Расстояние от города, откуда был задан запрос, до Анкары
  1239. Расстояние от города, откуда был задан запрос, до Магадана
  1240. Географическая широта города, откуда был задан запрос
  1241. Географическая долгота города, откуда был задан запрос
  1242. FullMatchValue factor over hits from LongClick stream (Mobile sessions filtered)
  1243. CosineMatchMaxPrediction factor over hits from LongClick stream (Mobile sessions filtered)
  1244. AnnotationMatchWeightedValue factor over hits from LongClick stream (Mobile sessions filtered)
  1245. AllWcmMatch95AvgValue factor over hits from LongClick stream (Mobile sessions filtered)
  1246. AllWcmWeightedValue factor over hits from LongClick stream (Mobile sessions filtered)
  1247. AllWcmWeightedPrediction factor over hits from LongClick stream (Mobile sessions filtered)
  1248. CMMatchTop5AvgValue factor over hits from LongClick stream (Mobile sessions filtered)
  1249. Bm15MaxAnnotationK001 factor over hits from LongClick stream (Mobile sessions filtered)
  1250. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: PerWordCMMaxMatchMin по входящим ссылкам. Максимальное взвешенное значение фактора по расширениям.
  1251. Статический URL фактор по поисковым сессиям за 1600 дней. Обычный Ctr.
  1252. Статический URL фактор по поисковым сессиям за 1600 дней. Средний DwellTime, причем DwellTime из сессии обрезается, если больше 3600 секунд
  1253. Статический URL фактор по поисковым сессиям за 1600 дней. Средний DwellTime, причем DwellTime из сессии обрезается, если больше 180 секунд
  1254. Статический URL фактор по поисковым сессиям за 1600 дней. Вероятность что клик по URL будет больше 120 секунд
  1255. Статический URL фактор по поисковым сессиям за 1600 дней. Логарифм числа показов.
  1256. Статический URL фактор по поисковым сессиям за 1600 дней. Вероятность что на URL кликнут, если не кликнут хотя бы на один URL выше.
  1257. Статический URL фактор по поисковым сессиям за 1600 дней. Вероятность что на URL не кликнут, если кликнут хотя бы на один URL ниже.
  1258. Статический URL фактор по поисковым сессиям за 1600 дней. Обычный Ctr. Локализация до уровня стран.
  1259. Статический URL фактор по поисковым сессиям за 1600 дней. Средний DwellTime, причем DwellTime из сессии обрезается, если больше 3600 секунд. Локализация до уровня стран.
  1260. Статический URL фактор по поисковым сессиям за 1600 дней. Вероятность что клик по URL будет больше 120 секунд. Локализация до уровня стран.
  1261. Статический URL фактор по поисковым сессиям за 1600 дней. Средняя позиция URL по всем запросам. Локализация до уровня стран.
  1262. Статический URL фактор по поисковым сессиям за 1600 дней. Логарифм числа показов. Локализация до уровня стран.
  1263. DSSM model trained on clicks. Takes bigrams into account.
  1264. MixMatchWeightedValue factor over hits from FirstLastClick stream (Mobile sessions filtered)
  1265. CosineMatchMaxPrediction factor over hits from FirstLastClick stream (Mobile sessions filtered)
  1266. FullMatchValue factor over hits from FirstLastClick stream (Mobile sessions filtered)
  1267. AllWcmMatch95AvgValue factor over hits from FirstLastClick stream (Mobile sessions filtered)
  1268. CMMatchTop5AvgValue factor over hits from FirstLastClick stream (Mobile sessions filtered)
  1269. AllWcmWeightedValue factor over hits from FirstLastClick stream (Mobile sessions filtered)
  1270. Был ли запрос задан голосом
  1271. AllWcmWeightedValue factor over hits from AvgDTWeightedByRankMobile stream (Mobile sessions filtered)
  1272. AllWcmMatch95AvgValue factor over hits from AvgDTWeightedByRankMobile stream (Mobile sessions filtered)
  1273. CMMatchTop5AvgValue factor over hits from AvgDTWeightedByRankMobile stream (Mobile sessions filtered)
  1274. AnnotationMatchWeightedValue factor over hits from AvgDTWeightedByRankMobile stream (Mobile sessions filtered)
  1275. FullMatchValue factor over hits from AvgDTWeightedByRankMobile stream (Mobile sessions filtered)
  1276. MixMatchWeightedValue factor over hits from AvgDTWeightedByRankMobile stream (Mobile sessions filtered)
  1277. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: AvgPerTrigramMaxValueAny по группе стримов 5. Среднее взвешенное значений фактора по топу расширений.
  1278. AvgPerTrigramAvgValueAny фактор по CorrectedCtrLongPeriod стриму
  1279. DSSM model trained on clicks. Takes bigrams into account. Embeddings for documents are computed offline.
  1280. Ранк качества текстов на хосте. Чем выше — тем больше вероятность того, что хост полон статей - рерайта, плохого копирайта, заказанного на биржах контента. Жжёт сильнее как позапросная агрегация.
  1281. Минимум от градиентов по словам по биграммной LogDwelltime модели.
  1282. Максимум от градиентов по словам по биграммной LogDwelltime модели.
  1283. Второй центральный момент (дисперсия) от градиентов по словам по биграммной LogDwelltime модели.
  1284. Третий центральный момент от градиентов по словам по биграммной LogDwelltime модели.
  1285. Вероятность того, что хост vk.com является популярным для данного запроса согласно соответствующей dssm-модели.
  1286. Вероятность того, что хост onliner.by является популярным для данного запроса согласно соответствующей dssm-модели.
  1287. Вероятность того, что хост rambler.ru является популярным для данного запроса согласно соответствующей dssm-модели.
  1288. Вероятность того, что хост expertcen.ru является популярным для данного запроса согласно соответствующей dssm-модели.
  1289. Вероятность того, что хост sunhome.ru является популярным для данного запроса согласно соответствующей dssm-модели.
  1290. Статический URL фактор по браузерным логам за максимальный период. Процент трафика с социальных сетей во всем трафике с других хостов и поиска.
  1291. Статический URL фактор по браузерным логам за максимальный период. Среднее число прямых потомков с хоста на которых провели больше 90 секунд. Потомок прямой, только если с нашей страницы на потомок есть ссылка и по ней перешли.
  1292. Статический URL фактор по браузерным логам за максимальный период. Средняя максимальная глубина дерева с корнем в текущем URL, когда URL посещают с других хостов.
  1293. Статический URL фактор по браузерным логам за максимальный период. Число раз когда на страницу перешли с серпа деленое на общее число страниц на которые перешли с серпа. Чем ближе к 1, тем чаще страницу открывали единственной в сессии.
  1294. Статический URL фактор по браузерным логам за максимальный период. Средняя длина поисковых сессий, когда на страницу переходили с серпа
  1295. Статический URL фактор по браузерным логам за максимальный период. Формулу расчета фактора смотрим на wiki.
  1296. Статический URL фактор по браузерным логам за максимальный период. Формулу расчета фактора смотрим на wiki.
  1297. Статический URL фактор по браузерным логам за максимальный период. Вероятность что пользователь проведет на странице > 120 секунд.
  1298. Статический URL фактор по браузерным логам за максимальный период. Число листьев в поддереве URLа. В данном случае листья это страницы с которых не было переходов.
  1299. Статический URL фактор по браузерным логам за максимальный период. Среднее время проведенное на странице и во всех потомках страницы(URLы на которые перешли) из хоста. Обрезаем, если суммарный Dt больше 10 минут
  1300. Статический URL фактор по браузерным логам за максимальный период. Минимальное unix time когда страница появилась в логах первый раз.
  1301. Статический URL фактор по браузерным логам за максимальный период. Разность между средним и минимальным unix time когда страница появилась в логах.
  1302. Статический URL фактор по браузерным логам за максимальный период. Cредняя широта откуда просматривали страницу.
  1303. Статический URL фактор по браузерным логам за максимальный период. Cредняя долгота откуда просматривали страницу.
  1304. Статический URL фактор по браузерным логам за максимальный период. Вероятность скачки со страницы
  1305. Статический URL фактор по браузерным логам за максимальный период. Вероятность скачки изображения со страницы
  1306. Статический URL фактор по браузерным логам за максимальный период. Вероятность скачки торрент файла со страницы
  1307. Статический URL фактор по браузерным логам за максимальный период. Формулу расчета фактора смотрим на wiki. Локализация до уровня стран.
  1308. Статический URL фактор по браузерным логам за максимальный период. Число листьев в поддереве URLа. В данном случае листья это страницы с которых не было переходов. Локализация до уровня стран.
  1309. Статический URL фактор по браузерным логам за максимальный период. Среднее время проведенное на странице и во всех потомках страницы(URLы на которые перешли) из хоста. Обрезаем, если суммарный Dt больше 10 минут. Локализация до уровня стран.
  1310. Cумма скоров слов запроса по языковой модели 3grams-yandex-direct.
  1311. Cумма скоров слов запроса по языковой модели web-mt.
  1312. Статический URL фактор по браузерным логам за максимальный период. Ранк, на основе только UBLP счетчиков, который позволяет находить многие SBR потери
  1313. Фактор лингвистического бустинга. Тип расширений: Qfuf. Фактор: BclmWeightedFLogW0_K0.001 по FieldSet3. Среднее взвешенное значений фактора по топ-10 расширениям.
  1314. Фактор лингвистического бустинга. Тип расширений: QueryToText. Фактор: по MinWindowSize по содержимому документа. Среднее взвешенное значений фактора по расширениям.
  1315. Фактор лингвистического бустинга. Средний вес расширений типа QueryToText.
  1316. Фактор лингвистического бустинга. Тип расширений: Qfuf. Фактор: MixMatchWeightedValue по QueryDwellTime стриму. Среднее взвешенное значений фактора по расширениям.
  1317. Фактор лингвистического бустинга. Тип расширений: QueryToText. Фактор: MinWindowSize по содержимому документа. Среднее взвешенное значений фактора по топ-10 расширениям.
  1318. Фактор лингвистического бустинга. Тип расширений: Qfuf. Фактор: Bm15FLogW0_K0.0001 по урлу и заголовку. Максимальное значения фактора по расширениям.
  1319. Фактор лингвистического бустинга. Тип расширений: Qfuf. Фактор: BclmWeightedFLogW0_K0.001 по FieldSet3. Среднее взвешенное значений фактора по расширениям.
  1320. Фактор лингвистического бустинга. Средний вес расширений типа Qfuf.
  1321. Фактор лингвистического бустинга. Тип расширений: QueryToText. Фактор: PairMinProximity по содержимому документа. Среднее значений фактора по расширениям.
  1322. Фактор лингвистического бустинга. Тип расширений: Qfuf. Перенормированный суммарный вес расширений.
  1323. Фактор лингвистического бустинга. Тип расширений: QueryToText. Фактор: Bocm11_Norm256 по тексту документа. Среднее значений фактора по расширениям.
  1324. Фактор лингвистического бустинга. Тип расширений: Qfuf. Фактор: CosineMatchMaxPrediction по тексту документа. Максимальное значение фактора по расширениям.
  1325. Фактор лингвистического бустинга. Тип расширений: Qfuf. Фактор: Bm15FLog_K0.001 по FieldSet1. Среднее взвешенное значений фактора с квадратичным весом по топ-10 по значению фактора расширениям.
  1326. Фактор лингвистического бустинга. Тип расширений: Qfuf. Фактор:Bocm11_Norm256 по тексту документа. Максимальное значение фактора по расширениям.
  1327. Фактор лингвистического бустинга. Тип расширений: Qfuf. Фактор: Bm15FLogW0_K0.0001 по урлу и заголовку. Среднее взвешенное значений фактора по расширениям.
  1328. DSSM model trained on clicks, target=OneClicks/Clicks. Takes bigrams into account.
  1329. DSSM model trained on clicks, target=QueryDwellTime stream value. Takes bigrams into account.
  1330. Нормированная сумма весов слов запроса, которые встретились в тексте документа или ссылках на него.
  1331. Нормированная сумма весов слов запроса, которые EQUAL_BY_STRING в тексте документа или ссылках на него.
  1332. Нормированная сумма весов слов запроса, которые встретились в тексте документа.
  1333. Нормированная сумма весов слов запроса, которые встретились в ссылках на документ.
  1334. Нормированная сумма весов слов запроса, которые EQUAL_BY_STRING в ссылках на документ.
  1335. Нормированная сумма весов по IFiltrationModel слов запроса, которые встретились в тексте документа или ссылках на него.
  1336. Нормированная сумма весов по IFiltrationModel слов запроса, которые EQUAL_BY_STRING в тексте документа или ссылках на него.
  1337. Нормированная сумма весов по IFiltrationModel слов запроса, которые EQUAL_BY_LEMMA в тексте документа или ссылках на него.
  1338. Нормированная сумма весов по IFiltrationModel слов запроса, которые встретились в ссылках на документ.
  1339. Нормированная сумма весов по IFiltrationModel слов запроса, которые EQUAL_BY_STRING в ссылках на документ.
  1340. Фактор лингвистического бустинга. Тип расширений: Qfuf. Аггрегация по всем расширениям. Наибольшее значение фактора. По стриму из линкового индекса LinkAnnIndicator. Алгоритм AnnotationMaxValueWeighted - максимальный вес (по MainWeights весам слов) покрытия аннотациями, взвешено на вес аннотации
  1341. Фактор лингвистического бустинга. Тип расширений: Qfuf. Аггрегация по всем расширениям. Наибольшее значение фактора. По стриму из линкового индекса LinkAnnIndicator. Алгоритм AnnotationMaxValueWeighted - максимальный вес (по MainWeights весам слов) покрытия аннотациями, взвешено на вес аннотации
  1342. Фактор лингвистического бустинга. Тип расширений: XfDtShow. Аггрегация по всем расширениям. Наибольшее взвешенное значение фактора. Нормировано на максимальный вес расширения. По стриму из линкового индекса LinkAnnIndicator. Алгоритм PerWordCMMaxMatchMin: минимальный по словам вес CMMaxMatch.
  1343. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn (ближайшие по dssm-модели, обучаемой предсказывать XfDtShow расширения). Агрегация по всем расширениям. Наибольшее взвешенное значение фактора. Смесь множества стримов, вес высчитывается по фиксированному полиному от весов компонент на данной аннотации. Алгоритм агрегации весов слов - BclmMixPlain: линейная смесь аннотационного Bclm веса и взвешенного Positionless веса слова, затем пословные счётчики агрегируются через bm15. Коэффициент нормализации 10^(-5).
  1344. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn (ближайшие по dssm-модели, обучаемой предсказывать XfDtShow расширения). Агрегация по всем расширениям. Наибольшее взвешенное значение фактора. Нормировано на максимальный вес расширения. Стрим: CorrectedCtrLongPeriod. Степень покрытия слов запросас точностью до формы (без синонимов).
  1345. Фактор лингвистического бустинга. Тип расширений: Qfuf. Агрегация по всем расширениям. Наибольшее взвешенное значение фактора. Нормировано на максимальный вес расширения. Результат vpcg для долгого длинного периода, данные: CorrectedClicks. Средний вес аннтаций среди тех, в которых запрос оказался точной подстрокой.
  1346. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn (ближайшие по dssm-модели, обучаемой предсказывать XfDtShow расширения). Агрегация по всем расширениям. Наибольшее взвешенное значение фактора. Нормировано на максимальный вес расширения. Стрим: CorrectedCtrLongPeriod. Алгоритм BclmPlaneProximity1Bm15W0Size1: использует bclm с безвесовым взвеживанием если слов запроса несколько, если слово одно, то используется взвешенная по типу совпадения сумма хитов. Коэффициент нормализации 0.001.
  1347. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn (ближайшие по dssm-модели, обучаемой предсказывать XfDtShow расширения). Агрегация по всем расширениям. Средний вес расширений.
  1348. Документная dssm модель language classifier rus.
  1349. Документная dssm модель language classifier eng.
  1350. Документная dssm модель language classifier other.
  1351. Предсказание DSSM модели для определения нерелевантных ответов Алисы
  1352. Среднее значение News по запросу за год. Рассчитывается в оффлайне.
  1353. Среднее значение AddTime по запросу за год. Рассчитывается в оффлайне.
  1354. Среднее значение TxtHiRelSy по запросу за год. Рассчитывается в оффлайне.
  1355. Среднее значение TextLike по запросу за год. Рассчитывается в оффлайне.
  1356. Среднее значение HasNoAllWordsTRSy по запросу за год. Рассчитывается в оффлайне.
  1357. Среднее значение IsForum по запросу за год. Рассчитывается в оффлайне.
  1358. Среднее значение HasPayments по запросу за год. Рассчитывается в оффлайне.
  1359. Среднее значение YabarHostAvgTime2 по запросу за год. Рассчитывается в оффлайне.
  1360. Среднее значение YabarUrlVisitors по запросу за год. Рассчитывается в оффлайне.
  1361. Среднее значение QueryDOwnerOnlyClickRate по запросу за год. Рассчитывается в оффлайне.
  1362. Среднее значение DaterAge по запросу за год. Рассчитывается в оффлайне.
  1363. Среднее значение LongestText по запросу за год. Рассчитывается в оффлайне.
  1364. Среднее значение DifferentInternalLinks по запросу за год. Рассчитывается в оффлайне.
  1365. Среднее значение QueryDOwnerOnlyClickRate_Reg по запросу за год. Рассчитывается в оффлайне.
  1366. Среднее значение IsHub по запросу за год. Рассчитывается в оффлайне.
  1367. Среднее значение BM25_0 по запросу за год. Рассчитывается в оффлайне.
  1368. Среднее значение Bocm по запросу за год. Рассчитывается в оффлайне.
  1369. Среднее значение IsIndexPage по запросу за год. Рассчитывается в оффлайне.
  1370. Среднее значение QueriesAvgCM2 по запросу за год. Рассчитывается в оффлайне.
  1371. Среднее значение BrowserHostDownloadProbability по запросу за год. Рассчитывается в оффлайне.
  1372. Среднее значение RegBrowserUserHub по запросу за год. Рассчитывается в оффлайне.
  1373. Среднее значение AuxTitleBM25 по запросу за год. Рассчитывается в оффлайне.
  1374. Среднее значение QueryUrlCorrectedCtrXfactor по запросу за год. Рассчитывается в оффлайне.
  1375. Среднее значение QueryToDocAllSumFCountTextBm11Norm16384 по запросу за год. Рассчитывается в оффлайне.
  1376. Среднее значение XfDtShowAllSumWFSumWBodyMinWindowSize по запросу за год. Рассчитывается в оффлайне.
  1377. Средневзвешанное кликами значение IsMainPage по запросу за год. Рассчитывается в оффлайне.
  1378. Средневзвешанное кликами значение YabarUrlAvgTime по запросу за год. Рассчитывается в оффлайне.
  1379. Средневзвешанное кликами значение DifferentInternalLinks по запросу за год. Рассчитывается в оффлайне.
  1380. Средневзвешанное dwelltime-ами значение UrlDomainFraction по запросу за год. Рассчитывается в оффлайне.
  1381. BM25FdPR с нормировкой на среднюю длину документа, зависящую от языка документа. Используются только хиты текстов.
  1382. Does owner have metrika or not
  1383. У документа есть турбо-страница для mobile платформы.
  1384. Document annotations count in the whole history of the Search (DSSM AnnReg models helper)
  1385. Document annotation words count in the whole history of the Search (DSSM AnnReg models helper)
  1386. Document annotation regions count in the whole history of the Search (DSSM AnnReg models helper)
  1387. Query-MainContentKeywords similarity, target: logDwellTime
  1388. Maximum value of domain yellowness (based on Toloka)
  1389. Mean value of domain yellowness (based on Toloka)
  1390. Median of domain yellowness (based on Toloka)
  1391. Minimum value of domain yellowness (based on Toloka)
  1392. Dssm Boosting query self similarity for XfWeight model.
  1393. Dssm Boosting AvgTop02Score aggregation for XfWeight model over 5-means centroids.
  1394. Dssm Boosting AvgTop04Score aggregation for XfWeight model over 5-means centroids.
  1395. Dssm Boosting AvgTop02ScoreAvgClusterTop3Weighted aggregation for XfWeight model over 5-means centroids.
  1396. Dssm Boosting AvgTop02Score aggregation for XfWeight model over 5-means centroids (query as expansion).
  1397. Dssm Boosting AvgTop02ScoreAvgClusterTop3Weighted aggregation for XfWeight model over 5-means centroids (query as expansion).
  1398. Dssm Boosting query self similarity for XfOne model.
  1399. Dssm Boosting Score aggregation for XfOne model over 1-means centroids.
  1400. Dssm Boosting ScaledSumWeight aggregation for XfOne model over 1-means centroids.
  1401. Dssm Boosting Score aggregation for XfOne model over 1-means centroids (query as expansion).
  1402. Dssm Boosting ScoreAvgNearest1Weighted aggregation for XfOne model over 1-means centroids (query as expansion).
  1403. Dssm Boosting ScoreAvgNearest5Weighted aggregation for XfOne model over 1-means centroids (query as expansion).
  1404. Dssm Boosting Score aggregation for XfOneSe model over 1-means centroids.
  1405. Dssm Boosting ScoreScaledSumWeighted aggregation for XfOneSe model over 1-means centroids.
  1406. Dssm Boosting ScoreAvgNearest5Weighted aggregation for XfOneSe model over 1-means centroids.
  1407. Dssm Boosting query self similarity for Ctr model.
  1408. Dssm Boosting Score aggregation for Ctr model over 1-means centroids.
  1409. Dssm Boosting Score aggregation for Ctr model over 1-means centroids (query as expansion).
  1410. Dssm Boosting ScoreScaledSumWeighted aggregation for Ctr model over 1-means centroids (query as expansion).
  1411. Dssm Boosting ScoreAvgNearest1Weighted aggregation for Ctr model over 1-means centroids (query as expansion).
  1412. Yellowness distribution dispersion of domain (based on Toloka)
  1413. Результат vpcg для долгого длинного периода, данные: CorrectedClicks. Фактор FullMatchPrediction
  1414. Результат vpcg для долгого длинного периода, данные: CorrectedClicks. Фактор AllWcmMatch95AvgValue
  1415. Результат vpcg для долгого длинного периода, данные: CorrectedClicks. Фактор CMMatchTop5AvgValue
  1416. Результат vpcg для долгого длинного периода, данные: CorrectedClicks. Фактор AnnotationMaxValueWeighted
  1417. Результат vpcg для долгого длинного периода, данные: CorrectedClicks. Фактор MixMatchWeightedValue
  1418. Результат vpcg для долгого длинного периода, данные: CorrectedClicks. Фактор CMMatchTop5AvgPrediction
  1419. DSSM model trained on CTRs without miner.
  1420. Предсказание dssm (url + title), обученной на сигнал page_quality и внедренной в RTHub, первый слот.
  1421. Предсказание dssm (url + title), обученной на сигнал page_quality и внедренной в RTHub, второй слот.
  1422. Главные компоненты запросного эмбединга от модели DssmCtrNoMiner
  1423. Главные компоненты запросного эмбединга от модели DssmCtrNoMiner
  1424. Главные компоненты запросного эмбединга от модели DssmCtrNoMiner
  1425. Главные компоненты запросного эмбединга от модели DssmCtrNoMiner
  1426. Главные компоненты запросного эмбединга от модели DssmCtrNoMiner
  1427. Главные компоненты запросного эмбединга от модели DssmCtrNoMiner
  1428. DSSM model trained on click odd pool
  1429. DSSM model trained on click personalization pool
  1430. DSSM model trained on click triangle pool
  1431. Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: CMMatchTop5AvgMatchValue по стриму FloatMultiplicity индекса LinkAnn
  1432. Фактор лингвистического бустинга. Фактор: PerWordAMMaxValueMin по стриму FloatMultiplicity индекса LinkAnn
  1433. Фактор лингвистического бустинга. Фактор: AttenV1Bm15K001 по стриму FloatMultiplicity индекса LinkAnn
  1434. Фактор лингвистического бустинга. Фактор: Bocm11Norm256 по стриму IsExternal индекса LinkAnn
  1435. Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: AnnotationMaxValue по стриму FloatMultiplicity индекса LinkAnn
  1436. DSSM model trained on clicks without miner (with no-clicks and AM-hard negatives). Takes bigrams into account.
  1437. AVG aggregation of HasPayments web factor using random log
  1438. AVG aggregation of VideoQuery web factor using random log
  1439. AVG aggregation of SyntQuality web factor using random log
  1440. PERCENTALE_90 aggregation of GeoRegionalityVNew web factor using random log
  1441. AVG aggregation of QClassDownload web factor using random log
  1442. AVG aggregation of IsMusic web factor using random log
  1443. PERCENTALE_25 aggregation of QueryThEncyclopedic web factor using random log
  1444. AVG aggregation of CommercialOwnerRank_Reg web factor using random log
  1445. PERCENTALE_25 aggregation of YabarWordDepthNodesGradientMin web factor using random log
  1446. AVG aggregation of PopularSEFRCBrowser web factor using random log
  1447. AVG aggregation of URLClicksMaxGeoRegionFRCRatio web factor using random log
  1448. PERCENTALE_90 aggregation of UBLongPeriodDirectHChildren90CntFromExtHost web factor using random log
  1449. PERCENTALE_90 aggregation of UBLongPeriodDtUrlHChildrenCut600Reg web factor using random log
  1450. AVG aggregation of IsPicture web factor using random log
  1451. AVG aggregation of ErratumLogQueryProbability web factor using random log
  1452. Предсказанная по запросу и стране, с помощью dssm-модели длина клика из данной страны.
  1453. Предсказанное с помощью нейронной сети среднее значение News по запросу за год.
  1454. Предсказанное с помощью нейронной сети среднее значение AddTime по запросу за год.
  1455. Предсказанное с помощью нейронной сети среднее значение TxtHiRelSy по запросу за год.
  1456. Предсказанное с помощью нейронной сети среднее значение TextLike по запросу за год.
  1457. Предсказанное с помощью нейронной сети среднее значение HasNoAllWordsTRSy по запросу за год.
  1458. Предсказанное с помощью нейронной сети среднее значение IsForum по запросу за год.
  1459. Предсказанное с помощью нейронной сети среднее значение HasPayments по запросу за год.
  1460. Предсказанное с помощью нейронной сети среднее значение YabarHostAvgTime2 по запросу за год.
  1461. Предсказанное с помощью нейронной сети среднее значение YabarUrlVisitors по запросу за год.
  1462. Предсказанное с помощью нейронной сети среднее значение QueryDOwnerOnlyClickRate по запросу за год.
  1463. Предсказанное с помощью нейронной сети среднее значение DaterAge по запросу за год.
  1464. Предсказанное с помощью нейронной сети среднее значение LongestText по запросу за год.
  1465. Предсказанное с помощью нейронной сети среднее значение DifferentInternalLinks по запросу за год.
  1466. Предсказанное с помощью нейронной сети среднее значение QueryDOwnerOnlyClickRate_Reg по запросу за год.
  1467. Тип канонизированного урла яндекс музыки - трек
  1468. Предсказанное с помощью нейронной сети среднее значение Bocm по запросу за год.
  1469. Предсказанное с помощью нейронной сети среднее значение IsIndexPage по запросу за год.
  1470. Предсказанное с помощью нейронной сети среднее значение QueriesAvgCM2 по запросу за год.
  1471. Предсказанное с помощью нейронной сети среднее значение BrowserHostDownloadProbability по запросу за год.
  1472. Предсказанное с помощью нейронной сети среднее значение RegBrowserUserHub по запросу за год.
  1473. Предсказанное с помощью нейронной сети среднее значение AuxTitleBM25 по запросу за год.
  1474. Предсказанное с помощью нейронной сети среднее значение QueryUrlCorrectedCtrXfactor по запросу за год.
  1475. Предсказанное с помощью нейронной сети среднее значение QueryToDocAllSumFCountTextBm11Norm16384 по запросу за год.
  1476. Предсказанное с помощью нейронной сети среднее значение XfDtShowAllSumWFSumWBodyMinWindowSize по запросу за год.
  1477. Предсказанное с помощью нейронной сети средневзвешанное кликами значение IsMainPage по запросу за год.
  1478. Предсказанное с помощью нейронной сети средневзвешанное кликами значение YabarUrlAvgTime по запросу за год.
  1479. Предсказанное с помощью нейронной сети средневзвешанное кликами значение DifferentInternalLinks по запросу за год.
  1480. Предсказанное с помощью нейронной сети средневзвешанное dwelltime-ами значение UrlDomainFraction по запросу за год.
  1481. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: BclmWeightedFLogW0 по группе стримов 3. Максимальное взвешенное значение фактора.
  1482. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: Bm15FLog по группе стримов 2. Максимальное взвешенное значение фактора.
  1483. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: мешочный OriginalRequestFraction по стриму FieldSetBagOfWords.
  1484. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: MixMatchWeightedValue по стриму QueryDwellTime. Максимальное взвешенное значение фактора нормированное на суммарный вес.
  1485. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: Bm15 по стриму Title. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) нормированное на суммарный вес.
  1486. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: BclmWeightedFLogW0 по группе стримов 3. Минимальное значение фактора по топу расширений.
  1487. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: BclmWeightedFLogW0 по группе стримов 3. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) нормированное на суммарный вес.
  1488. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: Bm15FLog по группе стримов 1. Максимальное взвешенное значение фактора.
  1489. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: Bm15FLog по группе стримов 1. Суммарное взвешенное значение фактора нормированное на суммарный вес.
  1490. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: мешочный AnnotationMatchAvgValue по стриму LongClickSP.
  1491. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: Bm15FLog по группе стримов 1. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по топу расширений нормированное на суммарный вес по топу расширений.
  1492. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: Bm15FLog по группе стримов 1. Минимальное взвешенное значение фактора по топу расширений нормированное на максимальный вес по топу расширений.
  1493. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: PairMinProximity по стриму Body. Максимальное взвешенное значение фактора нормированное на суммарный вес.
  1494. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: Bm15FLog по группе стримов 1. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) нормированное на суммарный вес.
  1495. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: мешочный AnnotationMatchAvgValue по стриму SimpleClick.
  1496. Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: мешочный CosineMaxMatch по стриму Title.
  1497. Предсказание вероятности того, что запрос локализуем в соответствии с правилом Regionality5.
  1498. Document has Fio from original request
  1499. Фактор для экспериментов Page Quality 1
  1500. DSSM model trained on clicks without miner (with no-clicks and am_hard negatives 50/50 and then on am_hard negatives only). Takes bigrams into account.
  1501. Dssm Boosting Score aggregation for XfOneSeAmSsHard model over 1-means centroids.
  1502. Dssm Boosting ScoreAvgClusterTop3Weighted aggregation for XfOneSeAmSsHard model over 1-means centroids.
  1503. Фактор для экспериментов Page Quality 2
  1504. Average by url maximum yellowness of teaser image
  1505. Average by url average yellowness of teaser image
  1506. Ratio of yellow images in teasers on host
  1507. Average yellow images count on host
  1508. Average teasers count on host
  1509. Average teasers area on host
  1510. Average by url minimum yellowness of teaser text
  1511. Average by url average yellowness of teaser text
  1512. Background is clickable advertisement
  1513. Average ratio of adverts on screen
  1514. Ratio of adverts on screen on main page
  1515. Average count of adverts on screen
  1516. Ratio of outgoing advertisement traffic to all traffic (desktop)
  1517. Ratio of outgoing real-time bidding traffic to all traffic (desktop)
  1518. Rating of news agency from agencies.json (Yandex.News resource)
  1519. Фактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Фактор: Norm256 по стриму Bocm11. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}).
  1520. Фактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Фактор: MinWindowSize по стриму Body. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по топу расширений нормированное на суммарный вес по топу расширений.
  1521. Фактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Фактор: MinWindowSize по стриму Body. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) нормированное на суммарный вес.
  1522. Фактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Фактор: Norm256 по стриму Bocm11. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по топу расширений.
  1523. Фактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Минимальный вес расширения.
  1524. Фактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Среднее арифметическое весов расширений.
  1525. Фактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Суммарный вес расширений.
  1526. Фактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Фактор: мешочный OriginalRequestFraction по стриму FieldSetBagOfWords.
  1527. Фактор для экспериментов Page Quality 3
  1528. Характеризует запрос по степени изменения от добавления фиксированного слова (номер некоторого года), используется dssm модель DssmBoostingXfOneSeAmSsHard
  1529. Характеризует запрос по степени изменения от добавления фиксированного слова ('онлайн' для кирилицы), используется dssm модель DssmBoostingXfOneSeAmSsHard
  1530. Характеризует запрос по степени изменения от удаления фиксированного слова ('сайт' для кирилицы), используется dssm модель DssmBoostingXfOneSeAmSsHard
  1531. Документ из шардов со свежим
  1532. Для каждого слова в оффлайне вычисляется среднее значение HasNoTr по запросам за 3 месяца. Далее по всем словам запроса берётся максимум этой величины.
  1533. Для каждого слова в оффлайне вычисляется среднее значение IsLJ по запросам за 3 месяца. Далее по всем словам запроса берётся максимум этой величины.
  1534. Для каждого слова в оффлайне вычисляется среднее значение BclmLite по запросам за 3 месяца. Далее по всем словам запроса берётся минимум этой величины.
  1535. Для каждого слова в оффлайне вычисляется среднее значение DBM40 по запросам за 3 месяца. Далее по всем не стоп словам запроса берётся максимум этой величины.
  1536. Для каждого слова в оффлайне вычисляется среднее значение IsDesktopRequest по запросам за 3 месяца. Далее по всем не стоп словам запроса берётся максимум этой величины.
  1537. Для каждого слова в оффлайне вычисляется среднее значение RLQAvgHasNoAllWordsTrSyn по запросам за 3 месяца. Далее по всем словам запроса берётся максимум этой величины.
  1538. Для каждого слова в оффлайне вычисляется среднее значение DssmAggregatedAnnReg по запросам за 3 месяца. Далее по всем словам запроса берётся максимум этой величины.
  1539. Для каждого слова в оффлайне вычисляется среднее значение MetaNumUrlsPerHostFixed по запросам за 3 месяца. Далее по всем словам запроса берётся максимум этой величины.
  1540. Для каждого слова в оффлайне вычисляется среднее значение MaxSDIsNavMxQueryMax по запросам за 3 месяца. Далее по всем не стоп словам запроса берётся максимум этой величины.
  1541. AVG aggregation of VisitsFromWiki web factor using random log
  1542. Фактор для экспериментов Page Quality 4
  1543. PERCENTALE_25 aggregation of NavLinear web factor using random log
  1544. PERCENTALE_90 aggregation of Found web factor using random log
  1545. AVG aggregation of SubqueryThMatch web factor using random log
  1546. Фактор для экспериментов Page Quality 5
  1547. AVG aggregation of SegmentWordPortionFromMainContent web factor using random log
  1548. AVG aggregation of XfDtShowAllMaxFFieldSet2Bm15FLogK0001 web factor using random log
  1549. AVG aggregation of QueryRegionSize web factor using random log
  1550. Документ пришёл из WebTier1
  1551. AVG aggregation of IsRelevLocaleUA web factor using random log
  1552. PERCENTALE_90 aggregation of QfufAllSumWFSumWFieldSet3BclmWeightedFLogW0K0001 web factor using random log
  1553. PERCENTALE_90 aggregation of DssmBoostingCtrQuerySelfSimilarity web factor using random log
  1554. AVG aggregation of QueryToDocAllSumFCountTextBocm11Norm256 web factor using random log. NOTE: QueryToDocAllSumFCountTextBocm11Norm256 has been removed.
  1555. PERCENTALE_90 aggregation of IsNavMxQuery web factor using random log
  1556. Документ пришёл из Platinum0
  1557. AVG aggregation of DBM15Wares2 web factor using random log
  1558. PERCENTALE_90 aggregation of UrlNGramsModel web factor using random log
  1559. Нейронная документная модель для поиска неожиданной жести
  1560. Medical host quality fresh.
  1561. PERCENTALE_25 aggregation of DssmBoostingCtrKMeans1ScoreScaledSumWeightedQE web factor using random log
  1562. PERCENTALE_90 aggregation of LongClickMobileAllWcmWeightedValue web factor using random log
  1563. PERCENTALE_25 aggregation of DssmVkPopularity web factor using random log
  1564. AVG aggregation of UBLongPeriodVisitsSNProb web factor using random log
  1565. PERCENTALE_90 aggregation of CountryQueryRegionality web factor using random log
  1566. PERCENTALE_90 aggregation of TRhitw web factor using random log
  1567. PERCENTALE_90 aggregation of UBLongPeriodAvgSearchDuration600 web factor using random log
  1568. AVG aggregation of RequestIsFromIOS web factor using random log
  1569. PERCENTALE_90 aggregation of DssmQueryEmbeddingCtrNoMinerPca4 web factor using random log
  1570. AVG aggregation of XfDtShowAllMaxFFieldSetUTBm15FLogW0 web factor using random log
  1571. PERCENTALE_25 aggregation of UrlTrigrams web factor using random log
  1572. PERCENTALE_90 aggregation of DssmQueryEmbeddingCtrNoMinerPca1 web factor using random log
  1573. AVG aggregation of IsRelevLocaleKZ web factor using random log
  1574. PERCENTALE_90 aggregation of TextFeatures web factor using random log
  1575. 1 if host include js from marketgid.com
  1576. 1 if host include js from rfity.com
  1577. DSSM prediction of google specificity for query
  1578. Site owner pays attention to site details (at least once in quarter)
  1579. Chat info. positive / events or zero
  1580. Host player info. Relation between view time and video duration
  1581. 1 if host include js from google-analytics.com
  1582. 1 if host include js from googleapis.com
  1583. 1 if host include js from facebook.net
  1584. 1 if host include js from mc.yandex.ru
  1585. Среднее значение RandomLogQueryAvgAddTime ближайших по knn запросов.
  1586. Среднее значение RandomLogQueryAvgTxtHiRelSy ближайших по knn запросов.
  1587. Среднее значение RandomLogQueryAvgTextLike ближайших по knn запросов.
  1588. Среднее значение RandomLogQueryAvgIsForum ближайших по knn запросов.
  1589. Среднее значение RandomLogQueryAvgHasPayments ближайших по knn запросов.
  1590. Среднее значение RandomLogQueryAvgDifferentInternalLinks ближайших по knn запросов.
  1591. Среднее значение RandomLogQueryAvgIsTargetBussinessCard ближайших по knn запросов.
  1592. Среднее значение RandomLogQueryAvgQueryToDocAllSumFCountTextBm11Norm16384 ближайших по knn запросов.
  1593. Среднее значение RandomLogQueryAvgXfDtShowAllSumWFSumWBodyMinWindowSize ближайших по knn запросов.
  1594. Host speed estimation
  1595. Is site official
  1596. Quality link from good sites estimation
  1597. Weight sum of each non-unique nevasca shingle
  1598. Nevasca shingle quantity in last week
  1599. Greentraffic share (aka direct visits). Desktop
  1600. Greentraffic share (aka direct visits). Mobile
  1601. Greentraffic absolute (desktop)
  1602. Visits averaged by user
  1603. 1 if video on page
  1604. Stream PCtrNew from yandex video
  1605. Stream PCtrNew from yandex video
  1606. Stream PCtrNew from yandex video
  1607. Stream PCtrNew from yandex video
  1608. Stream PCtrNew from yandex video
  1609. Stream PCtrNew from yandex video
  1610. У документа есть турбо-страница. Зависит от платформы
  1611. Medical host quality for metric.
  1612. Исходный запрос с удалением глаголов. Считается по заголовку документа. Алгоритм агрегации весов слов: Bm15. Коэффициент нормализации 0.1.
  1613. Исходный запрос с удалением глаголов. Считается по компазиционном стриму, состоящего из токенезированного урла и заголовка документа. Алгоритм агрегации весов слов: Bm15FLogW0. Коэффициент нормализации 0.0001.
  1614. Исходный запрос с удалением глаголов. Считается по содержимому документа. Минимальный размер окна, в которой входят все слова запроса. Нормировано на число слов в запросе.
  1615. Исходный запрос с удалением глаголов. Считается по токенезированному урлу. Алгоритм агрегации весов слов: Bm15. Коэффициент нормализации 0.1.
  1616. RMSE aggregation of Long web factor using random log
  1617. RMSE aggregation of IsOrg web factor using random log
  1618. RMSE aggregation of GskUrlModel web factor using random log
  1619. RMSE aggregation of DaterStatsAverageSourceSegment web factor using random log
  1620. RMSE aggregation of VisitsFromWiki web factor using random log
  1621. RMSE aggregation of XfDtShowBagOfWordsTitleCosineMaxMatch web factor using random log
  1622. RMSE aggregation of UBLongPeriodDownloadsProb web factor using random log
  1623. RMSE aggregation of MetaAvgIsNotCgi meta factor using random log
  1624. RMSE aggregation of MetaRmsSynPercentBadWordPairs meta factor using random log
  1625. RMSE aggregation of MetaPosTrigramsProb meta factor using random log
  1626. PERCENTALE_90 aggregation of Bocm web factor using random log
  1627. PERCENTALE_90 aggregation of SegmentWordPortionFromMainContent web factor using random log
  1628. PERCENTALE_90 aggregation of IsMobileBeauty web factor using random log
  1629. PERCENTALE_90 aggregation of USLongPeriodUrlWinsProb web factor using random log
  1630. PERCENTALE_90 aggregation of DssmBoostingXfWeightKMeans5AvgTop02ScoreQE web factor using random log
  1631. PERCENTALE_90 aggregation of DssmBoostingCtrKMeans1Score web factor using random log
  1632. PERCENTALE_90 aggregation of SDIsNavMxQueryMax meta factor using random log
  1633. PERCENTALE_90 aggregation of MetaWeb764Web1076ProductInvAvg meta factor using random log
  1634. PERCENTALE_90 aggregation of MetaWeb1099Web1219ProductInvPos meta factor using random log
  1635. PERCENTALE_90 aggregation of MetaMaxDssmMiddleVsShortLongHardNoClicks meta factor using random log
  1636. MAX aggregation of NumLinksFromMP web factor using random log
  1637. MAX aggregation of NavLinear web factor using random log
  1638. MAX aggregation of DaterStatsAverageSourceSegment web factor using random log
  1639. MAX aggregation of WeightedSumIsIndexPageIsNavMxQuery web factor using random log
  1640. MAX aggregation of QueryToDocAllSumFCountTextBocm11Norm256 web factor using random log. NOTE: QueryToDocAllSumFCountTextBocm11Norm256 has been removed.
  1641. MAX aggregation of DssmBigramsQueryDerivativeMax web factor using random log
  1642. MAX aggregation of DssmQueryCountryToUrlEstimatedDistance web factor using random log
  1643. MAX aggregation of MetaWeb764Web1076ProductInvAvg meta factor using random log
  1644. LOGAVG aggregation of TextFeatures web factor using random log
  1645. LOGAVG aggregation of DocLen web factor using random log
  1646. LOGAVG aggregation of IsHTML web factor using random log
  1647. LOGAVG aggregation of HasLevensht1QueryFragment web factor using random log
  1648. LOGAVG aggregation of HeadingIdfSumFixed web factor using random log
  1649. LOGAVG aggregation of AdvPronounsPortion web factor using random log
  1650. LOGAVG aggregation of LongestText web factor using random log
  1651. LOGAVG aggregation of CountryHour web factor using random log
  1652. LOGAVG aggregation of MetrikaUrlAvgTime web factor using random log
  1653. LOGAVG aggregation of WikiLinkCount web factor using random log
  1654. LOGAVG aggregation of BrowserUrlDwellTimeRegionFrc web factor using random log
  1655. LOGAVG aggregation of WikiInfobox web factor using random log
  1656. LOGAVG aggregation of QueryDocTitleRangesMatchingScore web factor using random log
  1657. LOGAVG aggregation of IsMobileBeauty web factor using random log
  1658. LOGAVG aggregation of QueryToTextAllSumWFSumWBodyMinWindowSize web factor using random log
  1659. LOGAVG aggregation of DssmRandomLogQueryAvgDifferentInternalLinks web factor using random log
  1660. LOGAVG aggregation of MetaUrlDirectChildrenCnt meta factor using random log
  1661. LOGAVG aggregation of MetaWeb1241Web1299ProductInvPos meta factor using random log
  1662. LOGAVG aggregation of MetaEpsHashShareNationalLanguage meta factor using random log
  1663. Документ имеет протокол https
  1664. Расстояние Левенштейна между запросом и урлом вида youtubecom/watch нормированное по максимуму из длины запроса и урла
  1665. Длина наибольшей общей подстроки между урлом и запросом нормированная на длину запроса
  1666. Нормированное сигмоидой значение текстового запросного классификатора порно по оценкам из Толоки
  1667. Бинаризованное значение текстового запросного классификатора порно по оценкам из Толоки
  1668. Приведенное к [0,1] значение текстового запросного классификатора порно по оценкам классификатора веба и доп. словарям
  1669. Бинаризированное с использованием фикслистов значение текстового запросного классификатора порно по оценкам классификатора веба и доп. словарям
  1670. Наличие нецензурной лексики в запросе. 0 - отсутствует, 0.5 - нежёсткий, 1 - жёсткий
  1671. Наличие порно-маркеров в запросе (0 - есть, 1/3 - нет, 1 - запрос 'серый')
  1672. Документный классификатор порнушности, фичи по тексту документа
  1673. Документный классификатор порнушности, фичи по урлу документа
  1674. Документный классификатор порнушности, фичи по картинкам документа (информация берется из индекса Картинок)
  1675. Документный классификатор порнушности, фичи по видеороликам документа (информация берется из индекса Видео)
  1676. Хостовый классификатор порнушности, фичи про порнушность запросов, по которым показывался и кликался хост
  1677. Наличие в лемматизированном запросе слова официальный
  1678. Наличие в лемматизированном запросе слова википедия
  1679. Наличие в лемматизированном запросе слова не и похожих по смыслу
  1680. Наличие в лемматизированном запросе слов купить, цена и похожих по смыслу
  1681. Фактор возвращаемости на хост. Percentale агрегация с коэффициентом 0.25f фичи DwellTimeSumFraction
  1682. Документ пришёл из QuickMed
  1683. Фактор возвращаемости на хост. Percentale агрегация с коэффициентом 0.99f фичи AverageReturnTime
  1684. Фактор возвращаемости на хост. Percentale агрегация с коэффициентом 0.97f фичи AverageReturnTime
  1685. Фактор возвращаемости на хост. GreaterFraction агрегация с коэффициентом 0.99f фичи AverageReturnTime
  1686. Фактор возвращаемости на хост. Percentale агрегация с коэффициентом 0.99f фичи AverageLogReturnTime
  1687. Фактор возвращаемости на хост. GreaterFraction агрегация с коэффициентом 0.9f фичи AverageLogReturnTime
  1688. Фактор возвращаемости на хост. LessFraction агрегация с коэффициентом 0.05f фичи FirstClickDwellTime
  1689. Фактор возвращаемости на хост. WeightedAverage агрегация фичи AverageVisitsPer3Hours
  1690. Medical host quality.
  1691. У документа есть турбо-страница для desktop платформы. Апдейты поверх базы доставляются через saas.
  1692. Фактор возвращаемости на хост. WeightedAverage агрегация фичи AverageDwellTimePerHour
  1693. Фактор возвращаемости на хост. LessFraction агрегация с коэффициентом 0.1f фичи AverageDwellTimePer3Hours
  1694. Фактор возвращаемости на хост. Max агрегация фичи AverageDwellTimePerWeek
  1695. Медианный двеллтайм запроса за всю историю. Двеллтайм обрезается до 6000. Запрос нормализуется по доппельгангерам
  1696. Число показов запроса с более чем одним кликом за всю историю. Запрос нормализуется по доппельгангерам
  1697. Доля показов запроса с более чем одним кликом от всех показов за всю историю. Запрос нормализуется по доппельгангерам
  1698. Owner aggregation of RandomLogWordMaxMetaNumUrlsPerHostFixed web factor using random log, aggregation type is PERCENTALE_90
  1699. Owner aggregation of MetaWeb1099Web1219ProductInvPos meta factor using random log, aggregation type is LOGAVG
  1700. Owner aggregation of DssmDwelltimeRegChainTrainedEmbedding meta factor using random log, aggregation type is PERCENTALE_90
  1701. Owner aggregation of DssmRandomLogQueryAvgHasPayments web factor using random log, aggregation type is LOGAVG
  1702. Owner aggregation of UBLongPeriodBrowseFrc web factor using random log, aggregation type is PERCENTALE_90
  1703. Owner aggregation of MetaUrlChildrenCnt meta factor using random log, aggregation type is LOGAVG
  1704. Owner aggregation of MetaRmsDifferentInternalLinks meta factor using random log, aggregation type is PERCENTALE_25
  1705. Owner aggregation of RandomLogWordMaxHasNoTr web factor using random log, aggregation type is PERCENTALE_90
  1706. Owner aggregation of MetaResidUSLongPeriodUrlWinsProb meta factor using random log, aggregation type is RMSE
  1707. Owner aggregation of PornoQuery web factor using random log, aggregation type is LOGAVG
  1708. Owner aggregation of NationalLanguage web factor using random log, aggregation type is LOGAVG
  1709. Owner aggregation of PercentVisibleContent web factor using random log, aggregation type is PERCENTALE_90
  1710. Owner aggregation of MetaWeb1241Web1299ProductInvPos meta factor using random log, aggregation type is PERCENTALE_25
  1711. Owner aggregation of LinkAnnFloatMultiplicityAttenV1Bm15K001 web factor using random log, aggregation type is LOGAVG
  1712. Owner aggregation of UBLongPeriodLeavesCnt web factor using random log, aggregation type is RMSE
  1713. Owner aggregation of NumLinksFromMP web factor using random log, aggregation type is LOGAVG
  1714. Owner aggregation of DssmRandomLogQueryAvgDifferentInternalLinks web factor using random log, aggregation type is PERCENTALE_25
  1715. Owner aggregation of IsOrg web factor using random log, aggregation type is RMSE
  1716. Owner aggregation of QSegmentsBM25 web factor using random log, aggregation type is MAX
  1717. Owner aggregation of SegmentAuxAlphasInText web factor using random log, aggregation type is RMSE
  1718. Owner aggregation of RandomLogQueryDwelltimeWeightedAvgUrlDomainFraction web factor using random log, aggregation type is LOGAVG
  1719. Owner aggregation of RandomLogWordSkipStopWordsMaxIsDesktopRequest web factor using random log, aggregation type is LOGAVG
  1720. Owner aggregation of VisitsFromWiki web factor using random log, aggregation type is RMSE
  1721. Owner aggregation of IsText web factor using random log, aggregation type is RMSE
  1722. Owner aggregation of DBMSubstantive web factor using random log, aggregation type is MAX
  1723. Owner aggregation of DaterStatsAverageSourceSegment web factor using random log, aggregation type is RMSE
  1724. Owner aggregation of IsMobileBeauty web factor using random log, aggregation type is LOGAVG
  1725. Owner aggregation of LongClickSPMixMatchWeightedValue web factor using random log, aggregation type is PERCENTALE_90
  1726. Owner aggregation of FemAndMasNounsPortion web factor using random log, aggregation type is LOGAVG
  1727. Owner aggregation of TrigramsProb web factor using random log, aggregation type is PERCENTALE_90
  1728. Owner aggregation of DaterStatsYearNormLikelihood web factor using random log, aggregation type is PERCENTALE_25
  1729. Owner aggregation of UrlPathAndParamsFraction web factor using random log, aggregation type is MAX
  1730. Среднее значение для запросного фактора по данным лингвобустинга QueryToText, вычисляется в бегемотном правиле LingBoostQueryFeatures
  1731. Среднее значение для запросного фактора по данным лингвобустинга QueryToTextByXfDtShowKnn, вычисляется в бегемотном правиле LingBoostQueryFeatures
  1732. sum / (sum + 10) для запросного фактора по данным лингвобустинга XfDtShow, вычисляется в бегемотном правиле LingBoostQueryFeatures
  1733. Квантиль 0.1 для запросного фактора по данным лингвобустинга XfDtShow, вычисляется в бегемотном правиле LingBoostQueryFeatures
  1734. Квантиль 0.1 для запросного фактора по данным лингвобустинга XfDtShowKnn, вычисляется в бегемотном правиле LingBoostQueryFeatures
  1735. Квантиль 0.9 для запросного фактора по данным лингвобустинга XfDtShowKnn, вычисляется в бегемотном правиле LingBoostQueryFeatures
  1736. sum / (sum + 10) для запросного фактора по данным лингвобустинга Qfuf, вычисляется в бегемотном правиле LingBoostQueryFeatures
  1737. Среднее значение для запросного фактора по данным лингвобустинга Qfuf, вычисляется в бегемотном правиле LingBoostQueryFeatures
  1738. Cайт расположен в сети Tas-IX (актуально для Узбекистана)
  1739. Dssm Boosting Score for SerpSimilarityHard model over 1-means centroids.
  1740. Page quality aggregated by host (avg).
  1741. relev_locale == uz
  1742. 25% квантиль времени с предыдущего запроса перед текущим. Запрос нормализуется по доппельгангерам
  1743. Результат применения нейронной модели, обученной отличать длинные клики от остальных событий, входом модели являтся пословные и биграмные счётчики, рассчитываемые по текстовым стримам (Title, Body, Url).
  1744. адаптирован ли этот хост под мобильные устройства
  1745. Фактор лингвистического бустинга. Тип расширений: QfufFilteredByXfOneSe (qfuf, фильтрованные по dssm-модели XfOneSe). Агрегация по всем расширениям. Наибольшее значение фактора. Взвешенное объединение стримов Url, Title, Body, CorrectedCtr, LongClick, OneClick, BrowserPageRank, SplitDwellTime, SamplePeriodDayFrc, SimpleClick, YabarVisits, YabarTime. Алгоритм агрегации весов слов: Bm15FLog (Bm15 агрегация логарифмов встречаемости слов). Коэффициент нормализации 0.001.
  1746. Фактор лингвистического бустинга. Тип расширений: QfufFilteredByXfOneSe (qfuf, фильтрованные по dssm-модели XfOneSe). Агрегация по всем расширениям. Наибольшее значение фактора. Взвешенное объединение стримов Title, Body, LongClick, LongClickSP, OneClick. Алгоритм агрегации весов слов: BclmWeightedFLogW0. Коэффициент нормализации 0.001.
  1747. Фактор лингвистического бустинга. Тип расширений: QfufFilteredByXfOneSe (qfuf, фильтрованные по dssm-модели XfOneSe). Агрегация по всем расширениям. Наибольшее значение фактора. Считается по компазиционном стриму, состоящего из токенезированного урла и заголовка документа. Алгоритм агрегации весов слов: Bm15FLogW0. Коэффициент нормализации 0.0001.
  1748. Фактор лингвистического бустинга. Тип расширений: QfufFilteredByXfOneSe (qfuf, фильтрованные по dssm-модели XfOneSe). Агрегация по всем расширениям. Наибольшее значение фактора. Считается по заголовку документа. Алгоритм агрегации весов слов: Bm15. Коэффициент нормализации 0.1.
  1749. Фактор лингвистического бустинга. Тип расширений: QfufFilteredByXfOneSe (qfuf, фильтрованные по dssm-модели XfOneSe). Агрегация по топ-10 (по значению фактора) расширениям. Взвешенная сумма весов факторов. Нормированно на суммарный вес расширений. Взвешенное объединение стримов Url, Title, Body, CorrectedCtr, LongClick, OneClick, BrowserPageRank, SplitDwellTime, SamplePeriodDayFrc, SimpleClick, YabarVisits, YabarTime. Алгоритм агрегации весов слов: Bm15FLog (Bm15 агрегация логарифмов встречаемости слов). Коэффициент нормализации 0.001.
  1750. Фактор лингвистического бустинга. Тип расширений: QfufFilteredByXfOneSe (qfuf, фильтрованные по dssm-модели XfOneSe). Агрегация по топ-10 (по значению фактора) расширениям. Взвешенная сумма весов факторов. Нормированно на суммарный вес расширений. Считается по содержимому документа. Минимальный размер окна, в которой входят все слова запроса. Нормировано на число слов в запросе.
  1751. Фактор по фильтрованному оригинальному запросу: вычисляется dssm-расстояние от запроса без слов до исходного запроса, после чего происходит отсечение по порогу. Взвешенное объединение стримов Url,Title,Body,Links,CorrectedCtr,LongClick,OneClick,BrowserPageRank,SplitDwellTime,SamplePeriodDayFrc,SimpleClick,YabarVisits,YabarTime. Алгоритм агрегации весов слов: Bm15FLog (Bm15 агрегация логарифмов встречаемости слов). Коэффициент нормализации 0.001.
  1752. Фактор по фильтрованному оригинальному запросу: вычисляется dssm-расстояние от запроса без слов до исходного запроса, после чего происходит отсечение по порогу. Считается по компазиционном стриму, состоящего из токенезированного урла и заголовка документа. Алгоритм агрегации весов слов: Bm15FLogW0. Коэффициент нормализации 0.0001.
  1753. DSSM model trained on cross language CTRs using serp similarity hard miner.
  1754. Для всех слов слов запроса вычисляется вес методом query-mutation (расстояние между запросами при налиичии и отсуствии слова). Берётся сумма весов слов найденных в тайтле, делённое на сумму весов всех слов.
  1755. Для всех слов слов запроса вычисляется вес методом query-mutation (расстояние между запросами при налиичии и отсуствии слова). Берётся максимум веса среди слов, отсутсвующих в тайтле документа.
  1756. Результат применения нейронной модели, обученной отличать длинные клики от остальных событий, входом модели являтся пословные и биграмные счётчики, рассчитываемые по текстовым стримам (Body, Url).
  1757. Считается как (80-x) где x — возвраст документа в часах (непрерывно). Использует данные датировщика RobotAddTime
  1758. Считается как (10-x) где x — возвраст документа в днях (непрерывно). Использует данные датировщика RobotAddTime
  1759. Разница между текущей датой и датой документа, определённой датировщиком RobotAddTime, 1 — дата равна текущей, 0 — документу 10 дней и больше, или дата не определена
  1760. Фактор лингвистического бустинга. Тип расширений: XfOneSeKnn (ближайшие по dssm-модели, обучаемой предсказывать XfDtShow расширения). Агрегация по всем расширениям. Наибольшее взвешенное значение фактора. Нормировано на максимальный вес расширения. Взвешенное объединение стримов Url,Title,Body,Links,CorrectedCtr,LongClick,OneClick,BrowserPageRank,SplitDwellTime,SamplePeriodDayFrc,SimpleClick,YabarVisits,YabarTime. Алгоритм агрегации весов слов: Bm15FLog (Bm15 агрегация логарифмов встречаемости слов). Коэффициент нормализации 0.001.
  1761. Фактор лингвистического бустинга. Тип расширений: XfOneSeKnn (ближайшие по dssm-модели, обучаемой предсказывать XfDtShow расширения). Агрегация по всем расширениям. Наибольшее взвешенное значение фактора. Нормировано на максимальный вес расширения. TODO Алгоритм: максимальный вес полностью совпавшей с запросом аннотации. Считается по стриму OneClick.
  1762. Фактор лингвистического бустинга. Тип расширений: QueryToTextByXfOneSeKnn (QueryToText расширения XfOneSeKnn расширений). Агрегация по топ-10 (по значению фактора) расширениям. Взвешенная сумма весов факторов. Нормированно на суммарный вес расширений. Считается по содержимому документа. Минимальный размер окна, в которой входят все слова запроса. Нормировано на число слов в запросе.
  1763. Фактор лингвистического бустинга. Тип расширений: QueryToTextByXfOneSeKnn (QueryToText расширения XfOneSeKnn расширений). Агрегация по всем расширениям. Взвешенная сумма весов факторов. Нормированно на суммарный вес расширений. Взвешенное объединение стримов Title, Body, LongClick, LongClickSP, OneClick. Алгоритм агрегации весов слов: BclmWeightedFLogW0. Коэффициент нормализации 0.001.
  1764. Домен в международной зоне
  1765. Запрос был распознан как имеющий интент к объектам авторского права, защищаемых анти-пиратским меморандумом.
  1766. хост содержит пиратские видео защищаемых анти-пиратским меморандумом.
  1767. хост содержит видео защищаемых анти-пиратским меморандумом.
  1768. Средний профицит свежести хоста за 30 дней
  1769. Доля документов с положительным профицитом свежести с хоста за 30 дней
  1770. Стивенсон
  1771. Стивенсон
  1772. Стивенсон
  1773. Стивенсон
  1774. Стивенсон
  1775. Перенормированный предикт ethos классификатора по разметке на уместность видео.
  1776. Перенормированный предикт ethos классификатора, обученного на синтетической выборке 'запрос характерный для пиратского сайта' vs 'запрос характерен для сайта далёкого от этого'
  1777. в данном слоте ни когда не было не нулевой фичи
  1778. Регрессия по dssm эмбедам на разделение меморандумных и нет запросов
  1779. Перенормированный предикт ethos классификатора, обученного различать меморандумные запросы от рандома
  1780. Регрессия по dssm эмбедам на разделение пирато специфичных и нет запросов
  1781. DSSM модель, которая предсказывает логарифм самого длинного клика на серпе. В качестве негативных примеров выбираем урлы из прошлых запросов этого же пользователя, причем максимальное время между запросами не более 7 минут (суперхарды по переформулировкам)
  1782. Документ пришёл из Quick но не из QuickRt
  1783. Документ пришёл из QuickRt
  1784. Документ пришёл из Callisto
  1785. Feature LegalPlayers from VideoIndex
  1786. Feature SocialNetworksPlayers from VideoIndex
  1787. Feature StevensonPlayers from VideoIndex
  1788. DSSM модель с ранним связыванием, обученная на переформулировках, которая предсказывает логарифм самого длинного клика на серпе.
  1789. Rating of news agency from agencies.json > 0 (Yandex.News resource)
  1790. Weekday query probability
  1791. Wiki: https://wiki.yandex-team.ru/JandeksPoisk/Antispam/biz-kernel-basic-description/
  1792. Показатель качества сайта с точки зрения факторов про пользовательское поведение, агрегированных до владельцев.
  1793. Neural network value for contexts of query hits in document text. Predicts relevance-all-8-years. Uses formula ussr-dump-20190719 prs-20190720 all-8-years [t > 0.25] CrossEntropy 20k 0.25 -S 0.8 -Z 1 predictions for learning.
  1794. Bans of Antispam from erf
  1795. DSSM модель, обученная на пуле переформулировок, которая в запросной части помимо самого запроса получает 4 расширения XfDt с самым большим весом
  1796. Агрегированная по ближайшим на хосте урлам LogAvg-статистика фактора IsMobileRequest
  1797. Агрегированная по ближайшим на хосте урлам LogAvg-статистика фактора NanobtaniumQueryWordTitle5nDist2maxXMax
  1798. Bans on gsm of Antispam from erf
  1799. Bans on fresh of Antispam from erf
  1800. Среднее значение IsBlog по запросу за год. Рассчитывается в оффлайне.
  1801. У документа есть турбо-страница для mobile платформы. Апдейты поверх базы доставляются через saas.
  1802. У документа есть турбо-страница для desktop платформы. Апдейты поверх базы доставляются через saas.
  1803. Модель, обученная на предсказание оценки формулой ussr-dump-20190719 prs-20190720 all-8-years [t > 0.25] CrossEntropy 20k 0.25 -S 0.8 -Z 1.
  1804. 'Случайный' фактор для коммерческих сайтов.
  1805. Нейронная документная модель для поиска неожиданной жести (для экспов)
  1806. Features calculated on url with request multitokens expansion
  1807. Features calculated on url with request multitokens expansion
  1808. Модель, обученная на предсказание оценки формулой ussr-dump-20190719 prs-20190720 all-8-years [t > 0.25] CrossEntropy 20k 0.25 -S 0.8 -Z 1 и дообученная на оценки релевантности.
  1809. Доля запросов, по которым показывалась морда владельца, среди всех запросов, по которым показывался владелец за последнюю неделю.
  1810. Доля посещений с серпа документов, находящихся на уровне 0 хопов. За 30 дней.
  1811. Средняя позиция владельца по запросам за последнюю неделю.
  1812. Отношение мобильных к десктопам по трафу с поисковиков.
  1813. Отношение мобильных к десктопам по всему исходящему трафу.
  1814. Среднее значениие запросного фактора isorg по запросам с данным владельцем за последнюю неделю.
  1815. Усредненное отношение пунктуации ко всем разделителям в документах владельца.
  1816. Значение детектора свежести, рассчитываемого в бегемоте. Всегда 0 при значении детектора меньше порога.
  1817. хост содержит видео защищаемых анти-пиратским меморандумом.
  1818. Стивенсон