TikTok раскрыл секреты и слабые места своего алгоритма рекомендаций
Когда пользователь открывает приложение TikTok, в ленте появляются ролики, подобранные системой с учетом его интересов. На формирование ленты влияют следующие факторы.
- Взаимодействие пользователей. Алгоритм анализирует лайки, репосты, комментарии, подписки и создаваемый пользователем контент.
- Информация о видео. Алгоритм запоминает использованные звуки, треки, хэштеги и описание видео. Например, если пользователь опубликует ролик с хэштегом #животные, в его ленте появятся видео с той же подписью.
- Настройки устройства и аккаунта. Алгоритм учитывает также выбранный язык, геолокацию и тип устройства.
Разработчики уточняют, что настройки устройства и учётной записи имеют меньший вес в системе рекомендаций по сравнению с другими метриками. Например, просмотр длинного видео от начала до конца важнее, чем проживание автора и зрителя в одной стране.
Популярность и статус автора не влияют на алгоритм рекомендаций, отмечают разработчики. Однако ролики пользователей с большим количеством подписок имеют больше шансов попасть в ленту пользователей.
Несмотря на то что взрывной рост TikTok во многом связан с отлаженной работой системы рекомендаций, у неё есть свои недостатки, о которых разработчики рассказали в посте.
«Одна из проблем, связанных с механизмом рекомендаций, заключается в том, что он может непреднамеренно ограничить ваш опыт, это явление иногда называют «пузырем фильтров», — говорится в посте. — Персонализация и фильтрация видео сопряжены с риском отображения всё более однотипного контента».
Разработчики считают «пузырь фильтров» одним из своих главных вызовов. Чтобы бороться с однообразным контентом, они создали отдельную вкладку «Для вас», где не должны появляться два видео подряд, снятых одним автором или с использованием одного и того же трека.
Однако обозреватель The Verge утверждает, что на практике алгоритм недоработан. Ему попалось 3—4 видео подряд, авторы которых использовали одну и ту же популярную песню.
Ещё одна проблема разработчиков, — это контент, который разрешён, но может показаться шокирующим для некоторых групп пользователей. Например, видео, герои которого употребляют алкоголь, может случайно попасть в ленту ребёнка.