February 8, 2010

Что читать и статистический анализ

Когда-то я пожелал, чтобы была социальная сеть, подбирающая по сходным вкусам единомышленников и формирующая рекомендации конкретно под меня на основе их рекомендаций.

Оказывается, такая штука уже давно есть. FantLab.ru называется. Увы, работает только по фантастике.

Подбор сотоварищей по вкусам делается достаточно любопытным образом: статистическими методами вычисляется коэффициент подобия между пользователями (с помощью корреляционного поля по нашим оценкам книгам) и далее для юзеров с самыми высокими коэффициентами относительно меня выбираются книги с наиболее высокими отметками (в среднем между ними).

Методика работает, после трех сотен отметок из 10 рекомендованных книг 8 авторов (!) были мною не читаны, но трех из них мне рекомендовали раньше как весьма стоящих.

Уточню: здесь идет речь именно о построении социальной сети: кто мне может рекомендовать книги, а чьи оценки не учитываются. Еще не понял, можно ли выкинуть из рейтинга определенного человека, но система на фантлабе гибче и интереснее известных мне аналогов.