May 10, 2023

UGC 8 спринт


Выбор БД для UGC

MongoDB в случаях, когда важна гибкость модели данных и необходимо обрабатывать сложные запросы и агрегации данных.

С другой стороны, Cassandra обладает хорошей масштабируемостью и применяется во многих крупных системах обработки больших данных для обработки безопасной записи в журналы, подсчетов счетчиков и хранения исторических событий.

?

Использовать MongoDB отзывов и лайков, а Cassandra для истории просмотра фильмов
+ | Поработаем с обеими БД.

Apache Cassandra предлагает гибкую схему, распределенный механизм хранения данных и высокую производительность при обработке больших объемов данных. Она успешно применяется для хранения журналов и сообщений от пользователей, а также для поддержки сервисов рекомендаций и персонализации профилей пользователей.

MongoDB также является популярным выбором для хранения данных UGC. Она позволяет использовать гибкую схему данных, что значит, что можно хранить данные различного типа в одной коллекции. MongoDB обеспечивает высокую доступность и поддержку механизма шардинга для обеспечения масштабируемости в базе данных.

ИТОГ: EventStore и Kafka : /


Kafka - это OLTP хранилище (Online Transaction Processing)

Для построения рекомендательной системы онлайн-кинотеатра вы будете перекладывать данные о прогрессе просмотра фильмов из Kafka (OLTP-хранилище) в OLAP-систему при помощи ETL-процесса.