UGC 8 спринт
Выбор БД для UGC
MongoDB в случаях, когда важна гибкость модели данных и необходимо обрабатывать сложные запросы и агрегации данных.
С другой стороны, Cassandra обладает хорошей масштабируемостью и применяется во многих крупных системах обработки больших данных для обработки безопасной записи в журналы, подсчетов счетчиков и хранения исторических событий.
?
Использовать MongoDB отзывов и лайков, а Cassandra для истории просмотра фильмов
+ | Поработаем с обеими БД.
Apache Cassandra предлагает гибкую схему, распределенный механизм хранения данных и высокую производительность при обработке больших объемов данных. Она успешно применяется для хранения журналов и сообщений от пользователей, а также для поддержки сервисов рекомендаций и персонализации профилей пользователей.
MongoDB также является популярным выбором для хранения данных UGC. Она позволяет использовать гибкую схему данных, что значит, что можно хранить данные различного типа в одной коллекции. MongoDB обеспечивает высокую доступность и поддержку механизма шардинга для обеспечения масштабируемости в базе данных.
Kafka - это OLTP хранилище (Online Transaction Processing)
Для построения рекомендательной системы онлайн-кинотеатра вы будете перекладывать данные о прогрессе просмотра фильмов из Kafka (OLTP-хранилище) в OLAP-систему при помощи ETL-процесса.