devops
January 24
DataStax Bulk Loader (DSBulk) балалайка для Cassandra
Инструмент массовой загрузки и выгрузки данных под названием DSBulk от DataStax, помог посчитать колиство строк в таблице кейспейса, потому что классическим селектом этого не сделать. Вот как это делается:
- кладем DSBulk из репозитория на ноду с Cassandra;
./dsbulk count -k inbox -t messages -h vm-hostname -port 9042 -u username -p password
В моем примере, на тестовых данных запрос отбежал за 4 минуты и выдал 39870555 строк. Кластер из 3 нод и одним дата центром (DC).
Ссылка на GitHub: https://github.com/datastax/dsbulk