devops
January 24

DataStax Bulk Loader (DSBulk) балалайка для Cassandra 

Инструмент массовой загрузки и выгрузки данных под названием DSBulk от DataStax, помог посчитать колиство строк в таблице кейспейса, потому что классическим селектом этого не сделать. Вот как это делается:

- кладем DSBulk из репозитория на ноду с Cassandra;

- запускаем через команду:

./dsbulk count -k inbox -t messages -h vm-hostname -port 9042 -u username -p password

В моем примере, на тестовых данных запрос отбежал за 4 минуты и выдал 39870555 строк. Кластер из 3 нод и одним дата центром (DC).

Ссылка на GitHub: https://github.com/datastax/dsbulk