October 4, 2021
Инженер данных / Московский центр инновационных технологий в здравоохранении
Требуется Инженер данных (Data Engineer) в АНО «Московский центр инновационных технологий в здравоохранении»
Инженер данных (Data Engineer)
Опыт работы с кластером Hadoop (Hdfs, Yarn, Hive/Impala);
Навык работы с Dataframe API Spark на глубоком уровне;
Базовые навыки оптимизации задач;
Уверенное знание SQL (зачастую ТЗ от аналитиков приходит в SQL коде);
Разрабатывать и обслуживать регламентные процессы на кластере: Hadoop,
Pyspark, Greenplum, Airflow, NiFI, Dagster, dbt;
Настраивать и автоматизировать процессы сбора, обработки, очистки
информации из различных источников;
Опыт программирования на Python
Опыт работы с системами контроля версий
Контакты: отправить резюме на [email protected]