πData Scientist Π² ΠΊΠΎΠΌΠ°Π½Π΄Ρ Π‘Π±Π΅ΡΠΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΡ
Π‘Π±Π΅ΡΠΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ β ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΡ ΡΠΊΠΎΡΠΈΡΡΠ΅ΠΌΡ Π‘Π±Π΅ΡΠ°.
ΠΡ β Π½ΠΎΠ²Π°Ρ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΡ (ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½Π° Π²Π΅ΡΠ½ΠΎΠΉ 2021 Π³ΠΎΠ΄Π°) ΠΈ Π½Π°ΡΠ° ΠΊΠΎΠΌΠ°Π½Π΄Π° Π½Π°Ρ ΠΎΠ΄ΠΈΡΡΡ Π² ΡΡΠ°Π΄ΠΈΠΈ Π°ΠΊΡΠΈΠ²Π½ΠΎΠ³ΠΎ ΡΠΎΡΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ.
Π‘Π΅ΠΉΡΠ°Ρ ΠΌΡ ΠΈΡΠ΅ΠΌ ΠΎΠΏΡΡΠ½ΠΎΠ³ΠΎ Data Scientist Π² ΠΊΠΎΠΌΠ°Π½Π΄Ρ Π‘Π±Π΅ΡΠΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΡ.
ΠΡ ΠΈΡΠ΅ΠΌ ΠΊΠΎΠ»Π»Π΅Π³Ρ, ΠΊΠΎΡΠΎΡΡΠΉ ΡΠΏΠ΅ΡΠΈΠ°Π»ΠΈΠ·ΠΈΡΡΠ΅ΡΡΡ Π½Π° ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°ΡΠ΅Π»ΡΠ½ΡΡ ΡΠΈΡΡΠ΅ΠΌΠ°Ρ , ΠΈΠΌΠ΅Π΅Ρ ΠΎΠΏΡΡ ΡΠ°Π±ΠΎΡΡ Ρ Π±ΠΎΠ»ΡΡΠΈΠΌΠΈ Π΄Π°Π½Π½ΡΠΌΠΈ, Π»ΡΠ±ΠΈΡ ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠΈΡΠΎΠ²Π°ΡΡ ΠΈ ΠΈΡΠΊΠ°ΡΡ Π² Ρ Π»Π΅Π±Π½ΡΡ ΠΊΡΠΎΡΠΊΠ°Ρ Π²Π°ΠΆΠ½ΡΠ΅, Π° Π³Π»Π°Π²Π½ΠΎΠ΅ ΡΠ°Π±ΠΎΡΠΈΠ΅ ΡΡΠΈΠ³Π³Π΅ΡΡ.
Π ΠΠΠΠΠ§ΠΠ₯:
- ΠΠΎΠ»Π½ΡΠΉ ΡΠΈΠΊΠ» ΡΠΎΠ·Π΄Π°Π½ΠΈΡ Π½Π°Π±ΠΎΡΠ° ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΡΡΠ°Π½Π·Π°ΠΊΡΠΈΠΎΠ½Π½ΠΎΠΉ ΠΈ ΠΏΠΎΠ²Π΅Π΄Π΅Π½ΡΠ΅ΡΠΊΠΎΠΉ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ (dataΒ collection, feature engineering, model fitting, model management, visualization, model serving);
- Π‘ΠΎΠ·Π΄Π°Π½ΠΈΠ΅ realtime-ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΏΠ΅ΡΡΠΎΠ½Π°Π»ΡΠ½ΡΡ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°ΡΠΈΠΉ ΡΠΎΠ²Π°ΡΠΎΠ² ΠΈ ΡΡΠ»ΡΠ³,
- Π Π°Π·ΡΠ°Π±ΠΎΡΠΊΠ° ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π΄Π»Ρ Π·Π°Π΄Π°Ρ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΠΈ, Π±ΠΈΠ½Π°ΡΠ½ΠΎΠΉ, multiclass ΠΈ multilabel ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ;
- Π£ΡΠ°ΡΡΠΈΠ΅ Π² ΡΠ°Π·ΡΠ°Π±ΠΎΡΠΊΠ΅ ΠΈ ΡΡΠ°Π½Π΄Π°ΡΡΠΈΠ·Π°ΡΠΈΠΈ ML-ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½ΠΎΠ²;
- ΠΠ½Π°Π»ΠΈΠ· ΠΈ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠ° Π±ΠΎΠ»ΡΡΠΈΡ ΠΌΠ°ΡΡΠΈΠ²ΠΎΠ² Π΄Π°Π½Π½ΡΡ ;
- Πxperiment ΠΈ code-review.
Π ΠΊΠΎΠΌΠ°Π½Π΄Π΅:
ΠΡ ΡΠΎΠ»ΡΠΊΠΎ Π½Π°ΡΠ°Π»ΠΈ ΡΠΎΡΠΌΠΈΡΠΎΠ²Π°ΡΡ ΠΊΠΎΠΌΠ°Π½Π΄Ρ DS ΠΈ ΠΏΠ°ΡΠ°Π»Π»Π΅Π»ΡΠ½ΠΎ ΠΈΡΠ΅ΠΌ ΡΠ°ΠΊΠΆΠ΅ 2-Ρ Data Engineer`ΠΎΠ².
ΠΡ ΠΆΠ΄Π΅ΠΌ ΠΎΡ Π½Π°ΡΠ΅Π³ΠΎ Π±ΡΠ΄ΡΡΠ΅Π³ΠΎ ΠΊΠΎΠ»Π»Π΅Π³ΠΈ:
- ΠΠ½Π°Π½ΠΈΠ΅ Π°ΡΡ ΠΈΡΠ΅ΠΊΡΡΡΡ ΠΈ Π°Π»Π³ΠΎΡΠΈΡΠΌΠΎΠ² Π² ΠΎΡΠ½ΠΎΠ²Π΅ collaborative filtering / content and knowledge based / hybrid recommender systems ΠΈ Ρ.Π΄.;
- ΠΠΏΡΡ Π½Π°ΠΏΠΈΡΠ°Π½ΠΈΡ Π½Π° Python, ΠΏΡΠΈΠ²Π΅ΡΡΡΠ²ΡΠ΅ΡΡΡ PEP 8;
- ΠΠ»Π°Π΄Π΅Π½ΠΈΠ΅ ΠΎΡΠ½ΠΎΠ²Π°ΠΌΠΈ Π°Π»Π³ΠΎΡΠΈΡΠΌΠΎΠ² ΠΈ ΠΌΠ΅ΡΡΠΈΠΊ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ;
- ΠΠ½Π°Π½ΠΈΠ΅ SQL, ΠΆΠ΅Π»Π°ΡΠ΅Π»Π΅Π½ ΠΎΠΏΡΡ ΡΠ°Π±ΠΎΡΡ Ρ Clickhouse distributed postgresql.
ΠΡΠ΄Π΅ΠΌ ΡΠ°Π΄Ρ, Π΅ΡΠ»ΠΈ Π²Ρ:
- ΠΠΌΠ΅Π΅ΡΠ΅ ΠΎΠΏΡΡ ΡΠ°Π±ΠΎΡΡ ΡΠΎ Spark, Airflow, MLFlow / Neptune ML, DVC, TPOT ΠΈΠ»ΠΈ Π°Π½Π°Π»ΠΎΠ³ΠΈΡΠ½ΡΠΌΠΈ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠ°ΠΌΠΈ;
- Π‘ΡΠ°Π»ΠΊΠΈΠ²Π°Π»ΠΈΡΡ Ρ Docker, Kubernetes;
ΠΠ± ΡΡΠ»ΠΎΠ²ΠΈΡΡ :
Π ΡΠ°ΠΌΠΊΠ°Ρ ΡΡΠΎΠΉ ΠΏΠΎΠ·ΠΈΡΠΈΠΈ ΠΌΡ ΠΏΡΠ΅Π΄Π»Π°Π³Π°Π΅ΠΌ:
- ΠΡΡΠΎΠΊΡΡ ΠΈ ΠΏΠΎΠ»Π½ΠΎΡΡΡΡ Π±Π΅Π»ΡΡ Π·Π°ΡΠ°Π±ΠΎΡΠ½ΡΡ ΠΏΠ»Π°ΡΡ (ΡΠ΅ΠΉΡΠ°Ρ ΠΌΡ Π³ΠΎΡΠΎΠ²Ρ Π±ΡΡΡ Π³ΠΈΠ±ΠΊΠΈΠΌΠΈ ΠΈ ΠΎΡΠΈΠ΅Π½ΡΠΈΡΡΠ΅ΠΌΡΡ Π½Π° Π²Π°ΡΠΈ ΠΎΠΆΠΈΠ΄Π°Π½ΠΈΡ ΠΏΠΎ ΠΠ);
- ΠΠΠ‘ ΡΠΎ ΡΡΠΎΠΌΠ°ΡΠΎΠ»ΠΎΠ³ΠΈΠ΅ΠΉ Ρ ΠΏΠ΅ΡΠ²ΠΎΠΉ Π½Π΅Π΄Π΅Π»ΠΈ ΡΠ°Π±ΠΎΡΡ;
- ΠΡΠΎΡΠ΅ΡΡΠΈΠΎΠ½Π°Π»ΡΠ½ΠΎΠ΅ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ Π·Π° ΡΡΠ΅Ρ ΡΠ°Π±ΠΎΡΠΎΠ΄Π°ΡΠ΅Π»Ρ;
- ΠΠΈΠ±ΡΠΈΠ΄Π½ΡΠΉ ΡΠΎΡΠΌΠ°Ρ ΡΠ°Π±ΠΎΡΡ Ρ Π³ΠΈΠ±ΠΊΠΈΠΌ Π½Π°ΡΠ°Π»ΠΎΠΌ ΡΠ°Π±ΠΎΡΠ΅Π³ΠΎ Π΄Π½Ρ;
- ΠΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡ Π΄Π»ΠΈΡΠ΅Π»ΡΠ½ΠΎΠΉ ΡΠ΄Π°Π»Π΅Π½Π½ΠΎΠΉ ΡΠ°Π±ΠΎΡΡ;
- ΠΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΠΎΠ΅ ΠΏΡΠ΅ΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ ΡΠΎΠ³Π»Π°ΡΠ½ΠΎ Π²Π½ΡΡΡΠ΅Π½Π½ΠΈΠΌ ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΡΠΌ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ;
- ΠΡΡΠ³ΠΈΠ΅ Π±Π΅Π½Π΅ΡΠΈΡΡ, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΡ ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠΈΠΌ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π²Π°ΡΠ΅Π³ΠΎ Π²ΡΠ±ΠΎΡΠ° (ΠΈΠ·ΡΡΠ΅Π½ΠΈΠ΅ Π°Π½Π³Π»ΠΈΠΉΡΠΊΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ°, ΡΠΏΠΎΡΡ ΠΈ ΠΏΡ.), ΠΏΠ°ΠΊΠ΅Ρ ΡΠΎΡΠΌΠΈΡΡΠ΅ΡΡΡ.
ΠΡΠ»ΠΈ Π²Ρ ΡΠ·Π½Π°Π»ΠΈ ΡΠ΅Π±Ρ Π² ΠΎΠΏΠΈΡΠ°Π½ΠΈΠΈ β ΡΠΌΠ΅Π»ΠΎ ΠΏΠΈΡΠΈΡΠ΅ ΠΌΠ½Π΅ Π² Telegram @amevdokimova