Big Data Engineer (offline)

The goal of the project is to build a system from the scratch based on Data Lake architecture with Query Layer which provides ability for multiple data consumer systems to query data form the lake. Additional challenge in Query Layer design is to make it auto-scalable to handle peaks in demand with high uptime percentage as for HA characteristic.

The expected stack of technologies:
- AWS Services - EMR, S3, Lambda, EC2, RDS, CloudFormation and etc.
- Hortonworks Data Platform(HDP)
- Hive
- Spark, Spark Streaming
- Yarn
- Apache Knox
- Kafka
- Scala as a programming language

Must have top 3 tech skills:
- Experience with Big Data stack: Spark, Hive, HDFS
- Basic Scala
- Experience with AWS Cloud services

Good to have:
- Linux, scripting

Must have soft skills - as usual in position description:
- team player
- customer communication and etc.

About EPAM Systems

ЕРАМ прагне надавати своїй глобальній команді з понад 60,000+ професіоналів у більш ніж 45 країнах можливості для професійного зростання з першого дня співпраці. Наші колеги – джерело успіху ЕРАМ, тож ми цінуємо співпрацю, намагаємось завжди розуміти бізнес наших клієнтів та прагнемо до найвищих стандартів якості. Незалежно від місця, де ви знаходитесь, ви долучитесь до відданої, розмаїтої спільноти, яка допоможе вам реалізувати свій потенціал якомога повніше

Company website:
http://epam.com

DOU company page:
https://jobs.dou.ua/companies/epam-systems/

The job ad is no longer active

Look at the current jobs Scala Kharkiv→