The goal of the project is to build a system from the scratch based on Data Lake architecture with Query Layer which provides ability for multiple data consumer systems to query data form the lake. Additional challenge in Query Layer design is to make it auto-scalable to handle peaks in demand with high uptime percentage as for HA characteristic.
The expected stack of technologies:
- AWS Services - EMR, S3, Lambda, EC2, RDS, CloudFormation and etc.
- Hortonworks Data Platform(HDP)
- Hive
- Spark, Spark Streaming
- Yarn
- Apache Knox
- Kafka
- Scala as a programming language
Must have top 3 tech skills:
- Experience with Big Data stack: Spark, Hive, HDFS
- Basic Scala
- Experience with AWS Cloud services
Good to have:
- Linux, scripting
Must have soft skills - as usual in position description:
- team player
- customer communication and etc.
About EPAM Systems
ЕРАМ прагне надавати своїй глобальній команді з понад 60,000+ професіоналів у більш ніж 45 країнах можливості для професійного зростання з першого дня співпраці. Наші колеги – джерело успіху ЕРАМ, тож ми цінуємо співпрацю, намагаємось завжди розуміти бізнес наших клієнтів та прагнемо до найвищих стандартів якості. Незалежно від місця, де ви знаходитесь, ви долучитесь до відданої, розмаїтої спільноти, яка допоможе вам реалізувати свій потенціал якомога повніше
Company website:
http://epam.com
DOU company page:
https://jobs.dou.ua/companies/epam-systems/
The job ad is no longer active
Look at the current
jobs
Scala
Kharkiv→