The goal of the project is to build a system from the scratch based on Data Lake architecture with Query Layer which provides the ability for multiple data consumer systems to query data from the lake. Additional challenge in Query Layer design is to make it auto-scalable to handle peaks in demand with high uptime percentage as for HA characteristic.
PROJECT TECHNOLOGIES AND TOOLS
AWS Services - EMR, S3, Lambda, EC2, RDS, CloudFormation, etc
Hortonworks Data Platform (HDP)
Hive
Spark, Spark Streaming
Yarn
Apache Knox
Kafka
Scala as a programming language
REQUIREMENTS
3+ years of experience with Big Data stack: Spark, Hive, HDFS
Basic Scala knowledge
Experience with AWS Cloud services
Knowledge of Linux will be a plus
Knowledge of scripting will be a plus
Excellent communication skills, team player
Good spoken and written English
WE OFFER
Competitive compensation depending on experience and skills
Individual career path in engineering
Medical insurance
Compensation for sick lists and regular vacations
English classes with certified English teachers
Flexible work hours
About EPAM Systems
ЕРАМ прагне надавати своїй глобальній команді з понад 60,000+ професіоналів у більш ніж 45 країнах можливості для професійного зростання з першого дня співпраці. Наші колеги – джерело успіху ЕРАМ, тож ми цінуємо співпрацю, намагаємось завжди розуміти бізнес наших клієнтів та прагнемо до найвищих стандартів якості. Незалежно від місця, де ви знаходитесь, ви долучитесь до відданої, розмаїтої спільноти, яка допоможе вам реалізувати свій потенціал якомога повніше
Company website:
http://epam.com
DOU company page:
https://jobs.dou.ua/companies/epam-systems/
The job ad is no longer active
Job unpublished on
3 December 2020
Look at the current
jobs
Scala
Kharkiv→