DESCRIPTION
Our customer is one of the biggest multi-brand online retailers in the UK. It's our long-playing customer and now they aim to enhance the use of its existing data by improving its storage capabilities and accessibility. The goal of the project is to build a system from the scratch based on Data Lake architecture with Query Layer which provides the ability for multiple data consumer systems to query data from the lake. An additional challenge in Query Layer design is to make it auto-scalable to handle peaks in demand with high uptime percentage as for HA characteristic.
PROJECT TECHNOLOGIES AND TOOLS
- AWS Services - EMR, S3, Lambda, EC2, RDS, CloudFormation, etc
- Hortonworks Data Platform (HDP)
- Spark, Spark Streaming
- Yarn
- Apache Knox
- Kafka
- Scala
REQUIREMENTS
- 2+ years of experience with Big Data stack: Spark, Hive, HDFS
- Basic Scala knowledge
- Experience with AWS Cloud services
- Knowledge of Linux will be a plus
- Knowledge of scripting will be a plus
- Good spoken and written English
About EPAM Systems
ЕРАМ прагне надавати своїй глобальній команді з понад 60,000+ професіоналів у більш ніж 45 країнах можливості для професійного зростання з першого дня співпраці. Наші колеги – джерело успіху ЕРАМ, тож ми цінуємо співпрацю, намагаємось завжди розуміти бізнес наших клієнтів та прагнемо до найвищих стандартів якості. Незалежно від місця, де ви знаходитесь, ви долучитесь до відданої, розмаїтої спільноти, яка допоможе вам реалізувати свій потенціал якомога повніше
Company website:
http://epam.com
DOU company page:
https://jobs.dou.ua/companies/epam-systems/
The job ad is no longer active
Look at the current
jobs
Scala
Kharkiv→