Data Engineer (Video)

Ukrainian Product 🇺🇦

Ajax Systems — міжнародна технологічна компанія, найбільший в Європі розробник і виробник систем безпеки із можливостями розумного дому.
Це ціла екосистема зі 180 пристроїв, мобільних і десктопних застосунків, серверної інфраструктури.

Data Engineer приєднається до Data-команди, що займається підготовкою та обробкою даних для машинного навчання та відео аналітики. У цій ролі спеціаліст відповідатиме за розробку і підтримку масштабованих конвеєрів даних, особливо в частині, що стосується задач комп’ютерного зору.

Основні обов’язки:

- Проєктування та реалізація end-to-end пайплайнів для збору, збереження, обробки та передачі даних (зображень, анотацій тощо) для тренування та валідації моделей глибокого навчання.

- Підготовка та вдосконалення великих датасетів для Computer Vision:

очистка даних, аугментація зображень, балансування вибірок, приведення анотацій до потрібного формату.

- Налаштування та керування інструментами оркестрації пайплайнів (Dagster, Apache Airflow або аналогічні) для автоматизації ETL/ELT процесів.

- Інтеграція з хмарною інфраструктурою (AWS) для зберігання даних (наприклад, Amazon S3) та виконання обчислень; забезпечення ефективної доставки даних у середовище навчання моделей.

- Використання фреймворків глибокого навчання (наприклад, PyTorch або TensorFlow) для підготовки та первинного аналізу даних; можливе створення допоміжних скриптів для запуску тестових навчань або обчислення ембеддінгів.

- Співпраця з командами машинного навчання та розробниками CV-моделей: забезпечення, щоб дані відповідали вимогам моделей, участь у процесі відлагодження моделей через покращення даних.

- Впровадження кращих практик щодо якості даних та версіонування датасетів; моніторинг якості даних на кожному етапі пайплайну.

- Співпраця з командою розмітки для забезпечення доставки якісних даних.

Необхідні скіли:

- Досвід (2+ роки) в галузі Data Engineering або суміжній сфері. Впевнене володіння мовою Python та основними бібліотеками для обробки даних (Pandas, NumPy тощо) та зображень (OpenCV, PIL).

- Практичний досвід побудови ETL/ELT конвеєрів обробки даних; вміння працювати з системами оркестрації (Dagster, Apache Airflow або подібні) для автоматизації дата-процесів.

- Комп’ютерний зір (CV):

практичний досвід роботи з наборами даних (COCO, YOLO), форматами анотацій і їх конвертацією.

розуміння роботи інструменту для розмітки даних.

вміння розгорнути готову модель CV (детекція, сегментація, класифікація) з відкритих репозиторіїв чи pre-trained чекпоїнтів, адаптувати під власні дані й інтегрувати в пайплайн;

досвід роботи з PyTorch або TensorFlow для fine-tuning, інференсу та підготовки даних;

розуміння transfer learning і адаптації архітектур під конкретні задачі.

- Трансформери та VLLM, Vision Transformers (ViT):

практичний досвід використання сучасних архітектур (ViT, DETR, Segment Anything тощо);

робота з VLLM (large vision & language models);

застосування для автоматизації обробки даних (генерація додаткової розмітки, валідація анотацій, класифікація чи попередній відбір даних).

- Навички оптимізації та відлагодження pipeline: моніторинг, логування, усунення неполадок у процесі обробки даних.

- Інструментарій: впевнена робота з системою контролю версій (Git), Docker/Kubernetes, а також базове розуміння MLOps практик MLflow/DVC.

Буде плюсом:

- Розуміння хмарних технологій, зокрема сервісів AWS для роботи з даними (S3, RDS/Redshift, Lambda, IAM тощо);

досвід побудови та підтримки дата-процесів у хмарному середовищі.

- Знання SQL та досвід роботи з PostgreSQL;

оптимізація запитів, робота з великими масивами даних;

базові знання NoSQL або Data Warehouse систем — плюс.

Пропонуємо:

- можливість пропонувати та реалізовувати власні ідеї, які мають вплив на продукт і виробництво;

- роботу у вмотивованій команді та zero bullshit culture;

- гнучкий графік роботи в офісі (Київ);

- конкурентну заробітну плату;

- медичне страхування;

- корпоративну англійську мову;

Ajax — свобода бути інженером!

Required languages

English

B1 - Intermediate

Python, LLM, Data Science/Machine Learning, Computer Vision, Pandas, SQL, Deep Learning

Published 16 October

54 views

0 applications

To apply for this and other jobs on Djinni login or signup.

Only from 2 years of experience
Office Work
Ukraine
Countries where we consider candidates
English B1 - Intermediate

ML / AI

Employment: Fulltime
Domain: Hardware / IoT
Product
Office: Ukraine (Kyiv)
Test task is needed

Apply for the job

📊 Average salary range of similar jobs in analytics →