ML / NLP / IR Engineer

Окремий спеціальний центр електронної підтримки

to $1200

🪖 DefTech

Тренувати, доводити до продакшну та інтегрувати моделі для
аналізу аудіо та текстової інформації в шумних, реальних
умовах.

ПРО ПРОЄКТ:
Ми будуємо ML-платформу для аналізу аудіо та текстової інформації — з
високою зашумленістю, складними акустичними умовами та великою
різноманітністю лексики. Це повний life-cycle: збір та підготовка даних,
тренування моделей (ASR, VAD, класифікація тексту, NER, ембеддинги),
експорт у продакшн (ONNX / TensorRT / Triton) та інтеграція у потокові
пайплайни (Apache Flink, RabbitMQ, Kafka). Кінцеві споживачі — аналітики,
які працюють з великими обсягами інформації; тому якість моделей та
якість їх інженерної реалізації одинаково критичні.

ЧИМ ВИ БУДЕТЕ ЗАЙМАТИСЯ
Тренувати та доводити до продакшну моделі у трьох суміжних доменах:

ASR Speech-to-text — fine-tuning сучасних архітектур (CTC, RNN-T, TDT, attention-based) на шумних аудіо. PyTorch Lightning, NeMo, Hydra-конфіги, multi-GPU.
VAD Voice activity detection — fine-tuning рекурентних та CNN-based моделей на спектрограмах, threshold optimization, ROC-аналіз.
NLP / IR Текст та пошук — multi-label класифікація на трансформерах та класичних методах, NER, дедуплікація тексту (MinHash LSH) та аудіо (contrastive embeddings, SimCLR), векторний та повнотекстовий пошук.

— Експортувати моделі в ONNX, готувати TensorRT-плани (FP16, optimization profiles, dynamic shapes), інтегрувати в NVIDIA Triton (ensemble, BLS, dynamic batching, instance groups).
— Будувати продакшн-сервіси: FastAPI-фронти, асинхронні воркери на RabbitMQ / Kafka / S3 / Redis, інтеграція в Flink-пайплайни.
— Проводити ретельні бенчмарки: WER, F1 per-class, ROC-AUC, RTFx, throughput, A/B-тести з людьми розмітниками (Prodigy).

— Читати papers, відтворювати state-of-the-art підходи та адаптувати їх під наші дані.

— Версіонувати дані та моделі (DVC + MinIO/S3), трекати експерименти (Weights & Biases), писати тести (pytest), проходити code review.

ОБОВʼЯЗКОВІ ВИМОГИ

5+ років комерційного досвіду в ML / NLP / Information Retrieval. CV-досвід не потрібен.
Python як основна мова — впевнене володіння сучасним Python (3.11+), типізація, async/await, написання чистого підтримуваного коду.
PyTorch на рівні автора кастомних training loops — не лише Trainer.fit(), а й написання своїх loop-ів, distributed training (DDP, gradient accumulation, mixed precision), розуміння як працюють loss-функції під капотом (CTC, RNN-T, contrastive losses).
Принаймні один глибокий досвід в одному з напрямків: ASR / sequence-to-sequence, класичний NLP на трансформерах та класичних методах, або Information Retrieval (BM25, dense retrieval, MinHash / LSH, ранжування).
Здатність читати та відтворювати papers — брати модель або підхід з arXiv, розуміти trade-offs, адаптувати під свої дані, а не лише запускати готові скрипти.
Інженерія продакшну — досвід доведення моделі від ноутбука до сервісу: експорт (ONNX / TorchScript), оптимізація інференсу, побудова REST / gRPC API, написання тестів (unit + integration).
HuggingFace екосистема — впевнена робота з transformers, datasets, tokenizers, accelerate, evaluate, hub; досвід fine-tuning, custom training loops, кастомних токенайзерів (BPE, SentencePiece, WordPiece).
Класичний ML — sklearn, XGBoost, threshold tuning для imbalanced multi-label задач, метрики Precision / Recall / F1 (macro/micro/per-class), ROC-AUC.
Git, pre-commit, лінтери, CI — сприймати ці речі як норму, а не як перешкоду. Англійська — читання технічної документації та papers без труднощів.

БУДЕ ПЛЮСОМ

NVIDIA Triton Inference Server — ensemble, BLS, Python backend, config.pbtxt.
TensorRT — компіляція engine, optimization profiles, INT8/FP16 квантизація.
ONNX Runtime — оптимізація графів, провайдери (CUDA / TensorRT / CPU).
Data engineering — Apache Flink, Kafka, потокова обробка, DVC, data pipelines.
Інфраструктура — Docker, Kubernetes, Helm, ArgoCD, GitLab CI, AWS (S3, CodeArtifact).

СТЕК, З ЯКИМ ВИ БУДЕТЕ ПРАЦЮВАТИ:
CORE Python 3.11+, uv, PyTorch, PyTorch Lightning, HuggingFace (transformers, datasets, tokenizers, accelerate), spaCy, sentence-transformers, sklearn, XGBoost.

ІНФЕРЕНС ONNX Runtime, TensorRT, NVIDIA Triton; FastAPI, Uvicorn, asyncio, Pydantic v2.

ДАНІ RabbitMQ, Kafka, Apache Flink; S3 / MinIO, Elasticsearch, PostgreSQL, Redis Stack.

MLOPS DVC, Weights & Biases, GitLab CI/CD, Kubernetes, ArgoCD; jiwer (WER), torchmetrics, scikit multilearn, Prodigy.

ЯК МИ ПРАЦЮЄМО:

Маленька команда, низька бюрократія; рішення приймає інженер, який володіє контекстом.
Кожна зміна моделі або інфраструктури має чіткі бенчмарки до/після — ми не «відчуваємо що краще», ми міряємо.
Production-mindset з самого початку: будь-яка модель з ноутбука повинна мати план виходу на сервер.
Документація, діаграми архітектур, чесні post-mortem-и, культура writing-it-down.

Required languages

Ukrainian Native

Published 4 June

83 views

3 applications

Response activity: Low

Last responded 2 weeks ago

To apply for this and other jobs on Djinni login or signup.

Only from 1 year of experience
$500-1200
Office Work
Ukraine
Countries where we consider candidates
- Ukrainian Native

ML / AI

Employment: Fulltime
Domain: Other
Government / Public sector
Office: Ukraine (Kyiv)

Apply for the job

Response activity: Low

Last responded 2 weeks ago

📊 Average salary range of similar jobs in analytics →