ML / NLP / IR Engineer
Тренувати, доводити до продакшну та інтегрувати моделі для
аналізу аудіо та текстової інформації в шумних, реальних
умовах.
ПРО ПРОЄКТ:
Ми будуємо ML-платформу для аналізу аудіо та текстової інформації — з
високою зашумленістю, складними акустичними умовами та великою
різноманітністю лексики. Це повний life-cycle: збір та підготовка даних,
тренування моделей (ASR, VAD, класифікація тексту, NER, ембеддинги),
експорт у продакшн (ONNX / TensorRT / Triton) та інтеграція у потокові
пайплайни (Apache Flink, RabbitMQ, Kafka). Кінцеві споживачі — аналітики,
які працюють з великими обсягами інформації; тому якість моделей та
якість їх інженерної реалізації одинаково критичні.
ЧИМ ВИ БУДЕТЕ ЗАЙМАТИСЯ
Тренувати та доводити до продакшну моделі у трьох суміжних доменах:
- ASR Speech-to-text — fine-tuning сучасних архітектур (CTC, RNN-T, TDT, attention-based) на шумних аудіо. PyTorch Lightning, NeMo, Hydra-конфіги, multi-GPU.
- VAD Voice activity detection — fine-tuning рекурентних та CNN-based моделей на спектрограмах, threshold optimization, ROC-аналіз.
- NLP / IR Текст та пошук — multi-label класифікація на трансформерах та класичних методах, NER, дедуплікація тексту (MinHash LSH) та аудіо (contrastive embeddings, SimCLR), векторний та повнотекстовий пошук.
— Експортувати моделі в ONNX, готувати TensorRT-плани (FP16, optimization profiles, dynamic shapes), інтегрувати в NVIDIA Triton (ensemble, BLS, dynamic batching, instance groups).
— Будувати продакшн-сервіси: FastAPI-фронти, асинхронні воркери на RabbitMQ / Kafka / S3 / Redis, інтеграція в Flink-пайплайни.
— Проводити ретельні бенчмарки: WER, F1 per-class, ROC-AUC, RTFx, throughput, A/B-тести з людьми розмітниками (Prodigy).
— Читати papers, відтворювати state-of-the-art підходи та адаптувати їх під наші дані.
— Версіонувати дані та моделі (DVC + MinIO/S3), трекати експерименти (Weights & Biases), писати тести (pytest), проходити code review.
ОБОВʼЯЗКОВІ ВИМОГИ
- 5+ років комерційного досвіду в ML / NLP / Information Retrieval. CV-досвід не потрібен.
- Python як основна мова — впевнене володіння сучасним Python (3.11+), типізація, async/await, написання чистого підтримуваного коду.
- PyTorch на рівні автора кастомних training loops — не лише Trainer.fit(), а й написання своїх loop-ів, distributed training (DDP, gradient accumulation, mixed precision), розуміння як працюють loss-функції під капотом (CTC, RNN-T, contrastive losses).
- Принаймні один глибокий досвід в одному з напрямків: ASR / sequence-to-sequence, класичний NLP на трансформерах та класичних методах, або Information Retrieval (BM25, dense retrieval, MinHash / LSH, ранжування).
- Здатність читати та відтворювати papers — брати модель або підхід з arXiv, розуміти trade-offs, адаптувати під свої дані, а не лише запускати готові скрипти.
- Інженерія продакшну — досвід доведення моделі від ноутбука до сервісу: експорт (ONNX / TorchScript), оптимізація інференсу, побудова REST / gRPC API, написання тестів (unit + integration).
- HuggingFace екосистема — впевнена робота з transformers, datasets, tokenizers, accelerate, evaluate, hub; досвід fine-tuning, custom training loops, кастомних токенайзерів (BPE, SentencePiece, WordPiece).
- Класичний ML — sklearn, XGBoost, threshold tuning для imbalanced multi-label задач, метрики Precision / Recall / F1 (macro/micro/per-class), ROC-AUC.
- Git, pre-commit, лінтери, CI — сприймати ці речі як норму, а не як перешкоду. Англійська — читання технічної документації та papers без труднощів.
БУДЕ ПЛЮСОМ
- NVIDIA Triton Inference Server — ensemble, BLS, Python backend, config.pbtxt.
- TensorRT — компіляція engine, optimization profiles, INT8/FP16 квантизація.
- ONNX Runtime — оптимізація графів, провайдери (CUDA / TensorRT / CPU).
- Data engineering — Apache Flink, Kafka, потокова обробка, DVC, data pipelines.
- Інфраструктура — Docker, Kubernetes, Helm, ArgoCD, GitLab CI, AWS (S3, CodeArtifact).
СТЕК, З ЯКИМ ВИ БУДЕТЕ ПРАЦЮВАТИ:
CORE Python 3.11+, uv, PyTorch, PyTorch Lightning, HuggingFace (transformers, datasets, tokenizers, accelerate), spaCy, sentence-transformers, sklearn, XGBoost.
ІНФЕРЕНС ONNX Runtime, TensorRT, NVIDIA Triton; FastAPI, Uvicorn, asyncio, Pydantic v2.
ДАНІ RabbitMQ, Kafka, Apache Flink; S3 / MinIO, Elasticsearch, PostgreSQL, Redis Stack.
MLOPS DVC, Weights & Biases, GitLab CI/CD, Kubernetes, ArgoCD; jiwer (WER), torchmetrics, scikit multilearn, Prodigy.
ЯК МИ ПРАЦЮЄМО:
- Маленька команда, низька бюрократія; рішення приймає інженер, який володіє контекстом.
- Кожна зміна моделі або інфраструктури має чіткі бенчмарки до/після — ми не «відчуваємо що краще», ми міряємо.
- Production-mindset з самого початку: будь-яка модель з ноутбука повинна мати план виходу на сервер.
- Документація, діаграми архітектур, чесні post-mortem-и, культура writing-it-down.
Required languages
| Ukrainian | Native |