🪖 DefTech

Тренувати, доводити до продакшну та інтегрувати моделі для
аналізу аудіо та текстової інформації в шумних, реальних
умовах.

ПРО ПРОЄКТ:
Ми будуємо ML-платформу для аналізу аудіо та текстової інформації — з
високою зашумленістю, складними акустичними умовами та великою
різноманітністю лексики. Це повний life-cycle: збір та підготовка даних,
тренування моделей (ASR, VAD, класифікація тексту, NER, ембеддинги),
експорт у продакшн (ONNX / TensorRT / Triton) та інтеграція у потокові
пайплайни (Apache Flink, RabbitMQ, Kafka). Кінцеві споживачі — аналітики,
які працюють з великими обсягами інформації; тому якість моделей та
якість їх інженерної реалізації одинаково критичні.


ЧИМ ВИ БУДЕТЕ ЗАЙМАТИСЯ
Тренувати та доводити до продакшну моделі у трьох суміжних доменах:

  • ASR Speech-to-text — fine-tuning сучасних архітектур (CTC, RNN-T, TDT, attention-based) на шумних аудіо. PyTorch Lightning, NeMo, Hydra-конфіги, multi-GPU.
  • VAD Voice activity detection — fine-tuning рекурентних та CNN-based моделей на спектрограмах, threshold optimization, ROC-аналіз.
  • NLP / IR Текст та пошук — multi-label класифікація на трансформерах та класичних методах, NER, дедуплікація тексту (MinHash LSH) та аудіо (contrastive embeddings, SimCLR), векторний та повнотекстовий пошук.


— Експортувати моделі в ONNX, готувати TensorRT-плани (FP16, optimization profiles, dynamic shapes), інтегрувати в NVIDIA Triton (ensemble, BLS, dynamic batching, instance groups).
— Будувати продакшн-сервіси: FastAPI-фронти, асинхронні воркери на RabbitMQ / Kafka / S3 / Redis, інтеграція в Flink-пайплайни.
— Проводити ретельні бенчмарки: WER, F1 per-class, ROC-AUC, RTFx, throughput, A/B-тести з людьми розмітниками (Prodigy).

— Читати papers, відтворювати state-of-the-art підходи та адаптувати їх під наші дані.

— Версіонувати дані та моделі (DVC + MinIO/S3), трекати експерименти (Weights & Biases), писати тести (pytest), проходити code review.


ОБОВʼЯЗКОВІ ВИМОГИ

  • 5+ років комерційного досвіду в ML / NLP / Information Retrieval. CV-досвід не потрібен.
  • Python як основна мова — впевнене володіння сучасним Python (3.11+), типізація, async/await, написання чистого підтримуваного коду.
  • PyTorch на рівні автора кастомних training loops — не лише Trainer.fit(), а й написання своїх loop-ів, distributed training (DDP, gradient accumulation, mixed precision), розуміння як працюють loss-функції під капотом (CTC, RNN-T, contrastive losses).
  • Принаймні один глибокий досвід в одному з напрямків: ASR / sequence-to-sequence, класичний NLP на трансформерах та класичних методах, або Information Retrieval (BM25, dense retrieval, MinHash / LSH, ранжування).
  • Здатність читати та відтворювати papers — брати модель або підхід з arXiv, розуміти trade-offs, адаптувати під свої дані, а не лише запускати готові скрипти.
  • Інженерія продакшну — досвід доведення моделі від ноутбука до сервісу: експорт (ONNX / TorchScript), оптимізація інференсу, побудова REST / gRPC API, написання тестів (unit + integration).
  • HuggingFace екосистема — впевнена робота з transformers, datasets, tokenizers, accelerate, evaluate, hub; досвід fine-tuning, custom training loops, кастомних токенайзерів (BPE, SentencePiece, WordPiece).
  • Класичний ML — sklearn, XGBoost, threshold tuning для imbalanced multi-label задач, метрики Precision / Recall / F1 (macro/micro/per-class), ROC-AUC.
  • Git, pre-commit, лінтери, CI — сприймати ці речі як норму, а не як перешкоду. Англійська — читання технічної документації та papers без труднощів.

БУДЕ ПЛЮСОМ

  • NVIDIA Triton Inference Server — ensemble, BLS, Python backend, config.pbtxt.
  • TensorRT — компіляція engine, optimization profiles, INT8/FP16 квантизація.
  • ONNX Runtime — оптимізація графів, провайдери (CUDA / TensorRT / CPU).
  • Data engineering — Apache Flink, Kafka, потокова обробка, DVC, data pipelines.
  • Інфраструктура — Docker, Kubernetes, Helm, ArgoCD, GitLab CI, AWS (S3, CodeArtifact).


СТЕК, З ЯКИМ ВИ БУДЕТЕ ПРАЦЮВАТИ:
CORE Python 3.11+, uv, PyTorch, PyTorch Lightning, HuggingFace (transformers, datasets, tokenizers, accelerate), spaCy, sentence-transformers, sklearn, XGBoost.

ІНФЕРЕНС ONNX Runtime, TensorRT, NVIDIA Triton; FastAPI, Uvicorn, asyncio, Pydantic v2.

ДАНІ RabbitMQ, Kafka, Apache Flink; S3 / MinIO, Elasticsearch, PostgreSQL, Redis Stack.

MLOPS DVC, Weights & Biases, GitLab CI/CD, Kubernetes, ArgoCD; jiwer (WER), torchmetrics, scikit multilearn, Prodigy.


ЯК МИ ПРАЦЮЄМО:

  • Маленька команда, низька бюрократія; рішення приймає інженер, який володіє контекстом.
  • Кожна зміна моделі або інфраструктури має чіткі бенчмарки до/після — ми не «відчуваємо що краще», ми міряємо.
  • Production-mindset з самого початку: будь-яка модель з ноутбука повинна мати план виходу на сервер.
  • Документація, діаграми архітектур, чесні post-mortem-и, культура writing-it-down.

Required languages

Ukrainian Native
Published 4 June
19 views
·
0 applications
To apply for this and other jobs on Djinni login or signup.
Loading...