Senior Computer Vision Engineer
Продукт
Платформа відеоаналітики для логістики. RTSP-камери → on-premise GPU inference → rule-based детекція порушень → операторська консоль із кліпами інцидентів.
Зараз демо працює на одному GPU-вузлі. Цільовий орієнтир — 500+ камер у режимі near-realtime на on-premise runtime.
Це довгостроковий продукт, а не контракт “на 6 місяців”. Поточний горизонт планування — 6 місяців із контрольними точками кожні 3 місяці, але розвиток системи, інфраструктури та ML-напрямку розрахований на довгострокову перспективу.
Поточний стек
Те, що вже працює сьогодні. Можливі data-driven зміни, якщо вони підтверджуються вимірюваннями.
Python · Ultralytics YOLOv26 · PyTorch · OpenCV · BoT-SORT · TensorRT FP16 · gRPC · PostgreSQL · Docker Compose · NVIDIA GPU з NVENC / NVDEC · on-premise runtime
Зони відповідальності
- Розширення detection coverage — додавання нових класів порушень у міру розвитку taxonomy інцидентів
- Precision та recall для кожного правила — досягнення узгоджених порогів із контролем у CI для кожного model PR
- Зниження false-positive rate відносно поточного baseline для кожного правила
- Оптимізація cost-efficiency інференсу — економіка “камери на GPU”, яка робить досяжною ціль у 500+ камер
- Робота з heuristic ceiling — коли precision/recall певного класу виходить на плато нижче порогу, потрібно запропонувати та виміряти наступну найкращу альтернативу (temporal model, attribute classifier, multi-stream fusion) із публікацією delta-метрик
- Вибір методів — heuristic vs learned approaches на основі вимірюваної різниці в precision / recall / latency
- Підтримка та розвиток eval harness; regression — merge-blocking
Вимоги
- 3+ роки production computer vision на реальному відео
- Досвід навчання, експорту та продакшен-деплою Ultralytics YOLO
- Досвід продакшен-використання pose estimation (YOLO-pose, RTMPose або аналоги)
- Досвід продакшен-поставки TensorRT FP16 engine на NVIDIA GPU
- Продакшен-досвід щонайменше з одним inference serving stack для multi-stream scale — Triton, DeepStream, Ray Serve або власний batched-gRPC сервіс
- Multi-object tracking у продакшені (BoT-SORT, ByteTrack або аналоги)
- Впевнене володіння PyTorch
- Python 3.12, strict typing, кодова база з 80% test coverage
Буде плюсом
- Продакшен-досвід із action recognition (ST-GCN, MViT, VideoMAE, I3D) — із повною відповідальністю за рішення, а не лише участю — з документованим аналізом того, де й чому підхід перевершував або програвав альтернативам
- Active learning / weak supervision у продакшені (cleanlab, fiftyone)
- Досвід роботи з industrial / surveillance video datasets
- Розробка gRPC-сервісів на Python
Що пропонуємо
- $4,000–6,000 net / місяць
- Remote
- Довгостроковий проєкт із розвитком продукту та ML-напрямку
- Прямий репортинг фаундеру; технічні рішення у вашій зоні відповідальності — за вами
- Уже існуюче демо на GPU-вузлі — не “порожній аркуш”
- Чітка вимірювана ціль із прогрес-чекпоінтами кожні 3 місяці та можливістю впливати на архітектуру й технічний напрям системи
Required languages
| English | B1 - Intermediate |
| Ukrainian | C2 - Proficient |