ML Engineer (Backend + LLM Fine-tuning)
$
Product
- Розробка та підтримка Python-сервісів на базі FastAPI (REST + WebSocket)
- Робота з пайплайном RAG: chunking, embedding, векторний пошук у Qdrant
- Інтеграція та підтримка моделей Whisper (faster-whisper) для STT та Orpheus/vLLM для TTS
- Робота з чергами завдань: Celery + Redis
- Взаємодія з базою даних PostgreSQL (psycopg3, управління станом сесій і workflows)
- Написання та підтримка pytest-тестів (unit + integration)
- Участь у code review, документуванні архітектурних рішень
- Дебагінг та оптимізація асинхронних WebSocket-потоків між мікросервісами
Вимоги: - Python 3.10+, впевнене знання async/await
- FastAPI або аналогічний ASGI-фреймворк (Starlette)
- PostgreSQL — вміння писати запити, розуміти схему, psycopg2/3
- Redis — базове розуміння як брокера/кешу
- Celery — розуміння черг, routing, retry-логіки
- Досвід роботи з REST API та WebSocket
- Git, вміння читати та писати осмислені PR
- Вміння читати та розуміти чужий код, архітектурну документацію
- Досвід роботи з векторними БД (Qdrant, Pinecone, Weaviate)
- Розуміння RAG-архітектур, embedding-пайплайнів
- Знайомство з HuggingFace екосистемою (transformers, sentence-transformers, peft)
- Досвід роботи з vLLM, faster-whisper або аналогічними inference-фреймворками
Буде перевагою: - Базове розуміння fine-tuning (LoRA/PEFT)
- Знайомство з Docker, базовий DevOps для локального запуску стеку
Required languages
Published 11 May
44 views
·
8 applications
See stats of candidates who applied for this job 👀
📊
$800-1500
Average salary range of similar jobs in
analytics →
Loading...