ML Engineer (Backend + LLM Fine-tuning)

$
Product
  • Розробка та підтримка Python-сервісів на базі FastAPI (REST + WebSocket)
  • Робота з пайплайном RAG: chunking, embedding, векторний пошук у Qdrant
  • Інтеграція та підтримка моделей Whisper (faster-whisper) для STT та Orpheus/vLLM для TTS
  • Робота з чергами завдань: Celery + Redis
  • Взаємодія з базою даних PostgreSQL (psycopg3, управління станом сесій і workflows)
  • Написання та підтримка pytest-тестів (unit + integration)
  • Участь у code review, документуванні архітектурних рішень
  • Дебагінг та оптимізація асинхронних WebSocket-потоків між мікросервісами

    Вимоги:
  • Python 3.10+, впевнене знання async/await
  • FastAPI або аналогічний ASGI-фреймворк (Starlette)
  • PostgreSQL — вміння писати запити, розуміти схему, psycopg2/3
  • Redis — базове розуміння як брокера/кешу
  • Celery — розуміння черг, routing, retry-логіки
  • Досвід роботи з REST API та WebSocket
  • Git, вміння читати та писати осмислені PR
  • Вміння читати та розуміти чужий код, архітектурну документацію
  • Досвід роботи з векторними БД (Qdrant, Pinecone, Weaviate)
  • Розуміння RAG-архітектур, embedding-пайплайнів
  • Знайомство з HuggingFace екосистемою (transformers, sentence-transformers, peft)
  • Досвід роботи з vLLM, faster-whisper або аналогічними inference-фреймворками

    Буде перевагою:
  • Базове розуміння fine-tuning (LoRA/PEFT)
  • Знайомство з Docker, базовий DevOps для локального запуску стеку

Required languages

Published 11 May
44 views
·
8 applications
See stats of candidates who applied for this job 👀
To apply for this and other jobs on Djinni login or signup.
Loading...