ML/AI Engineer (OCR, VL Models)
Наша компанія розробляє власну інтерактивну базу знань. Користувачі можуть завантажувати будь-який обсяг різноманітних даних, після чого система автоматично перетворює їх на структурований, придатний для пошуку контент. Для цього застосовується комплексний ML-пайплайн із залученням OCR, VL моделей, документних парсерів та різних типів сховищ даних. Пошук реалізовано через чат на базі LLM, який дозволяє формувати запити звичайною мовою, отримувати релевантні документи, а також узагальнені висновки та рекомендації на основі завантажених матеріалів.
Зараз ми шукаємо ML/AI інженера з глибоким досвідом роботи з неструктурованим контентом (насамперед фотографіями та скан-копіями документів), який підсилить нашу команду та очолить напрям розробки пайплайнів і рішень для обробки таких даних.
Ми очікуємо, що кандидат:
• Має широкий досвід роботи з неструктурованими даними та застосовував як класичні OCR-системи (Tesseract, PaddleOCR, EasyOCR), так і сучасні моделі (PaddleOCR-VL, DeepSeek-OCR, dots.ocr, Qwen3-VL). Розуміє сильні та слабкі сторони різних архітектур і сценарії їх застосування.
• Має практичний досвід навчання та fine-tuning OCR і Vision-Language моделей.
• Розуміє алгоритмічні методи покращення зображень, їх попередню фільтрацію та обробку для підвищення якості подальшого розпізнавання.
• Працював з Docling (включно з тонким налаштуванням бекендів для парсингу складних PDF і таблиць), markitdown, Apache Tika, PyMuPDF та іншими інструментами для конвертації й структуризації документів. Орієнтується у процесингу багатошарових і нетривіальних PDF-файлів.
• Має досвід роботи з self-hosted моделями, зокрема запуску та оптимізації моделей у середовищах vLLM на GPU рівня H100 і вище, розуміє принципи GPU-архітектури та KV cache.
• Має сильні навички програмування на Python: архітектурні патерни, багатопоточність, асинхронність, сучасні практики тестування, досвід експлуатації сервісів під високим навантаженням (моніторинг, телеметрія, утилізація пам'яті).
• Має досвід роботи з документоорієнтованими, реляційними та векторними базами даних, розуміє типи індексів і відповідні юзкейси для кожного типу сховищ.
Буде плюсом:
• Досвід роботи з Speech-to-text або Video-to-text пайплайнами.
• Досвід аналізу контенту: класифікація, сумаризація, NER.
• Досвід у data engineering: розуміння ETL/ELT-процесів, робота з оркестраторами (Airflow, Temporal, Prefect) та системами розподіленого обчислення (Ray.io, Spark).
• Досвід у DevOps: CI/CD, Kubernetes, Helm, ArgoCD.
• Досвід роботи з Elasticsearch, MongoDB, PostgreSQL, Qdrant/Milvus, Neo4j та іншими сховищами.
• Розуміння сучасних підходів до кібербезпеки.
• Практичний досвід із системами на основі RAG у продакшені.
Пропонуємо повністю віддалений формат роботи над власним продуктом, який використовує найсучасніші технології та орієнтований на державний сектор. Компанія має статус критично важливої для Збройних сил України. За потреби надаємо бронювання та необхідну офісну техніку.
Required languages
| English | B2 - Upper Intermediate |