Middle ML Engineer (Computer Vision / NLP / LLM) - RaccoonDoc
Про продукт
RaccoonDoc - це український AI-продукт для автоматизації обробки та розпізнавання документів.
Ми працюємо не з ідеальними PDF і не з навчальними датасетами, а з реальними документами бізнесу - актами, накладними, рахунками, договорами, сканами, фото, таблицями, нестандартними шаблонами, поганою якістю зображень і всім тим “документним хаосом”, який щодня проходить через бухгалтерію, фінанси, логістику та операційні підрозділи компаній.
Наші клієнти - компанії, де документи вимірюються не десятками, а тисячами й десятками тисяч на місяць.
Ми шукаємо Middle ML Engineer у продуктову команду RaccoonDoc - інженера, який уже має практичний досвід з ML/NLP/CV/LLM-задачами, вміє самостійно рухати задачі від ідеї до робочого рішення і не потребує постійного менторства.
Нам потрібна людина, яка не просто тренувала модель, а розуміє, що відбувається після цього - якість, швидкість, продакшн, інтеграція, стабільність, моніторинг, компроміси між точністю, вартістю та latency.
Що ти будеш робити
Працювати над ML/AI-ядром RaccoonDoc для розпізнавання, класифікації, розділення, аналізу та валідації документів.
Основні задачі:
- розробляти та покращувати ML-моделі для обробки документів;
- працювати з задачами Computer Vision, OCR, NLP, NER, LLM/VLM;
- будувати пайплайни обробки документів - від вхідного файлу до структурованих даних;
- покращувати якість витягування полів із документів;
- працювати з класифікацією документів, визначенням типів документів, розділенням багатосторінкових файлів;
- аналізувати помилки моделей і пропонувати конкретні способи покращення;
- експериментувати з open-source моделями, OCR, LLM/VLM та оцінювати їхню придатність для продакшн-використання;
- оптимізувати моделі та пайплайни за швидкістю, вартістю та якістю;
- розгортати ML-рішення в хмарній інфраструктурі;
інтегрувати ML-компоненти з backend-частиною продукту.
Важливо, ми очікуємо, що ти зможеш взяти задачу, самостійно розібратись у контексті, запропонувати підхід, зробити експеримент, оцінити результат і довести рішення до робочого стану.
Технології, з якими ми працюємо
ML / AI
- Python;
- PyTorch / TensorFlow;
- HuggingFace Transformers;
- OCR / Document AI;
- Object Detection, зокрема YOLO-подібні підходи;
- NLP / NER;
- LLM / VLM;
- spaCy;
- scikit-learn;
- open-source моделі для роботи з текстом, зображеннями та документами.
Backend / API
- FastAPI;
- Flask;
- REST API;
- Docker;
інтеграція ML-сервісів із backend-системами.
Хмара та інфраструктура
Ми працюємо з Azure, тому досвід із цією екосистемою буде дуже корисним:
- Azure ML;
- Azure Functions;
- Azure Web Apps;
- Azure DevOps;
- Azure Service Bus;
- Azure Blob Storage;
- Application Insights;
- container-based deployment.
Також буде плюсом досвід з AWS.
Не потрібно знати все з цього списку. Але важливо мати реальний досвід із продакшн-підходом до ML, а не тільки навчальні експерименти.
Що ми очікуємо від Middle-рівня
Для цієї ролі нам важливо, щоб ти міг:
- самостійно розібратись у новій задачі;
- сформулювати гіпотези та запропонувати кілька варіантів рішення;
- оцінити trade-off між якістю, швидкістю, складністю та вартістю;
- не чекати детального технічного завдання на кожен крок;
- вести задачу від аналізу проблеми до робочого результату;
- чесно показувати, що працює, а що ні;
- пропонувати покращення продукту на основі технічних спостережень;
- працювати в команді з розробниками, аналітиками та менеджером по продукту.
Що ми пропонуємо
Продукт, а не одноразовий проєкт.
Ти працюватимеш над ядром RaccoonDoc, яке постійно розвивається і використовується реальними клієнтами.
Реальні дані та реальні задачі.
Тут не буде стерильних датасетів. Будуть документи, які щодня створюють проблеми бізнесу, і саме їх треба навчити систему обробляти краще, швидше й стабільніше.
Вплив на продукт.
ML у RaccoonDoc - це не декоративний модуль збоку. Це основа продукту. Твої рішення напряму впливатимуть на якість, швидкість і конкурентність платформи.
Сильний практичний контекст.
Ми працюємо з клієнтами, які мають реальні обсяги документів, реальні інтеграції, реальні вимоги до якості й відповідальності.
Гнучкий формат роботи.
Віддалено з будь-якого міста України. Ми розуміємо реалії війни, тривог, блекаутів і нестабільної інфраструктури.
Процес найму
- Короткий кол (до 30 хв) - знайомство, контекст продукту, твої очікування.
- Технічний етап (60–90 хв) - обговорення твоїх продакшн-кейсів, архітектурних рішень, експериментів.
- Співбесіда з фаундером (30–45 хв) - про бачення продукту, роль ML у RaccoonDoc, розвиток.
- Оффер.
Кому ця роль точно підійде
Тому, хто хоче працювати не над ще одним pet-проєктом з AI, а над продуктом, де ML щодня вирішує конкретні бізнесові задачі.
Тому, кому цікаво будувати системи для реальних документів, реальних клієнтів і реального продакшену.
Тому, хто хоче не просто запускати моделі, а впливати на те, як AI-продукт для обробки документів буде виглядати через рік.
Якщо тобі цікаво працювати з документами, OCR, LLM/VLM, Computer Vision, NLP і продакшн-ML у реальному українському AI-продукті, будемо раді познайомитись.
Required skills experience
| Python | 2 years |
| PyTorch | 2 years |
| Transformers | 2 years |
| Object Detection | 2 years |
| NLP | 2 years |
| LLM | 2 years |
| Azure AI | 2 years |
| Azure Functions | 2 years |
| FastAPI | 2 years |
| Docker | 2 years |
Required languages
| English | B1 - Intermediate |
| Ukrainian | C2 - Proficient |