ML Engineer (Computer Vision / NLP / LLM) - RaccoonDoc
Про продукт
RaccoonDoc - це не просто «ще один OCR». Це український AI-продукт для автоматизації обробки документів (IDP), який перетворює хаос з актів, накладних, договорів, рахунків і сканів у структуровані дані, з якими можна працювати.
Наші клієнти - компанії, в яких документи не вимірюються "папками", а йдуть тисячами й десятками тисяч на місяць.
Ми шукаємо Machine Learning Engineer в продуктову команду RaccoonDoc, який хоче працювати з реальними даними та продакшн-моделями, а не тільки з датасетами з Kaggle.
Що ти будеш робити
- Розробляти, тренувати та вдосконалювати ML-моделі для документів:
- Підготовка та збір даних для тренування.
- NER (BERT, LLAMA, GPT-based, Molmo, etc)
- Деплой на хмарні сервіси по типу AWS, Azure etc:
- Написання тестів, підтримка документації
- Розробка АПІ (FastAPI, Flask etc)
- Інтеграція моделей з бекенд частиною
- Співпрацювати з розробниками, аналітиками та фаундером продукту - впливати на те, як виглядатиме RaccoonDoc через рік.
Технологічний стек
ML / AI:
- Python (основа всього),
- PyTorch / TensorFlow,
- Object Detection (like YOLO)
- Scikit-learn,
- spaCy,
- Transformers (HuggingFace),
- LLM (OpenAI /LLAM/ GPT/ Molmo).
Сервіси / Web:
- Flask, FastAPI,
- Docker.
Хмара (Azure / AWS):
- Azure Endpoint, Azure Web Apps, Azure ML, Azure Functions, Azure DevOps, Service Bus, Application Insights, DB/Blob Storage
- AWS SageMaker, AWS Lambda, AWS ECR, AWS Endpoints.
Не обовʼязково знати все з цього списку, але чим більше реального досвіду - тим краще.
Буде плюсом
- Досвід з Azure (Azure ML, Azure DevOps, Azure Functions) або AWS (SageMaker, Lambda).
- Досвід роботи з табличками / великими масивами текстових / документних даних.
- Розуміння домену:
- фінанси, бухгалтерія, документообіг, операційні процеси.
- Досвід оптимізації моделей під продакшн (квантизація, prunning, latency/performance-трейд-оф).
Що ми пропонуємо
- Продукт, а не проєкт. Ти працюєш із ядром RaccoonDoc, а не з одноразовим кастомним рішенням.
- Реальні дані й реальний імпакт. Моделі будуть розгрібати живий "бардак" з документів українського бізнесу, а не ідеальні датасети.
- Динаміка стартапу + здоровий підхід. Швидкі рішення, мінімум бюрократії, але з нормальною інженерною культурою.
- Гнучкий формат. Віддалено з будь-якого міста України; ми розуміємо реалії війни, тривог і блекаутів.
- Ріст. Можливість рости в продукті, який будується навколо ML, а не "додає його зверху".
Процес найму
- Короткий кол (до 30 хв) - знайомство, контекст продукту, твої очікування.
- Технічний етап (60–90 хв) - обговорення твоїх продакшн-кейсів, архітектурних рішень, експериментів.
- Співбесіда з фаундером (30–45 хв) - про бачення продукту, роль ML у RaccoonDoc, розвиток.
- Оффер.
Якщо хочеш, щоб твої моделі не припадали пилом у репозиторії, а щодня економили сотні людино-годин на роботі з документами - відгукнися на цю вакансію.
Required languages
| English | B1 - Intermediate |
| Ukrainian | C2 - Proficient |