Middle ML Engineer (Computer Vision / NLP / LLM) - RaccoonDoc

$$$

Product

Про продукт

RaccoonDoc - це український AI-продукт для автоматизації обробки та розпізнавання документів.

Ми працюємо не з ідеальними PDF і не з навчальними датасетами, а з реальними документами бізнесу - актами, накладними, рахунками, договорами, сканами, фото, таблицями, нестандартними шаблонами, поганою якістю зображень і всім тим “документним хаосом”, який щодня проходить через бухгалтерію, фінанси, логістику та операційні підрозділи компаній.

Наші клієнти - компанії, де документи вимірюються не десятками, а тисячами й десятками тисяч на місяць.

Ми шукаємо Middle ML Engineer у продуктову команду RaccoonDoc - інженера, який уже має практичний досвід з ML/NLP/CV/LLM-задачами, вміє самостійно рухати задачі від ідеї до робочого рішення і не потребує постійного менторства.

Нам потрібна людина, яка не просто тренувала модель, а розуміє, що відбувається після цього - якість, швидкість, продакшн, інтеграція, стабільність, моніторинг, компроміси між точністю, вартістю та latency.

Що ти будеш робити

Працювати над ML/AI-ядром RaccoonDoc для розпізнавання, класифікації, розділення, аналізу та валідації документів.

Основні задачі:

розробляти та покращувати ML-моделі для обробки документів;
працювати з задачами Computer Vision, OCR, NLP, NER, LLM/VLM;
будувати пайплайни обробки документів - від вхідного файлу до структурованих даних;
покращувати якість витягування полів із документів;
працювати з класифікацією документів, визначенням типів документів, розділенням багатосторінкових файлів;
аналізувати помилки моделей і пропонувати конкретні способи покращення;
експериментувати з open-source моделями, OCR, LLM/VLM та оцінювати їхню придатність для продакшн-використання;
оптимізувати моделі та пайплайни за швидкістю, вартістю та якістю;
розгортати ML-рішення в хмарній інфраструктурі;
інтегрувати ML-компоненти з backend-частиною продукту.

Важливо, ми очікуємо, що ти зможеш взяти задачу, самостійно розібратись у контексті, запропонувати підхід, зробити експеримент, оцінити результат і довести рішення до робочого стану.

Технології, з якими ми працюємо

ML / AI

Python;
PyTorch / TensorFlow;
HuggingFace Transformers;
OCR / Document AI;
Object Detection, зокрема YOLO-подібні підходи;
NLP / NER;
LLM / VLM;
spaCy;
scikit-learn;
open-source моделі для роботи з текстом, зображеннями та документами.

Backend / API

FastAPI;
Flask;
REST API;
Docker;
інтеграція ML-сервісів із backend-системами.

Хмара та інфраструктура

Ми працюємо з Azure, тому досвід із цією екосистемою буде дуже корисним:

Azure ML;
Azure Functions;
Azure Web Apps;
Azure DevOps;
Azure Service Bus;
Azure Blob Storage;
Application Insights;
container-based deployment.

Також буде плюсом досвід з AWS.

Не потрібно знати все з цього списку. Але важливо мати реальний досвід із продакшн-підходом до ML, а не тільки навчальні експерименти.

Що ми очікуємо від Middle-рівня

Для цієї ролі нам важливо, щоб ти міг:

самостійно розібратись у новій задачі;
сформулювати гіпотези та запропонувати кілька варіантів рішення;
оцінити trade-off між якістю, швидкістю, складністю та вартістю;
не чекати детального технічного завдання на кожен крок;
вести задачу від аналізу проблеми до робочого результату;
чесно показувати, що працює, а що ні;
пропонувати покращення продукту на основі технічних спостережень;
працювати в команді з розробниками, аналітиками та менеджером по продукту.

Що ми пропонуємо

Продукт, а не одноразовий проєкт.
Ти працюватимеш над ядром RaccoonDoc, яке постійно розвивається і використовується реальними клієнтами.

Реальні дані та реальні задачі.
Тут не буде стерильних датасетів. Будуть документи, які щодня створюють проблеми бізнесу, і саме їх треба навчити систему обробляти краще, швидше й стабільніше.

Вплив на продукт.
ML у RaccoonDoc - це не декоративний модуль збоку. Це основа продукту. Твої рішення напряму впливатимуть на якість, швидкість і конкурентність платформи.

Сильний практичний контекст.
Ми працюємо з клієнтами, які мають реальні обсяги документів, реальні інтеграції, реальні вимоги до якості й відповідальності.

Гнучкий формат роботи.
Віддалено з будь-якого міста України. Ми розуміємо реалії війни, тривог, блекаутів і нестабільної інфраструктури.

Процес найму

Короткий кол (до 30 хв) - знайомство, контекст продукту, твої очікування.
Технічний етап (60–90 хв) - обговорення твоїх продакшн-кейсів, архітектурних рішень, експериментів.
Співбесіда з фаундером (30–45 хв) - про бачення продукту, роль ML у RaccoonDoc, розвиток.
Оффер.

Кому ця роль точно підійде

Тому, хто хоче працювати не над ще одним pet-проєктом з AI, а над продуктом, де ML щодня вирішує конкретні бізнесові задачі.

Тому, кому цікаво будувати системи для реальних документів, реальних клієнтів і реального продакшену.

Тому, хто хоче не просто запускати моделі, а впливати на те, як AI-продукт для обробки документів буде виглядати через рік.

Якщо тобі цікаво працювати з документами, OCR, LLM/VLM, Computer Vision, NLP і продакшн-ML у реальному українському AI-продукті, будемо раді познайомитись.

Required skills experience

PyTorch 2 years

Transformers 2 years

Object Detection 2 years

NLP 2 years

LLM 2 years

+ 5 more

Azure AI 2 years

Azure Functions 2 years

FastAPI 2 years

Docker 2 years

Python 2 years

Required languages

English B1 - Intermediate

Ukrainian C2 - Proficient

Published 28 April · Updated 20 July

223 views

58 applications

Response activity: Low

Last responded 3 weeks ago

See stats of candidates who applied for this job 👀

See applicant insights

To apply for this and other jobs on Djinni login or signup.

Only from 2 years of experience
Full Remote
Ukraine
Countries where we consider candidates
- English B1 - Intermediate
- Ukrainian C2 - Proficient

ML / AI

PyTorch	2 years
Transformers	2 years
Object Detection	2 years

+ 7 more

Employment: Fulltime
Domain: Other
Product

Response activity: Low

Last responded 3 weeks ago

📊 Average salary range of similar jobs in analytics →