Middle ML Engineer (Computer Vision / NLP / LLM) - RaccoonDoc

$$
Product

Про продукт

RaccoonDoc - це український AI-продукт для автоматизації обробки та розпізнавання документів.

 

Ми працюємо не з ідеальними PDF і не з навчальними датасетами, а з реальними документами бізнесу - актами, накладними, рахунками, договорами, сканами, фото, таблицями, нестандартними шаблонами, поганою якістю зображень і всім тим “документним хаосом”, який щодня проходить через бухгалтерію, фінанси, логістику та операційні підрозділи компаній.

 

Наші клієнти - компанії, де документи вимірюються не десятками, а тисячами й десятками тисяч на місяць.

 

Ми шукаємо Middle ML Engineer у продуктову команду RaccoonDoc - інженера, який уже має практичний досвід з ML/NLP/CV/LLM-задачами, вміє самостійно рухати задачі від ідеї до робочого рішення і не потребує постійного менторства.

 

Нам потрібна людина, яка не просто тренувала модель, а розуміє, що відбувається після цього - якість, швидкість, продакшн, інтеграція, стабільність, моніторинг, компроміси між точністю, вартістю та latency.

 

Що ти будеш робити

Працювати над ML/AI-ядром RaccoonDoc для розпізнавання, класифікації, розділення, аналізу та валідації документів.

 

Основні задачі:

  • розробляти та покращувати ML-моделі для обробки документів;
  • працювати з задачами Computer Vision, OCR, NLP, NER, LLM/VLM;
  • будувати пайплайни обробки документів - від вхідного файлу до структурованих даних;
  • покращувати якість витягування полів із документів;
  • працювати з класифікацією документів, визначенням типів документів, розділенням багатосторінкових файлів;
  • аналізувати помилки моделей і пропонувати конкретні способи покращення;
  • експериментувати з open-source моделями, OCR, LLM/VLM та оцінювати їхню придатність для продакшн-використання;
  • оптимізувати моделі та пайплайни за швидкістю, вартістю та якістю;
  • розгортати ML-рішення в хмарній інфраструктурі;
  • інтегрувати ML-компоненти з backend-частиною продукту.

     

Важливо, ми очікуємо, що ти зможеш взяти задачу, самостійно розібратись у контексті, запропонувати підхід, зробити експеримент, оцінити результат і довести рішення до робочого стану.

 

Технології, з якими ми працюємо

ML / AI

  • Python;
  • PyTorch / TensorFlow;
  • HuggingFace Transformers;
  • OCR / Document AI;
  • Object Detection, зокрема YOLO-подібні підходи;
  • NLP / NER;
  • LLM / VLM;
  • spaCy;
  • scikit-learn;
  • open-source моделі для роботи з текстом, зображеннями та документами.

 

Backend / API

  • FastAPI;
  • Flask;
  • REST API;
  • Docker;
  • інтеграція ML-сервісів із backend-системами.

     

Хмара та інфраструктура

Ми працюємо з Azure, тому досвід із цією екосистемою буде дуже корисним:

  • Azure ML;
  • Azure Functions;
  • Azure Web Apps;
  • Azure DevOps;
  • Azure Service Bus;
  • Azure Blob Storage;
  • Application Insights;
  • container-based deployment.

 

Також буде плюсом досвід з AWS.

 

Не потрібно знати все з цього списку. Але важливо мати реальний досвід із продакшн-підходом до ML, а не тільки навчальні експерименти.

 

Що ми очікуємо від Middle-рівня

Для цієї ролі нам важливо, щоб ти міг:

  • самостійно розібратись у новій задачі;
  • сформулювати гіпотези та запропонувати кілька варіантів рішення;
  • оцінити trade-off між якістю, швидкістю, складністю та вартістю;
  • не чекати детального технічного завдання на кожен крок;
  • вести задачу від аналізу проблеми до робочого результату;
  • чесно показувати, що працює, а що ні;
  • пропонувати покращення продукту на основі технічних спостережень;
  • працювати в команді з розробниками, аналітиками та менеджером по продукту.

 

Що ми пропонуємо

Продукт, а не одноразовий проєкт.
Ти працюватимеш над ядром RaccoonDoc, яке постійно розвивається і використовується реальними клієнтами.

 

Реальні дані та реальні задачі.
Тут не буде стерильних датасетів. Будуть документи, які щодня створюють проблеми бізнесу, і саме їх треба навчити систему обробляти краще, швидше й стабільніше.

 

Вплив на продукт.
ML у RaccoonDoc - це не декоративний модуль збоку. Це основа продукту. Твої рішення напряму впливатимуть на якість, швидкість і конкурентність платформи.

 

Сильний практичний контекст.
Ми працюємо з клієнтами, які мають реальні обсяги документів, реальні інтеграції, реальні вимоги до якості й відповідальності.

 

Гнучкий формат роботи.
Віддалено з будь-якого міста України. Ми розуміємо реалії війни, тривог, блекаутів і нестабільної інфраструктури.

 

 

Процес найму

  1. Короткий кол (до 30 хв) - знайомство, контекст продукту, твої очікування.
  2. Технічний етап (60–90 хв) - обговорення твоїх продакшн-кейсів, архітектурних рішень, експериментів.
  3. Співбесіда з фаундером (30–45 хв) - про бачення продукту, роль ML у RaccoonDoc, розвиток.
  4. Оффер.

 

Кому ця роль точно підійде

Тому, хто хоче працювати не над ще одним pet-проєктом з AI, а над продуктом, де ML щодня вирішує конкретні бізнесові задачі.

 

Тому, кому цікаво будувати системи для реальних документів, реальних клієнтів і реального продакшену.

 

Тому, хто хоче не просто запускати моделі, а впливати на те, як AI-продукт для обробки документів буде виглядати через рік.

 

Якщо тобі цікаво працювати з документами, OCR, LLM/VLM, Computer Vision, NLP і продакшн-ML у реальному українському AI-продукті, будемо раді познайомитись.

Required skills experience

Python 2 years
PyTorch 2 years
Transformers 2 years
Object Detection 2 years
NLP 2 years
LLM 2 years
Azure AI 2 years
Azure Functions 2 years
FastAPI 2 years
Docker 2 years

Required languages

English B1 - Intermediate
Ukrainian C2 - Proficient
Published 28 April
27 views
·
6 applications
Response activity: Medium
Last responded 5 hours ago
See stats of candidates who applied for this job 👀
To apply for this and other jobs on Djinni login or signup.
Loading...