Консультант / Інженер з OCR/ Computer vision

Ми шукаємо фахівця, який допоможе нам проаудитити, спроєктувати й поліпшити якість розпізнавання тексту з фото (таблички з текстом та цифрами). Спочатку потрібне консультування та план робіт, далі — пілотна імплементація покращень. Проєкт одноразовий (part-time), під NDA, з можливістю коротких хвиль підтримки після POC.

 

ЩО ВЖЕ Є (вихідні умови):

  • Є поточний конвеєр розпізнавання, який перетворює символи з фото у табличний вигляд (зараз без порогу впевненості та без зонування результатів).
  • Потрібно додати метрики якості, пороги впевненості та зонування (зелена/сіра/червона) для модерації.
  • Потрібен ретроспективний прогін попередніх фото для пошуку помилок.
  • Навчальні/тестові дані доведеться зібрати із наявної бази (мітити приклади, де були правки vs підтвердження).
  • Потрібен шар правил валідації (наприклад, недопустимі дати на кшталт “30 лютого”, майбутні роки тощо).
  • Бажано спиратися на опенсорс-рішення та розгортати в інфраструктурі Google.
  • Якість вихідних фото лишається як є; орієнтовно “ідеальне” розпізнавання зараз ~50%, але кейси «заздалегідь» не відсіяти без людини.
  • На цьому етапі це не ТЗ із кошторисом, а консультація + пілот з чіткими критеріями.

 

ВАШІ ПЕРШІ ЗАДАЧІ (1–3 тижні):

 

  • Провести аудит поточного пайплайну та даних; сформувати роудмапу покращень із пріоритезацією.
  • Запропонувати метрики оцінки якості (precision/recall/F1, частка «сірої зони») та спосіб їх вимірювання на POC.
  • Спроєктувати зонування за впевненістю і правилами, описати механіку модерації.
  • Запропонувати підхід до розмітки даних (відбір підмножини, інструкції для міток, контроль якості).
  • Сформувати валидаційний шар (правила цілісності, формати, діапазони).
  • Рекомендації щодо інструментів/моделей (опенсорс) та розгортання в Google-інфраструктурі.
  • Оцінити обсяг робіт на POC та підготувати план ретро-прогону історичних зображень.

     

ЩО ОЧІКУЄМО ВІД ФАХІВЦЯ:

  • Досвід у OCR / Computer Vision та пост-обробці результатів (нормалізація, фільтри, правила, агрегації).
  • Практика з хоча б одним зі стеків: Tesseract / PaddleOCR / EasyOCR / TrOCR, OpenCV, Python (скрипти/пайплайни).
  • Розуміння метрик якості, побудови POC/benchmark, конфігурування confidence thresholds.
  • Досвід із даними: організація розмітки, формування train/test-вибірок, контроль якості міток.
  • Бажано: GCP (Cloud Run / Functions / Storage / Pub/Sub / Vertex/AI або еквіваленти), бази даних, простий MLOps.
  • Вміння чітко пояснювати компроміси, працювати під NDA, пропонувати поетапне впровадження.

 

ФОРМАТ:

  • Одноразовий part-time проєкт: консультація → POC → (за потреби) коротка імплементаційна фаза.
  • Віддалено, гнучкий графік; старт — ASAP.
  • Модель співпраці: T&M погодинно або фікс за POC-етап (узгодимо на старті).
  • Короткий пілот/міні-завдання може бути оплачуваним.

 

 

ЩО ДАСТЕ НА ВИХОДІ:

  • Аудит і дорожня карта покращень з ризиками та залежностями.
  • Метрики якості і цільові пороги для зонування (зелена/сіра/червона).
  • Працюючий POC (скрипти/сервіс), що демонструє приріст якості та ретро-прогін на підмножині.
  • Специфікація правил валідації й рекомендації щодо масштабування.

 

 

ПРОЦЕС ВІДБОРУ:

  1. Резюме/портфоліо з релевантними кейсами OCR.
  2. Коротка співбесіда (30–45 хв) + обговорення підходу до наших умов.
  3. Оплачуємий міні-пілот або детальний план POC.
  4. Старт.

Як податися
 

Надішліть CV/LinkedIn та 1–2 приклади, де ви:

  • впроваджували пороги впевненості/зонування або валидаційні правила;
  • робили ретро-прогін даних чи підвищували метрики OCR у продакшені.

 

 

Мова спілкування — українська

Required skills experience

OCR 2 years
Computer Vision 2 years

Required languages

Published 6 October
33 views
·
4 applications
To apply for this and other jobs on Djinni login or signup.
Loading...