Консультант / Інженер з OCR/ Computer vision

Ми шукаємо фахівця, який допоможе нам проаудитити, спроєктувати й поліпшити якість розпізнавання тексту з фото (таблички з текстом та цифрами). Спочатку потрібне консультування та план робіт, далі — пілотна імплементація покращень. Проєкт одноразовий (part-time), під NDA, з можливістю коротких хвиль підтримки після POC.

ЩО ВЖЕ Є (вихідні умови):

Є поточний конвеєр розпізнавання, який перетворює символи з фото у табличний вигляд (зараз без порогу впевненості та без зонування результатів).
Потрібно додати метрики якості, пороги впевненості та зонування (зелена/сіра/червона) для модерації.
Потрібен ретроспективний прогін попередніх фото для пошуку помилок.
Навчальні/тестові дані доведеться зібрати із наявної бази (мітити приклади, де були правки vs підтвердження).
Потрібен шар правил валідації (наприклад, недопустимі дати на кшталт “30 лютого”, майбутні роки тощо).
Бажано спиратися на опенсорс-рішення та розгортати в інфраструктурі Google.
Якість вихідних фото лишається як є; орієнтовно “ідеальне” розпізнавання зараз ~50%, але кейси «заздалегідь» не відсіяти без людини.
На цьому етапі це не ТЗ із кошторисом, а консультація + пілот з чіткими критеріями.

ВАШІ ПЕРШІ ЗАДАЧІ (1–3 тижні):

Провести аудит поточного пайплайну та даних; сформувати роудмапу покращень із пріоритезацією.
Запропонувати метрики оцінки якості (precision/recall/F1, частка «сірої зони») та спосіб їх вимірювання на POC.
Спроєктувати зонування за впевненістю і правилами, описати механіку модерації.
Запропонувати підхід до розмітки даних (відбір підмножини, інструкції для міток, контроль якості).
Сформувати валидаційний шар (правила цілісності, формати, діапазони).
Рекомендації щодо інструментів/моделей (опенсорс) та розгортання в Google-інфраструктурі.
Оцінити обсяг робіт на POC та підготувати план ретро-прогону історичних зображень.

ЩО ОЧІКУЄМО ВІД ФАХІВЦЯ:

Досвід у OCR / Computer Vision та пост-обробці результатів (нормалізація, фільтри, правила, агрегації).
Практика з хоча б одним зі стеків: Tesseract / PaddleOCR / EasyOCR / TrOCR, OpenCV, Python (скрипти/пайплайни).
Розуміння метрик якості, побудови POC/benchmark, конфігурування confidence thresholds.
Досвід із даними: організація розмітки, формування train/test-вибірок, контроль якості міток.
Бажано: GCP (Cloud Run / Functions / Storage / Pub/Sub / Vertex/AI або еквіваленти), бази даних, простий MLOps.
Вміння чітко пояснювати компроміси, працювати під NDA, пропонувати поетапне впровадження.

ФОРМАТ:

Одноразовий part-time проєкт: консультація → POC → (за потреби) коротка імплементаційна фаза.
Віддалено, гнучкий графік; старт — ASAP.
Модель співпраці: T&M погодинно або фікс за POC-етап (узгодимо на старті).
Короткий пілот/міні-завдання може бути оплачуваним.

ЩО ДАСТЕ НА ВИХОДІ:

Аудит і дорожня карта покращень з ризиками та залежностями.
Метрики якості і цільові пороги для зонування (зелена/сіра/червона).
Працюючий POC (скрипти/сервіс), що демонструє приріст якості та ретро-прогін на підмножині.
Специфікація правил валідації й рекомендації щодо масштабування.

ПРОЦЕС ВІДБОРУ:

Резюме/портфоліо з релевантними кейсами OCR.
Коротка співбесіда (30–45 хв) + обговорення підходу до наших умов.
Оплачуємий міні-пілот або детальний план POC.
Старт.

Як податися

Надішліть CV/LinkedIn та 1–2 приклади, де ви:

впроваджували пороги впевненості/зонування або валидаційні правила;
робили ретро-прогін даних чи підвищували метрики OCR у продакшені.

Мова спілкування — українська.

Required skills experience

OCR	2 years
Computer Vision	2 years

Required languages

Published 6 October

65 views

5 applications

80% read

20% responded

Last responded 2 weeks ago

To apply for this and other jobs on Djinni login or signup.

Only from 3 years of experience
Full Remote
Ukraine
Countries where we consider candidates

Python

OCR	2 years
Computer Vision	2 years

Employment: Part-time
Domain: Machine Learning / Big Data
Outsource

Apply for the job

Last responded 2 weeks ago

80% read

20% responded

📊 $2000-3700 Average salary range of similar jobs in analytics →