Консультант / Інженер з OCR/ Computer vision
Ми шукаємо фахівця, який допоможе нам проаудитити, спроєктувати й поліпшити якість розпізнавання тексту з фото (таблички з текстом та цифрами). Спочатку потрібне консультування та план робіт, далі — пілотна імплементація покращень. Проєкт одноразовий (part-time), під NDA, з можливістю коротких хвиль підтримки після POC.
ЩО ВЖЕ Є (вихідні умови):
- Є поточний конвеєр розпізнавання, який перетворює символи з фото у табличний вигляд (зараз без порогу впевненості та без зонування результатів).
- Потрібно додати метрики якості, пороги впевненості та зонування (зелена/сіра/червона) для модерації.
- Потрібен ретроспективний прогін попередніх фото для пошуку помилок.
- Навчальні/тестові дані доведеться зібрати із наявної бази (мітити приклади, де були правки vs підтвердження).
- Потрібен шар правил валідації (наприклад, недопустимі дати на кшталт “30 лютого”, майбутні роки тощо).
- Бажано спиратися на опенсорс-рішення та розгортати в інфраструктурі Google.
- Якість вихідних фото лишається як є; орієнтовно “ідеальне” розпізнавання зараз ~50%, але кейси «заздалегідь» не відсіяти без людини.
- На цьому етапі це не ТЗ із кошторисом, а консультація + пілот з чіткими критеріями.
ВАШІ ПЕРШІ ЗАДАЧІ (1–3 тижні):
- Провести аудит поточного пайплайну та даних; сформувати роудмапу покращень із пріоритезацією.
- Запропонувати метрики оцінки якості (precision/recall/F1, частка «сірої зони») та спосіб їх вимірювання на POC.
- Спроєктувати зонування за впевненістю і правилами, описати механіку модерації.
- Запропонувати підхід до розмітки даних (відбір підмножини, інструкції для міток, контроль якості).
- Сформувати валидаційний шар (правила цілісності, формати, діапазони).
- Рекомендації щодо інструментів/моделей (опенсорс) та розгортання в Google-інфраструктурі.
Оцінити обсяг робіт на POC та підготувати план ретро-прогону історичних зображень.
ЩО ОЧІКУЄМО ВІД ФАХІВЦЯ:
- Досвід у OCR / Computer Vision та пост-обробці результатів (нормалізація, фільтри, правила, агрегації).
- Практика з хоча б одним зі стеків: Tesseract / PaddleOCR / EasyOCR / TrOCR, OpenCV, Python (скрипти/пайплайни).
- Розуміння метрик якості, побудови POC/benchmark, конфігурування confidence thresholds.
- Досвід із даними: організація розмітки, формування train/test-вибірок, контроль якості міток.
- Бажано: GCP (Cloud Run / Functions / Storage / Pub/Sub / Vertex/AI або еквіваленти), бази даних, простий MLOps.
- Вміння чітко пояснювати компроміси, працювати під NDA, пропонувати поетапне впровадження.
ФОРМАТ:
- Одноразовий part-time проєкт: консультація → POC → (за потреби) коротка імплементаційна фаза.
- Віддалено, гнучкий графік; старт — ASAP.
- Модель співпраці: T&M погодинно або фікс за POC-етап (узгодимо на старті).
- Короткий пілот/міні-завдання може бути оплачуваним.
ЩО ДАСТЕ НА ВИХОДІ:
- Аудит і дорожня карта покращень з ризиками та залежностями.
- Метрики якості і цільові пороги для зонування (зелена/сіра/червона).
- Працюючий POC (скрипти/сервіс), що демонструє приріст якості та ретро-прогін на підмножині.
- Специфікація правил валідації й рекомендації щодо масштабування.
ПРОЦЕС ВІДБОРУ:
- Резюме/портфоліо з релевантними кейсами OCR.
- Коротка співбесіда (30–45 хв) + обговорення підходу до наших умов.
- Оплачуємий міні-пілот або детальний план POC.
- Старт.
Як податися
Надішліть CV/LinkedIn та 1–2 приклади, де ви:
- впроваджували пороги впевненості/зонування або валидаційні правила;
- робили ретро-прогін даних чи підвищували метрики OCR у продакшені.
Мова спілкування — українська.
Required skills experience
OCR | 2 years |
Computer Vision | 2 years |
Required languages
Published 6 October
33 views
·
4 applications
📊
$2000-3500
Average salary range of similar jobs in
analytics →
Loading...