Middle Data Annotator / Data Labeler
Шукаємо фахівця для підготовки датасетів, що використовуються для перевірки якості та тренування власних AI/ML моделей.
Основне завдання – анотація текстів, отриманих з відсканованих документів (OCR), та визначення іменованих сутностей (NER), таких як номери телефонів, адреси, назви організацій тощо.
Ви отримуватимете набори сканів або фотографій документів і перетворюватимете їх у структурований текст із використанням Markdown, додатково позначаючи ключові ідентифікатори.
Окрім роботи з текстами передбачена обробка аудіо- та відеоматеріалів: створення транскриптів із таймкодами та діаризацією мовців, NER у транскриптах, нормалізація і верифікація якості; для відео - сегментація на сцени/епізоди, кадр-точні таймкоди, опис подій, позначення екранних написів, логотипів, облич та об’єктів.
Бажаним є досвід роботи з Label Studio, CVAT або подібними інструментами, базові навички програмування, а також досвід участі у тренуванні чи тестуванні AI/ML моделей.
Робота віддалена, в рамках розробки власного продукту, що знаходиться на передовій сучасних технологій та орієнтований на державний сектор.
Наша компанія є критично важливою для Збройних сил України; за потреби надаємо бронювання та офісну техніку.
Required skills experience
| Data Annotation | |
| Data Labeling | |
| Cvat |
Required languages
| English | B1 - Intermediate |
| Ukrainian | C2 - Proficient |