Middle Data Annotator / Data Labeler

MilTech 🪖

Шукаємо фахівця для підготовки датасетів, що використовуються для перевірки якості та тренування власних AI/ML моделей. 

 

Основне завдання – анотація текстів, отриманих з відсканованих документів (OCR), та визначення іменованих сутностей (NER), таких як номери телефонів, адреси, назви організацій тощо.

 

Ви отримуватимете набори сканів або фотографій документів і перетворюватимете їх у структурований текст із використанням Markdown, додатково позначаючи ключові ідентифікатори. 

 

Окрім роботи з текстами передбачена обробка аудіо- та відеоматеріалів: створення транскриптів із таймкодами та діаризацією мовців, NER у транскриптах, нормалізація і верифікація якості; для відео - сегментація на сцени/епізоди, кадр-точні таймкоди, опис подій, позначення екранних написів, логотипів, облич та об’єктів.
 

Бажаним є досвід роботи з Label Studio, CVAT або подібними інструментами, базові навички програмування, а також досвід участі у тренуванні чи тестуванні AI/ML моделей.

 

Робота віддалена, в рамках розробки власного продукту, що знаходиться на передовій сучасних технологій та орієнтований на державний сектор. 

Наша компанія є критично важливою для Збройних сил України; за потреби надаємо бронювання та офісну техніку.

Required skills experience

Data Annotation
Data Labeling
Cvat

Required languages

English B1 - Intermediate
Ukrainian C2 - Proficient
Data Annotation, Data Labeling, розмітка даних, CVAT
Published 22 October · Updated 6 November
Statistics:
121 views
·
20 applications
To apply for this and other jobs on Djinni login or signup.
Loading...