cyberharbor.tech

Joined in 2025
6% answers

Cyber Harbor is a fast-growing Ukraine-based company founded by elite engineers and researchers who defended critical cyber infrastructure during the war. We build AI-powered systems shaped by real-world defense experience - ready for real-world complexity.

  • · 123 views · 9 applications · 29d

    Data Annotator / Data Labeling Team Lead

    Full Remote · Ukraine · Product · 2 years of experience · B1 - Intermediate MilTech 🪖
    Ми розширюємося і шукаємо Team Lead з підготовки датасетів, який керуватиме in-house командою анотації та залишатиметься hands-on у розмітці. Плануватимете та координуватимете розмітку мультимодальних даних - текст OCR/NER, зображення, аудіо, відео -...

    Ми розширюємося і шукаємо Team Lead з підготовки датасетів, який керуватиме in-house командою анотації та залишатиметься hands-on у розмітці. Плануватимете та координуватимете розмітку мультимодальних даних - текст OCR/NER, зображення, аудіо, відео - формалізуєте гайдлайни й QA та триматимете стабільність, якість і дедлайни постачання датасетів.

     

    Що ви робитимете

    • Планувати, координувати та контролювати роботу in-house команди.
    • Будувати робочий пайплайн з нуля: розробляти гайдлайни, проводити онбординг і навчання.
    • Впроваджувати та підтримувати стандарти якості: single-pass, double-blind, golden set, spot-check.
    • Проводити QA та рев’ю розмітки, відстежувати узгодженість анотацій. 
    • Виконувати hands-on частину роботи: розмітка OCR/NER по текстам, класифікація зображень, аудіо та відео, структурований вивід у Markdown та погоджені формати даних.


    Що потрібно для ролі

    • Досвід управління командами розмітки та підготовки датасетів - від 1 року. 
    • Впевнене володіння інструментами Label Studio, CVAT або альтернативами.
    • Розуміння підходів до контролю якості розмітки та метрик узгодженості.
    • Досвід розробки гайдлайнів та інструкцій для анотації.
    • Уважність до деталей, системність, вміння планувати та тримати дедлайни.

     

    Чому саме ми

    • Реальний вплив - можливість працювати над власним продуктом на передовій сучасних технологій в держ. секторі.
    • Бронювання - наша компанія є критично важливою для Збройних сил України.
    • Культура зростання - робота з найкращими фахівцями ринку
    • Фокус на результат - підтримуємо віддалений формат та гнучкий графік.
    More
  • · 54 views · 2 applications · 4d

    ML/AI Engineer (LLM, RAG, Agentic Tools)

    Full Remote · Ukraine · Product · 3 years of experience · B2 - Upper Intermediate MilTech 🪖
    Шукаємо фахівця, який буде відповідати за розробку та супровід комплексної AI-powered пошукової системи на основі великої інтерактивної бази знань. У системі реалізовано tool calling та agentic behaviour, що працюють із внутрішніми інструментами та...

    Шукаємо фахівця, який буде відповідати за розробку та супровід комплексної AI-powered пошукової системи на основі великої інтерактивної бази знань. У системі реалізовано tool calling та agentic behaviour, що працюють із внутрішніми інструментами та різними типами сховищ: векторними базами для семантичного пошуку, документоорієнтованими для повнотекстового пошуку, а також реляційними та графовими базами для пошуку за конкретними ідентифікаторами. Інтерфейс пошуку побудовано у форматі LLM-powered чату, який підтримує запити natural language і повертає аргументовані висновки, рекомендації та посилання на першоджерела. 

    У зону відповідальності кандидата входитиме проєктування та впровадження повного пайплайну LLM-powered пошуку, включно з orchestration, reasoning, reranking, tool calling, обробкою відповідей інструментів, валідацією результатів та формуванням фінальних відповідей для користувача. 

    Ми очікуємо, що кандидат: 

    • Має практичний комерційний досвід роботи з vLLM у self-hosted середовищах, включно з оптимізацією моделей на GPU H100/200, розумінням принципів GPU-архітектур та поведінки кешу під продакшн-навантаженням. 
    • Глибоко розуміє концепцію RAG та має досвід успішного впровадження подібних рішень у продакшені. 
    • Працював з Haystack / LlamaIndex / LangChain або аналогічними фреймворками та орієнтується в принципових відмінностях між ними. 
    • Має досвід використання MCP та роботи з LLM, які викликають зовнішні інструменти й сервіси. 
    • Володіє Python на високому рівні: архітектурні принципи, шаблони проєктування, багатопоточність, асинхронність, сучасні практики тестування, а також досвід експлуатації систем під навантаженням (моніторинг, оптимізація пам'яті, телеметрія). 
    • Має досвід роботи з документоорієнтованими, реляційними та векторними базами даних, включно з розумінням типів індексів і відповідних сценаріїв застосування. 

       

    Буде плюсом: 

    • Досвід створення або підтримки баз знань, систем генерації звітів на базі AI, розробка чатботів із великим контекстним вікном.
    • Досвід навчання або fine-tuning LLM чи компактних моделей для специфічних задач. 
    • Практичний досвід у DevOps: CI/CD, Kubernetes, Helm, ArgoCD. 
    • Досвід розробки систем на основі OCR та Vision-Language моделей для обробки неструктурованих даних. 
    • Досвід у data engineering: розуміння ETL/ELT-процесів, робота з оркестраторами (Airflow, Temporal, Prefect) та системами розподіленого обчислення (Ray.io, Spark). 
    • Досвід роботи з Elasticsearch, MongoDB, PostgreSQL, Qdrant/Milvus, Neo4j та іншими СУБД. 
    • Розуміння процесів кібербезпеки та сучасних підходів до захисту даних. 
       

    Пропонуємо повністю віддалений формат роботи над власним продуктом, який використовує найсучасніші технології та орієнтований на державний сектор. Компанія має статус критично важливої для Збройних сил України. За потреби надаємо бронювання та необхідну офісну техніку.

    More
  • · 47 views · 1 application · 3d

    ML/AI Engineer (OCR, VL Models)

    Full Remote · Ukraine · Product · 3 years of experience · B2 - Upper Intermediate MilTech 🪖
    Наша компанія розробляє власну інтерактивну базу знань. Користувачі можуть завантажувати будь-який обсяг різноманітних даних, після чого система автоматично перетворює їх на структурований, придатний для пошуку контент. Для цього застосовується...

    Наша компанія розробляє власну інтерактивну базу знань. Користувачі можуть завантажувати будь-який обсяг різноманітних даних, після чого система автоматично перетворює їх на структурований, придатний для пошуку контент. Для цього застосовується комплексний ML-пайплайн із залученням OCR, VL моделей, документних парсерів та різних типів сховищ даних. Пошук реалізовано через чат на базі LLM, який дозволяє формувати запити звичайною мовою, отримувати релевантні документи, а також узагальнені висновки та рекомендації на основі завантажених матеріалів. 

    Зараз ми шукаємо ML/AI інженера з глибоким досвідом роботи з неструктурованим контентом (насамперед фотографіями та скан-копіями документів), який підсилить нашу команду та очолить напрям розробки пайплайнів і рішень для обробки таких даних. 

    Ми очікуємо, що кандидат: 
    • Має широкий досвід роботи з неструктурованими даними та застосовував як класичні OCR-системи (Tesseract, PaddleOCR, EasyOCR), так і сучасні моделі (PaddleOCR-VL, DeepSeek-OCR, dots.ocr, Qwen3-VL). Розуміє сильні та слабкі сторони різних архітектур і сценарії їх застосування. 
    • Має практичний досвід навчання та fine-tuning OCR і Vision-Language моделей. 
    • Розуміє алгоритмічні методи покращення зображень, їх попередню фільтрацію та обробку для підвищення якості подальшого розпізнавання. 
    • Працював з Docling (включно з тонким налаштуванням бекендів для парсингу складних PDF і таблиць), markitdown, Apache Tika, PyMuPDF та іншими інструментами для конвертації й структуризації документів. Орієнтується у процесингу багатошарових і нетривіальних PDF-файлів. 
    • Має досвід роботи з self-hosted моделями, зокрема запуску та оптимізації моделей у середовищах vLLM на GPU рівня H100 і вище, розуміє принципи GPU-архітектури та KV cache. 
    • Має сильні навички програмування на Python: архітектурні патерни, багатопоточність, асинхронність, сучасні практики тестування, досвід експлуатації сервісів під високим навантаженням (моніторинг, телеметрія, утилізація пам'яті). 
    • Має досвід роботи з документоорієнтованими, реляційними та векторними базами даних, розуміє типи індексів і відповідні юзкейси для кожного типу сховищ. 

    Буде плюсом: 
    • Досвід роботи з Speech-to-text або Video-to-text пайплайнами.
    • Досвід аналізу контенту: класифікація, сумаризація, NER. 
    • Досвід у data engineering: розуміння ETL/ELT-процесів, робота з оркестраторами (Airflow, Temporal, Prefect) та системами розподіленого обчислення (Ray.io, Spark). 
    • Досвід у DevOps: CI/CD, Kubernetes, Helm, ArgoCD. 
    • Досвід роботи з Elasticsearch, MongoDB, PostgreSQL, Qdrant/Milvus, Neo4j та іншими сховищами. 
    • Розуміння сучасних підходів до кібербезпеки. 
    • Практичний досвід із системами на основі RAG у продакшені. 

    Пропонуємо повністю віддалений формат роботи над власним продуктом, який використовує найсучасніші технології та орієнтований на державний сектор. Компанія має статус критично важливої для Збройних сил України. За потреби надаємо бронювання та необхідну офісну техніку.

    More
Log In or Sign Up to see all posted jobs