cyberharbor.tech

Joined in 2025
94% answers

Cyber Harbor is a fast-growing Ukraine-based company founded by elite engineers and researchers who defended critical cyber infrastructure during the war. We build AI-powered systems shaped by real-world defense experience - ready for real-world complexity.

  • · 428 views · 85 applications · 10d

    Middle Python back-end engineer

    Ukraine · Product · 1 year of experience · A2 - Elementary MilTech 🪖
    We are expanding our engineering team and looking for a Middle Python Back-End Engineer to help us build a system that processes high-frequency geospatial flight data in near real-time. You will be part of a mission-critical product that collects,...

    We are expanding our engineering team and looking for a Middle Python Back-End Engineer to help us build a system that processes high-frequency geospatial flight data in near real-time.

     

    You will be part of a mission-critical product that collects, transforms, and transmits data for dynamic visualization on tactical maps and for integration with external analytical systems. The speed and reliability of your code will directly impact how this data is used in real-world decision-making processes. 

     

    If you want to work on a product with purpose, where your code has real-world impact - we’d love to meet you.

     

     

    What You Will Do
     

    • Build and maintain backend services for ingesting, processing, and distributing real-time geospatial data
       
    • Design RESTful and WebSocket-based APIs to serve both internal systems and third-party integrations
       
    • Optimize data flow and system performance to minimize latency and maximize throughput
       
    • Write clean, tested, and maintainable code using modern Python frameworks (Flask or FastAPI)
       
    • Collaborate with front-end engineers, DevOps, and analysts to ensure consistent delivery of reliable data
       
    • Contribute to architecture and system design discussions focused on performance and scalability

     

     

    What You Need to Join Us

     

    • Proficiency in building Python backend services – you write clean, efficient code and know how to ship reliable systems.
       
    • Experience with Flask (or FastAPI), REST APIs, and Socket.IO (or WebSocket) communication.
       
    • Basic knowledge of NumPy and Pandas
       
    • Solid understanding of PostgreSQL and MongoDB databases.
       
    • Experience with Python testing frameworks (e.g., pytest)
       
    • Fundamental understanding of interaction between frontend and backend
       
    • Understanding of programming patterns and their practical application
       
    • Familiarity with handling sensitive data and basic principles of secure backend architecture.
       
    • Ability to optimize database performance for speed and scalability.

     

     

    Nice to Have

     

    • Basic understanding of CI/CD pipelines and cloud deployment (e.g., AWS, FluxCD).
       
    • Familiarity with analytical geometry or geospatial data: coordinates, shapes, movement modeling.
       
    • Experience working with real-time systems or high-throughput applications.

     

    Why Join Us

     

    • Make Real-World Impact - Our tech is proven in national defence. 
    • Challenging Work - You’ll build what hasn’t been built by anyone before.
    • Military deferment - For full-time employees.
    • Flexible Schedule - Remote-friendly and results-driven
    • Competitive Compensation - We reward top talent
    • Growth-Oriented Culture - Work with a smart, driven, collaborative team
    More
  • · 53 views · 5 applications · 6d

    Senior Machine Learning Engineer

    Full Remote · Ukraine · Product · 3 years of experience MilTech 🪖
    We’re expanding and looking for a Senior Machine Learning Engineer to lead and own our ML direction. You’ll be responsible for designing and scaling the entire ML stack –from research to production – driving innovation across NLP, CV, and multimodal...

    We’re expanding and looking for a Senior Machine Learning Engineer to lead and own our ML direction.


    You’ll be responsible for designing and scaling the entire ML stack –from research to production – driving innovation across NLP, CV, and multimodal pipelines. 

    We work primarily with open-source models deployed locally (not on managed cloud platforms), so you should be comfortable running, profiling, and optimizing everything on-premise.

     

    We expect you to deeply understand how things work, not just how to run them. You’ll have the autonomy to define the architecture, choose the models, and ensure high performance in local environments.

     

    What You Will Do

    • Design and build APIs and pipelines for tasks such as summarization, classification, NER, OCR, image captioning, face detection/recognition, speech-to-text, and (soon) video-to-text and RAG chat systems.
    • RAG end-to-end: chunking/normalization, index construction; hybrid retrieval (BM25 + vector), reranking (BGE/ColBERT, etc.), context policies, caching, latency budgeting, and offline evaluation (RAGAS/TruLens).
    • Run and serve models locally using vLLM, TensorRT, ONNX Runtime, or OpenVINO — ensuring efficient inference on our own GPU servers.
    • Select, fine-tune, and optimize transformer models (LLaMA, Falcon, Mistral, DeepSeek, Gemma, etc.) for specific domains and modalities.
    • Develop scalable data pipelines for model training and evaluation: annotation, augmentation, class balancing, and dataset curation.
    • Collaborate with Data Engineering on reliable message passing (Kafka / RabbitMQ / MCP) and real-time data flow.
    • Set up observability for models and infrastructure: metrics (Prometheus), dashboards (Grafana), logging (ELK Stack).
    • Automate model lifecycle: CI/CD for training, validation, and deployment via GitHub Actions or GitLab CI.
    • Continuously explore and evaluate new models and research, staying up to date with the latest open-source releases and applying them to real-world use cases.

     

    What You Need to Join Us

    • Strong expertise in NLP and Multimodal ML (text, image, audio, video)
    • Strong expertise in OCR processing and document layout recovery — ability to extract both text and structural information (tables, headers, coordinates, reading order) from scanned and digital documents using open-source tools like PaddleOCR, Tesseract, Docling, etc.
    • Deep understanding of transformer architectures and practical optimization techniques
    • Proven experience in fine-tuning and serving models locally (no managed ML cloud services) 
    • Hands-on experience with vLLM and high-performance inference optimization
    • Strong Python skills, including clean, modular service design (FastAPI, Flask, or similar)
    • Familiarity with Docker, Kubernetes, DVC, and CI/CD pipelines
    • Understanding of distributed systems (Kafka, RabbitMQ, MCP)
    • Comfortable working with databases: relational (PostgreSQL/MySQL), NoSQL (MongoDB/Cassandra), and vector stores (Qdrant, Milvus, Elasticsearch)
    • Solid foundation in system performance and observability (Prometheus, Grafana, ELK)
    • Proactive mindset: you track new model releases, benchmark them, and know what’s relevant
    • English proficiency (technical reading; conversational level is a plus)

     

    Nice to Have

    • Experience building custom NER or QA models from scratch
    • Familiarity with on-device inference (Edge AI) and optimization for limited resources (ARM, CPU-only)
    • Understanding of Active Learning, Continual Learning, or Retrieval-Augmented Generation (RAG)
    • Experience with Ray / Ray Serve for distributed inference and training

     

    Why Join Us

    • Make Real-World Impact – Our tech is proven in national defence. Now we’re scaling globally.
    • Built for This Moment – We’re at the intersection of AI, cybersecurity, and autonomy.
    • Growth-Oriented Culture – Work with a smart, driven, collaborative team
    • Military deferment – For full-time employees.
    • Flexible Schedule – Remote-friendly and results-driven
    • Competitive Compensation – We reward top talent.
    More
  • · 80 views · 14 applications · 11d

    Middle Data Annotator / Data Labeler

    Full Remote · Ukraine · Product · 1 year of experience · B1 - Intermediate MilTech 🪖
    Шукаємо фахівця для підготовки датасетів, що використовуються для перевірки якості та тренування власних AI/ML моделей. Основне завдання – анотація текстів, отриманих з відсканованих документів (OCR), та визначення іменованих сутностей (NER), таких як...

    Шукаємо фахівця для підготовки датасетів, що використовуються для перевірки якості та тренування власних AI/ML моделей. 

     

    Основне завдання – анотація текстів, отриманих з відсканованих документів (OCR), та визначення іменованих сутностей (NER), таких як номери телефонів, адреси, назви організацій тощо.

     

    Ви отримуватимете набори сканів або фотографій документів і перетворюватимете їх у структурований текст із використанням Markdown, додатково позначаючи ключові ідентифікатори. 

     

    Окрім роботи з текстами передбачена обробка аудіо- та відеоматеріалів: створення транскриптів із таймкодами та діаризацією мовців, NER у транскриптах, нормалізація і верифікація якості; для відео - сегментація на сцени/епізоди, кадр-точні таймкоди, опис подій, позначення екранних написів, логотипів, облич та об’єктів.
     

    Бажаним є досвід роботи з Label Studio, CVAT або подібними інструментами, базові навички програмування, а також досвід участі у тренуванні чи тестуванні AI/ML моделей.

     

    Робота віддалена, в рамках розробки власного продукту, що знаходиться на передовій сучасних технологій та орієнтований на державний сектор. 

    Наша компанія є критично важливою для Збройних сил України; за потреби надаємо бронювання та офісну техніку.

    More
  • · 72 views · 5 applications · 11d

    Data Annotator / Data Labeling Team Lead

    Full Remote · Ukraine · Product · 2 years of experience · B1 - Intermediate MilTech 🪖
    Ми розширюємося і шукаємо Team Lead з підготовки датасетів, який керуватиме in-house командою анотації та залишатиметься hands-on у розмітці. Плануватимете та координуватимете розмітку мультимодальних даних - текст OCR/NER, зображення, аудіо, відео -...

    Ми розширюємося і шукаємо Team Lead з підготовки датасетів, який керуватиме in-house командою анотації та залишатиметься hands-on у розмітці. Плануватимете та координуватимете розмітку мультимодальних даних - текст OCR/NER, зображення, аудіо, відео - формалізуєте гайдлайни й QA та триматимете стабільність, якість і дедлайни постачання датасетів.

     

    Що ви робитимете

    • Планувати, координувати та контролювати роботу in-house команди.
    • Будувати робочий пайплайн з нуля: розробляти гайдлайни, проводити онбординг і навчання.
    • Впроваджувати та підтримувати стандарти якості: single-pass, double-blind, golden set, spot-check.
    • Проводити QA та рев’ю розмітки, відстежувати узгодженість анотацій. 
    • Виконувати hands-on частину роботи: розмітка OCR/NER по текстам, класифікація зображень, аудіо та відео, структурований вивід у Markdown та погоджені формати даних.


    Що потрібно для ролі

    • Досвід управління командами розмітки та підготовки датасетів - від 1 року. 
    • Впевнене володіння інструментами Label Studio, CVAT або альтернативами.
    • Розуміння підходів до контролю якості розмітки та метрик узгодженості.
    • Досвід розробки гайдлайнів та інструкцій для анотації.
    • Уважність до деталей, системність, вміння планувати та тримати дедлайни.

     

    Чому саме ми

    • Реальний вплив - можливість працювати над власним продуктом на передовій сучасних технологій в держ. секторі.
    • Бронювання - наша компанія є критично важливою для Збройних сил України.
    • Культура зростання - робота з найкращими фахівцями ринку
    • Фокус на результат - підтримуємо віддалений формат та гнучкий графік.
    More
Log In or Sign Up to see all posted jobs