Machine Learning Engineer (Reinforcement Learning)

Miltech Company Responds Quickly
MilTech 🪖

Ми — українська MilTech-компанія, що створює майбутнє оборонних технологій. Ми розробляємо та виробляємо безпілотні системи й технологічні рішення, що вже довели свою ефективність у реальних бойових умовах. 

Наш відділ R&D об’єднує кращих інженерів, конструкторів, фахівців з RF і Hardware та багатьох інших. Завдяки власним виробничим потужностям ми забезпечуємо швидкий цикл впровадження інновацій — від ідеї до масового виробництва. Кожне оновлення продукту базується на прямому фідбеку від військових, що дозволяє нам створювати максимально актуальні рішення.
 

Твій виклик: Last Mile Targeting
 

Ми не граємо в симуляції заради статей на ArXiv. Твоє завдання — створити «мізки» дрона, здатні довести апарат до цілі в умовах повного РЕБ, шквального вітру та критичного браку обчислювальних ресурсів.
 

Це робота на межі можливостей: запуск RL-агентів на Raspberry Pi та подолання Sim2Real gap так, щоб модель не «втрачала» ціль через туман чи вібрації. Ми даємо тобі повний карт-бланш на архітектуру з нуля.
 

Що ти будеш робити:

  • End-to-End Pipeline: Побудова архітектури навчання від симулятора до деплою на реальне залізо.
  • RL Control: Розробка моделей керування (PPO, SAC, TD3), що приймають рішення на основі відеопотоку та сенсорів у real-time.
  • Sensor Fusion: Реалізація стабільного керування (Kalman Filters або RL-native підходи) у зв'язці з Sensor Engineers.
  • Sim2Real & Domain Randomization: Створення симуляційного середовища (Isaac Gym / AirSim / Custom UE) з глибокою рандомізацією для роботи в екстремальну погоду (сніг, дощ, низька видимість).
  • Optimization: Квантування та прунінг моделей для досягнення стабільного FPS на обмежених ресурсах (Raspberry Pi, NVIDIA Jetson).
     

Наш ідеальний кандидат:

  • Має досвід з RL-алгоритмами та розуміє, як змусити їх працювати в реальних системах.
  • Знає, як наблизити фізику симулятора до реальності, щоб мінімізувати Gap при переносі на борт.
  • Розуміє обмеження компактних комп’ютерів і вміє боротися за кожну мілісекунду інференсу.
  • Готовий бути архітектором: самостійно обирати стек, симулятор та підхід.
     

Розглядаємо також: якщо ти маєш міцний бекграунд у CV/ML та досвід з дронами, але хочеш «увірватися» саме в Reinforcement Learning.
 

Буде плюсом: Досвід з TensorRT, PyTorch Mobile, SNPE, AIMET, Tensorflow Lite, gamedev (UE) або безпосередньо з БПЛА різних типів.
 

Чому варто приєднатися:

  • Прямий вплив: Твій код буде «в полі» вже за лічені тижні, безпосередньо впливаючи на хід подій.
  • Свобода та ресурси: Ти сам обираєш інструменти. Ми оплачуємо участь у топових конференціях (CVPR, NeurIPS, ICRA) та профільне навчання.
  • R&D Полігон: Можливість миттєво тестувати гіпотези на реальних апаратах у найскладніших погодних умовах.
  • Команда: Працюй пліч-о-пліч з експертами з GNC, RF, Hardware та топовими C++ розробниками.
  • Стабільність: Офіційне працевлаштування, «біла» зарплата та бронювання.
  • Турбота: Медичне страхування, 24 дні відпустки + додатковий вихідний на день народження.
  • Self-care: Повна оплата лікарняних та 3 дні self-care на рік без жодних довідок.
  • Розвиток: Корпоративна бібліотека, курси англійської, навчання Hard & Soft skills.

 

Готовий навчити дрони перемагати? Чекаємо на твоє CV!

Required skills experience

Python 2 years
PyTorch 1 year
Reinforcement Learning 1 year

Required languages

Ukrainian Native
PyTorch Mobile, TensorRT, SNPE, AIMET, Tensorflow Lite, Unreal Engine, game development, UAV
Published 9 March
22 views
·
0 applications
To apply for this and other jobs on Djinni login or signup.
Loading...