Machine Learning Engineer (Reinforcement Learning) $$$$

Miltech Company Responds Quickly

MilTech 🪖

Ми — українська MilTech-компанія, що створює майбутнє оборонних технологій. Ми розробляємо та виробляємо безпілотні системи й технологічні рішення, що вже довели свою ефективність у реальних бойових умовах.

Наш відділ R&D об’єднує кращих інженерів, конструкторів, фахівців з RF і Hardware та багатьох інших. Завдяки власним виробничим потужностям ми забезпечуємо швидкий цикл впровадження інновацій — від ідеї до масового виробництва. Кожне оновлення продукту базується на прямому фідбеку від військових, що дозволяє нам створювати максимально актуальні рішення.

Твій виклик: Last Mile Targeting

Ми не граємо в симуляції заради статей на ArXiv. Твоє завдання — створити «мізки» дрона, здатні довести апарат до цілі в умовах повного РЕБ, шквального вітру та критичного браку обчислювальних ресурсів.

Це робота на межі можливостей: запуск RL-агентів на Raspberry Pi та подолання Sim2Real gap так, щоб модель не «втрачала» ціль через туман чи вібрації. Ми даємо тобі повний карт-бланш на архітектуру з нуля.

Що ти будеш робити:

End-to-End Pipeline: Побудова архітектури навчання від симулятора до деплою на реальне залізо.
RL Control: Розробка моделей керування (PPO, SAC, TD3), що приймають рішення на основі відеопотоку та сенсорів у real-time.
Sensor Fusion: Реалізація стабільного керування (Kalman Filters або RL-native підходи) у зв'язці з Sensor Engineers.
Sim2Real & Domain Randomization: Створення симуляційного середовища (Isaac Gym / AirSim / Custom UE) з глибокою рандомізацією для роботи в екстремальну погоду (сніг, дощ, низька видимість).
Optimization: Квантування та прунінг моделей для досягнення стабільного FPS на обмежених ресурсах (Raspberry Pi, NVIDIA Jetson).

Наш ідеальний кандидат:

Має досвід з RL-алгоритмами та розуміє, як змусити їх працювати в реальних системах.
Знає, як наблизити фізику симулятора до реальності, щоб мінімізувати Gap при переносі на борт.
Розуміє обмеження компактних комп’ютерів і вміє боротися за кожну мілісекунду інференсу.
Готовий бути архітектором: самостійно обирати стек, симулятор та підхід.

Розглядаємо також: якщо ти маєш міцний бекграунд у CV/ML та досвід з дронами, але хочеш «увірватися» саме в Reinforcement Learning.

Буде плюсом: Досвід з TensorRT, PyTorch Mobile, SNPE, AIMET, Tensorflow Lite, gamedev (UE) або безпосередньо з БПЛА різних типів.

Чому варто приєднатися:

Прямий вплив: Твій код буде «в полі» вже за лічені тижні, безпосередньо впливаючи на хід подій.
Свобода та ресурси: Ти сам обираєш інструменти. Ми оплачуємо участь у топових конференціях (CVPR, NeurIPS, ICRA) та профільне навчання.
R&D Полігон: Можливість миттєво тестувати гіпотези на реальних апаратах у найскладніших погодних умовах.
Команда: Працюй пліч-о-пліч з експертами з GNC, RF, Hardware та топовими C++ розробниками.
Стабільність: Офіційне працевлаштування, «біла» зарплата та бронювання.
Турбота: Медичне страхування, 24 дні відпустки + додатковий вихідний на день народження.
Self-care: Повна оплата лікарняних та 3 дні self-care на рік без жодних довідок.
Розвиток: Корпоративна бібліотека, курси англійської, навчання Hard & Soft skills.

Готовий навчити дрони перемагати? Чекаємо на твоє CV!

Required skills experience

Python	2 years
PyTorch	1 year
Reinforcement Learning	1 year

Required languages

Ukrainian

Native

PyTorch Mobile, TensorRT, SNPE, AIMET, Tensorflow Lite, Unreal Engine, game development, UAV

Published 9 March

65 views

3 applications

Response activity: Very high

Last responded 3 days ago

To apply for this and other jobs on Djinni login or signup.

Only from 2 years of experience
Office Work
Ukraine
Countries where we consider candidates
- Ukrainian Native

Data Science

Python	2 years
PyTorch	1 year
Reinforcement Learning	1 year

Employment: Fulltime
Domain: MilTech
Product
Office: Ukraine (Kyiv)

Apply for the job

Response activity: Very high

Last responded 3 days ago

📊 Average salary range of similar jobs in analytics →