ML/AI Engineer (LLM, RAG, Agentic Tools)

MilTech 🪖

Шукаємо фахівця, який буде відповідати за розробку та супровід комплексної AI-powered пошукової системи на основі великої інтерактивної бази знань. У системі реалізовано tool calling та agentic behaviour, що працюють із внутрішніми інструментами та різними типами сховищ: векторними базами для семантичного пошуку, документоорієнтованими для повнотекстового пошуку, а також реляційними та графовими базами для пошуку за конкретними ідентифікаторами. Інтерфейс пошуку побудовано у форматі LLM-powered чату, який підтримує запити natural language і повертає аргументовані висновки, рекомендації та посилання на першоджерела. 

У зону відповідальності кандидата входитиме проєктування та впровадження повного пайплайну LLM-powered пошуку, включно з orchestration, reasoning, reranking, tool calling, обробкою відповідей інструментів, валідацією результатів та формуванням фінальних відповідей для користувача. 

Ми очікуємо, що кандидат: 

  • Має практичний комерційний досвід роботи з vLLM у self-hosted середовищах, включно з оптимізацією моделей на GPU H100/200, розумінням принципів GPU-архітектур та поведінки кешу під продакшн-навантаженням. 
  • Глибоко розуміє концепцію RAG та має досвід успішного впровадження подібних рішень у продакшені. 
  • Працював з Haystack / LlamaIndex / LangChain або аналогічними фреймворками та орієнтується в принципових відмінностях між ними. 
  • Має досвід використання MCP та роботи з LLM, які викликають зовнішні інструменти й сервіси. 
  • Володіє Python на високому рівні: архітектурні принципи, шаблони проєктування, багатопоточність, асинхронність, сучасні практики тестування, а також досвід експлуатації систем під навантаженням (моніторинг, оптимізація пам'яті, телеметрія). 
  • Має досвід роботи з документоорієнтованими, реляційними та векторними базами даних, включно з розумінням типів індексів і відповідних сценаріїв застосування. 

     

Буде плюсом: 

  • Досвід створення або підтримки баз знань, систем генерації звітів на базі AI, розробка чатботів із великим контекстним вікном.
  • Досвід навчання або fine-tuning LLM чи компактних моделей для специфічних задач. 
  • Практичний досвід у DevOps: CI/CD, Kubernetes, Helm, ArgoCD. 
  • Досвід розробки систем на основі OCR та Vision-Language моделей для обробки неструктурованих даних. 
  • Досвід у data engineering: розуміння ETL/ELT-процесів, робота з оркестраторами (Airflow, Temporal, Prefect) та системами розподіленого обчислення (Ray.io, Spark). 
  • Досвід роботи з Elasticsearch, MongoDB, PostgreSQL, Qdrant/Milvus, Neo4j та іншими СУБД. 
  • Розуміння процесів кібербезпеки та сучасних підходів до захисту даних. 
     

Пропонуємо повністю віддалений формат роботи над власним продуктом, який використовує найсучасніші технології та орієнтований на державний сектор. Компанія має статус критично важливої для Збройних сил України. За потреби надаємо бронювання та необхідну офісну техніку.

Required languages

English B2 - Upper Intermediate
Published 1 December
40 views
·
1 application
100% read
To apply for this and other jobs on Djinni login or signup.
Loading...