InProject

Middle AI Engineer

$$$$
Product

Ми шукаємо AI Engineer, який підсилить нашу команду розробки штучного інтелекту. Це роль не про "просте підключення APІ чи поверхеневий інжиніринг запитів", а про глибоку інженерну й системну рооту на інтеграцію LLM, розробкою аріхектурних даних.
Якщо ти зацікавлений у даній позиції, читай нижче опис по вимогам/задачам, та якщо ти відповідаєш вимогам, залишай резюме!

Вимоги до досвіду:

  • досвід комерційної розробки: не менше 3 років;
    Інструменти та технології: Python, REST API, OpenAPI/Swagger, JSON, Docker, PostgreSQL/MongoDB, Redis, CI/CD;
     
  • впевнене володіння Python як основною мовою розробки;
    Необхідна екосистема Python: Python 3.10+, FastAPI, Flask (як плюс), Pydantic, Pydantic AI, asyncio, aiohttp/httpx, requests, SQLAlchemy, Alembic, Celery/RQ, pytest, unittest, mypy, ruff, black, isort, pre-commit, logging, structlog, pathlib, typing, dataclasses;
     
  • досвід розробки backend-сервісів, API та інтеграцій;
    Інструменти та технології: FastAPI, REST API, WebSockets, SSE, OpenAPI/Swagger, Postman, JSON Schema, PostgreSQL, Redis, SQLAlchemy, Docker, docker-compose, GitHub Actions/GitLab CI;
     
  • обов'язкове вміння самостійно писати чистий, підтримуваний та архітектурно коректний код без використання додаткових ШІ-інструментів (AI tools);
    Необхідні знання: OOP (ООП), SOLID, DRY, KISS, YAGNI, dependency injection, clean architecture, layered architecture, design patterns, error handling, logging, unit/integration testing, code review;
     
  • досвід роботи з Docker та базовою інфраструктурою розгортання;
    Інструменти та технології: Docker, Docker Compose, Dockerfile, volumes, networks, multi-stage builds, environment variables, secrets, logs;
     
  • досвід розробки ШІ-продуктів (AI products) на базі пропрієтарних моделей;
    Інструменти та технології: OpenAI API, Anthropic Claude API, Google Gemini API, OpenRouter, LiteLLM;
     
  • досвід розробки ШІ-продуктів на базі local-hosted моделей;
    Інструменти та технології: vLLM, Ollama, llama.cpp, Text Generation Inference, Hugging Face Transformers, Hugging Face Hub, sentence-transformers, PyTorch, tokenizers, GGUF, AWQ, GPTQ, quantization, batching, streaming inference;
     
  • досвід роботи з vLLM / llama-серверами та налаштуванням параметрів інференсу;
    Необхідні знання: context window, max tokens, temperature, top_p, top_k, repetition penalty, stop sequences, seed, batch size, concurrency, latency, throughput, tokens/sec, GPU memory, KV cache, cost per request;

    Інструменти: vLLM, Ollama, llama.cpp, TGI, Prometheus/Grafana (як плюс);
     

  • досвід підбору моделей під робочі завдання;
    Необхідні знання: порівняння моделей за якістю, вартістю, latency, context window, multilingual quality, tool calling, structured output, safety, hallucination rate;
    Інструменти: OpenRouter, LiteLLM, Hugging Face Leaderboards, LMSYS/Chatbot Arena (як орієнтир), Langfuse, LangSmith, PromptFoo, DeepEval, Ragas;
     
  • досвід роботи з vector RAG;
    Інструменти та технології: LangChain, LangGraph, LlamaIndex, Haystack, Qdrant, Weaviate, Pinecone, Chroma, FAISS, pgvector, Elasticsearch/OpenSearch, BM25, hybrid search, re-ranking;
    Необхідні знання: chunking strategy, embeddings, metadata filtering, query rewriting, retrieval evaluation, rerankers, grounding, citations, hallucination control;
     
  • досвід роботи з graph RAG / knowledge graph RAG;
    Інструменти та технології: Neo4j, NetworkX, GraphRAG, LangChain Graph QA, LlamaIndex Knowledge Graph, RDF/SPARQL (як плюс);
    Необхідні знання: entity extraction, relationship extraction, graph traversal, semantic links, hybrid retrieval, context assembly;
     
  • досвід побудови агентних систем;
    Інструменти та технології: LangGraph, LangChain Agents, LlamaIndex Agents, CrewAI, AutoGen, Semantic Kernel, Pydantic AI, OpenAI function calling / tool calling, Anthropic tool use, MCP;
    Необхідні знання: ReAct, planner-executor, supervisor pattern, multi-agent orchestration, memory, tool routing, state management, fallback logic, human-in-the-loop, guardrails;
     
  • досвід роботи з AI workflow engine, обов'язково n8n;
    Інструменти та технології: n8n, webhook nodes, HTTP Request node, AI Agent node, credentials, triggers, queues, error workflows, custom nodes, workflow versioning;
     
  • досвід побудови evaluation та observability для LLM-продуктів;
    Інструменти та технології: Langfuse, LangSmith, PromptFoo, Ragas, DeepEval, TruLens, Arize Phoenix, Weights & Biases Weave, Helicone, OpenTelemetry;
    Метрики: accuracy, groundedness, relevance, faithfulness, hallucination rate, refusal rate, latency, cost per request, token usage, context utilization, regression rate;
     
  • розуміння інформаційної безпеки при роботі з ШІ;
    Необхідні знання: PII, sensitive data, prompt injection, data leakage, secrets management, RBAC, audit logs, sandboxing tools, vendor data policies;
     
  • англійська мова: Не нижче Upper-Intermediate. Необхідна для читання документації, роботи з API, аналізу моделей, технічного листування та підготовки design docs.
     

Буде плюсом:

  • знання Node.js;
  • глибокі знання context engineering;
  • глибокі знання NLP;
  • досвід fine-tuning моделей.

 

Основні задачі:

  • розробляти production-ready ШІ-сервіси, backend-компоненти, API та інтеграції для внутрішніх і зовнішніх ШІ-продуктів компанії;
  • писати чистий, підтримуваний, тестований та архітурно коректний код на Python;
  • проєктувати та реалізовувати сервіси на Python/FastAPI для роботи з LLM, RAG, агентними системами та workflow-автоматизацією;
  • інтегрувати пропрієтарні моделі через API: OpenAI, Anthropic Claude, Google Gemini, Azure OpenAI, Mistral, OpenRouter та інші затверджені компанією сервіси;
  • піднімати, налаштовувати та підтримувати local-hosted моделі через vLLM, Ollama, llama.cpp, TGI або аналогічні інструменти;
  • підбирати моделі під конкретні бізнес-завдання з урахуванням якості, швидкості, вартості, latency, context window, доступності, безпеки та стабільності результату;
  • налаштовувати параметри інференсу моделей: temperature, top_p, max tokens, context window, batching, streaming, concurrency, rate limits, retry logic;
  • реалізовувати vector RAG-пайплайни: завантаження даних, очищення, chunking, embeddings, індексація, retrieval, reranking, генерація відповіді, оцінка якості;
  • реалізовувати graph RAG / knowledge graph RAG-підходи для завдань, де потрібна робота зі зв'язками між сутностями, документами, користувачами, договорами, клієнтами або бізнес-процесами;
  • работувати з векторними базами даних: Qdrant, Weaviate, Pinecone, Chroma, FAISS, pgvector;
  • работувати з графовими базами та інструментами: Neo4j, NetworkX, GraphRAG-підходи;
  • будувати агентні системи: single-agent, multi-agent, planner-executor, supervisor, tool-using agents, human-in-the-loop flows;
  • реалізовувати tool/function calling, structured outputs, JSON schema validation, retry/fallback logic та безпечну обробку відповідей моделей;
  • інтегрувати агентні системи з корпоративними інструментами: CRM, бази знань, документи, пошта, календар, Slack/Teams, Jira, Confluence, Google Drive, Microsoft 365, внутрішні API;
  • проєктувати та впроваджувати AI workflow automation на базі n8n: webhooks, triggers, AI Agent nodes, HTTP nodes, credentials, error workflows, черги, інтеграції з зовнішніми системами;
  • розробляти eval/regression-фреймворки для перевірки якості LLM-відповідей, промптів, RAG та агентних сценаріїв;
    налаштовувати observability та моніторинг ШІ-систем: Langfuse, LangSmith, PromptFoo, Ragas, DeepEval, Arize Phoenix, Helicone, OpenTelemetry;
  • контролювати ключові метрики: latency, cost per request, token usage, groundedness, hallucination rate, relevance, accuracy, refusal rate, error rate, regression rate;
    проводити технічні експерименти з моделями, промптами, RAG-підходами, агентними патернами та параметрами інференсу;
  • брати участь у завданнях з fine-tuning / model adaptation за наявності потреби: підготовка датасетів, навчання, валідація, порівняння результатів з baseline;
  • спільно з Prompt Spec Engineer впроваджувати prompt/spec architecture в код, забезпечувати версіонування промптів, трасування, тестування та контроль якості;
  • спільно з Product Manager переводити продуктові вимоги в технічну архітектуру, API-контракти, схеми даних та план реалізації;
  • забезпечувати безпеку ШІ-сервісів: захист від prompt injection, контроль доступу, фільтрація чутливих даних, логування, аудит, безпечне зберігання секретів;
  • підтримувати сервіси в production: аналізувати інциденти, виправляти помилки, оптимізувати продуктивність, знижувати вартість запитів, покращувати стабільність.

 

Що компанія пропонує:

  • працюємо в сучасному та стильному офіс в ближньому центрі;
  • безкоштовний корпоративний трансфер (дім-офіс-дім);
  • забезпечуємо якісним та смачним кейтерингом прямо в офісі;
  • корпоративні заняття йогою та медитацією + корпоративні знижки на здорове харчування;
  • WELCOME bonus - фінансовий бонус від компанії на початку співпраці;
  • релокейт пакет (оплата квитків у Львів + перший та останній місяць + рієлторські послуги).

Required languages

English B2 - Upper Intermediate
Ukrainian Native
LLM, Python, AI, LLM/Llama/Mistral/GPT/RAG/FAISS
Published 22 June
32 views
·
3 applications
Last responded 18 minutes ago
To apply for this and other jobs on Djinni login or signup.
Loading...