Middle AI Engineer

to $4000

Product

Ми шукаємо AI Engineer, який підсилить нашу команду розробки штучного інтелекту. Це роль не про "просте підключення APІ чи поверхеневий інжиніринг запитів", а про глибоку інженерну й системну рооту на інтеграцію LLM, розробкою аріхектурних даних.
Якщо ти зацікавлений у даній позиції, читай нижче опис по вимогам/задачам, та якщо ти відповідаєш вимогам, залишай резюме!

Вимоги до досвіду:

досвід комерційної розробки: не менше 3 років;
Інструменти та технології: Python, REST API, OpenAPI/Swagger, JSON, Docker, PostgreSQL/MongoDB, Redis, CI/CD;
впевнене володіння Python як основною мовою розробки;
Необхідна екосистема Python: Python 3.10+, FastAPI, Flask (як плюс), Pydantic, Pydantic AI, asyncio, aiohttp/httpx, requests, SQLAlchemy, Alembic, Celery/RQ, pytest, unittest, mypy, ruff, black, isort, pre-commit, logging, structlog, pathlib, typing, dataclasses;
досвід розробки backend-сервісів, API та інтеграцій;
Інструменти та технології: FastAPI, REST API, WebSockets, SSE, OpenAPI/Swagger, Postman, JSON Schema, PostgreSQL, Redis, SQLAlchemy, Docker, docker-compose, GitHub Actions/GitLab CI;
обов'язкове вміння самостійно писати чистий, підтримуваний та архітектурно коректний код без використання додаткових ШІ-інструментів (AI tools);
Необхідні знання: OOP (ООП), SOLID, DRY, KISS, YAGNI, dependency injection, clean architecture, layered architecture, design patterns, error handling, logging, unit/integration testing, code review;
досвід роботи з Docker та базовою інфраструктурою розгортання;
Інструменти та технології: Docker, Docker Compose, Dockerfile, volumes, networks, multi-stage builds, environment variables, secrets, logs;
досвід розробки ШІ-продуктів (AI products) на базі пропрієтарних моделей;
Інструменти та технології: OpenAI API, Anthropic Claude API, Google Gemini API, OpenRouter, LiteLLM;
досвід розробки ШІ-продуктів на базі local-hosted моделей;
Інструменти та технології: vLLM, Ollama, llama.cpp, Text Generation Inference, Hugging Face Transformers, Hugging Face Hub, sentence-transformers, PyTorch, tokenizers, GGUF, AWQ, GPTQ, quantization, batching, streaming inference;
досвід роботи з vLLM / llama-серверами та налаштуванням параметрів інференсу;
Необхідні знання: context window, max tokens, temperature, top_p, top_k, repetition penalty, stop sequences, seed, batch size, concurrency, latency, throughput, tokens/sec, GPU memory, KV cache, cost per request;
Інструменти: vLLM, Ollama, llama.cpp, TGI, Prometheus/Grafana (як плюс);
досвід підбору моделей під робочі завдання;
Необхідні знання: порівняння моделей за якістю, вартістю, latency, context window, multilingual quality, tool calling, structured output, safety, hallucination rate;
Інструменти: OpenRouter, LiteLLM, Hugging Face Leaderboards, LMSYS/Chatbot Arena (як орієнтир), Langfuse, LangSmith, PromptFoo, DeepEval, Ragas;
досвід роботи з vector RAG;
Інструменти та технології: LangChain, LangGraph, LlamaIndex, Haystack, Qdrant, Weaviate, Pinecone, Chroma, FAISS, pgvector, Elasticsearch/OpenSearch, BM25, hybrid search, re-ranking;
Необхідні знання: chunking strategy, embeddings, metadata filtering, query rewriting, retrieval evaluation, rerankers, grounding, citations, hallucination control;
досвід роботи з graph RAG / knowledge graph RAG;
Інструменти та технології: Neo4j, NetworkX, GraphRAG, LangChain Graph QA, LlamaIndex Knowledge Graph, RDF/SPARQL (як плюс);
Необхідні знання: entity extraction, relationship extraction, graph traversal, semantic links, hybrid retrieval, context assembly;
досвід побудови агентних систем;
Інструменти та технології: LangGraph, LangChain Agents, LlamaIndex Agents, CrewAI, AutoGen, Semantic Kernel, Pydantic AI, OpenAI function calling / tool calling, Anthropic tool use, MCP;
Необхідні знання: ReAct, planner-executor, supervisor pattern, multi-agent orchestration, memory, tool routing, state management, fallback logic, human-in-the-loop, guardrails;
досвід роботи з AI workflow engine, обов'язково n8n;
Інструменти та технології: n8n, webhook nodes, HTTP Request node, AI Agent node, credentials, triggers, queues, error workflows, custom nodes, workflow versioning;
досвід побудови evaluation та observability для LLM-продуктів;
Інструменти та технології: Langfuse, LangSmith, PromptFoo, Ragas, DeepEval, TruLens, Arize Phoenix, Weights & Biases Weave, Helicone, OpenTelemetry;
Метрики: accuracy, groundedness, relevance, faithfulness, hallucination rate, refusal rate, latency, cost per request, token usage, context utilization, regression rate;
розуміння інформаційної безпеки при роботі з ШІ;
Необхідні знання: PII, sensitive data, prompt injection, data leakage, secrets management, RBAC, audit logs, sandboxing tools, vendor data policies;
англійська мова: Не нижче Upper-Intermediate. Необхідна для читання документації, роботи з API, аналізу моделей, технічного листування та підготовки design docs.

Буде плюсом:

знання Node.js;
глибокі знання context engineering;
глибокі знання NLP;
досвід fine-tuning моделей.

Основні задачі:

розробляти production-ready ШІ-сервіси, backend-компоненти, API та інтеграції для внутрішніх і зовнішніх ШІ-продуктів компанії;
писати чистий, підтримуваний, тестований та архітурно коректний код на Python;
проєктувати та реалізовувати сервіси на Python/FastAPI для роботи з LLM, RAG, агентними системами та workflow-автоматизацією;
інтегрувати пропрієтарні моделі через API: OpenAI, Anthropic Claude, Google Gemini, Azure OpenAI, Mistral, OpenRouter та інші затверджені компанією сервіси;
піднімати, налаштовувати та підтримувати local-hosted моделі через vLLM, Ollama, llama.cpp, TGI або аналогічні інструменти;
підбирати моделі під конкретні бізнес-завдання з урахуванням якості, швидкості, вартості, latency, context window, доступності, безпеки та стабільності результату;
налаштовувати параметри інференсу моделей: temperature, top_p, max tokens, context window, batching, streaming, concurrency, rate limits, retry logic;
реалізовувати vector RAG-пайплайни: завантаження даних, очищення, chunking, embeddings, індексація, retrieval, reranking, генерація відповіді, оцінка якості;
реалізовувати graph RAG / knowledge graph RAG-підходи для завдань, де потрібна робота зі зв'язками між сутностями, документами, користувачами, договорами, клієнтами або бізнес-процесами;
работувати з векторними базами даних: Qdrant, Weaviate, Pinecone, Chroma, FAISS, pgvector;
работувати з графовими базами та інструментами: Neo4j, NetworkX, GraphRAG-підходи;
будувати агентні системи: single-agent, multi-agent, planner-executor, supervisor, tool-using agents, human-in-the-loop flows;
реалізовувати tool/function calling, structured outputs, JSON schema validation, retry/fallback logic та безпечну обробку відповідей моделей;
інтегрувати агентні системи з корпоративними інструментами: CRM, бази знань, документи, пошта, календар, Slack/Teams, Jira, Confluence, Google Drive, Microsoft 365, внутрішні API;
проєктувати та впроваджувати AI workflow automation на базі n8n: webhooks, triggers, AI Agent nodes, HTTP nodes, credentials, error workflows, черги, інтеграції з зовнішніми системами;
розробляти eval/regression-фреймворки для перевірки якості LLM-відповідей, промптів, RAG та агентних сценаріїв;
налаштовувати observability та моніторинг ШІ-систем: Langfuse, LangSmith, PromptFoo, Ragas, DeepEval, Arize Phoenix, Helicone, OpenTelemetry;
контролювати ключові метрики: latency, cost per request, token usage, groundedness, hallucination rate, relevance, accuracy, refusal rate, error rate, regression rate;
проводити технічні експерименти з моделями, промптами, RAG-підходами, агентними патернами та параметрами інференсу;
брати участь у завданнях з fine-tuning / model adaptation за наявності потреби: підготовка датасетів, навчання, валідація, порівняння результатів з baseline;
спільно з Prompt Spec Engineer впроваджувати prompt/spec architecture в код, забезпечувати версіонування промптів, трасування, тестування та контроль якості;
спільно з Product Manager переводити продуктові вимоги в технічну архітектуру, API-контракти, схеми даних та план реалізації;
забезпечувати безпеку ШІ-сервісів: захист від prompt injection, контроль доступу, фільтрація чутливих даних, логування, аудит, безпечне зберігання секретів;
підтримувати сервіси в production: аналізувати інциденти, виправляти помилки, оптимізувати продуктивність, знижувати вартість запитів, покращувати стабільність.

Що компанія пропонує:

працюємо в сучасному та стильному офіс в ближньому центрі;
безкоштовний корпоративний трансфер (дім-офіс-дім);
забезпечуємо якісним та смачним кейтерингом прямо в офісі;
корпоративні заняття йогою та медитацією + корпоративні знижки на здорове харчування;
WELCOME bonus - фінансовий бонус від компанії на початку співпраці;
релокейт пакет (оплата квитків у Львів + перший та останній місяць + рієлторські послуги).

Required languages

English B2 - Upper Intermediate

Ukrainian Native

LLM, Python, AI, LLM/Llama/Mistral/GPT/RAG/FAISS

Published 22 June · Updated 23 July

219 views

23 applications

Response activity: High

Last responded 2 days ago

See stats of candidates who applied for this job 👀

See applicant insights

To apply for this and other jobs on Djinni login or signup.

from 3 years of experience

Considering with 2 years of experience
$3000-4000
Office Work
Ukraine
Countries where we consider candidates
- English B2 - Upper Intermediate
- Ukrainian Native

ML / AI

Employment: Fulltime
Domain: Other
Product
Office: Ukraine (Lviv)

Response activity: High

Last responded 2 days ago

📊 Average salary range of similar jobs in analytics →