Middle AI Engineer
Ми шукаємо AI Engineer, який підсилить нашу команду розробки штучного інтелекту. Це роль не про "просте підключення APІ чи поверхеневий інжиніринг запитів", а про глибоку інженерну й системну рооту на інтеграцію LLM, розробкою аріхектурних даних.
Якщо ти зацікавлений у даній позиції, читай нижче опис по вимогам/задачам, та якщо ти відповідаєш вимогам, залишай резюме!
Вимоги до досвіду:
- досвід комерційної розробки: не менше 3 років;
Інструменти та технології: Python, REST API, OpenAPI/Swagger, JSON, Docker, PostgreSQL/MongoDB, Redis, CI/CD;
- впевнене володіння Python як основною мовою розробки;
Необхідна екосистема Python: Python 3.10+, FastAPI, Flask (як плюс), Pydantic, Pydantic AI, asyncio, aiohttp/httpx, requests, SQLAlchemy, Alembic, Celery/RQ, pytest, unittest, mypy, ruff, black, isort, pre-commit, logging, structlog, pathlib, typing, dataclasses;
- досвід розробки backend-сервісів, API та інтеграцій;
Інструменти та технології: FastAPI, REST API, WebSockets, SSE, OpenAPI/Swagger, Postman, JSON Schema, PostgreSQL, Redis, SQLAlchemy, Docker, docker-compose, GitHub Actions/GitLab CI;
- обов'язкове вміння самостійно писати чистий, підтримуваний та архітектурно коректний код без використання додаткових ШІ-інструментів (AI tools);
Необхідні знання: OOP (ООП), SOLID, DRY, KISS, YAGNI, dependency injection, clean architecture, layered architecture, design patterns, error handling, logging, unit/integration testing, code review;
- досвід роботи з Docker та базовою інфраструктурою розгортання;
Інструменти та технології: Docker, Docker Compose, Dockerfile, volumes, networks, multi-stage builds, environment variables, secrets, logs;
- досвід розробки ШІ-продуктів (AI products) на базі пропрієтарних моделей;
Інструменти та технології: OpenAI API, Anthropic Claude API, Google Gemini API, OpenRouter, LiteLLM;
- досвід розробки ШІ-продуктів на базі local-hosted моделей;
Інструменти та технології: vLLM, Ollama, llama.cpp, Text Generation Inference, Hugging Face Transformers, Hugging Face Hub, sentence-transformers, PyTorch, tokenizers, GGUF, AWQ, GPTQ, quantization, batching, streaming inference;
досвід роботи з vLLM / llama-серверами та налаштуванням параметрів інференсу;
Необхідні знання: context window, max tokens, temperature, top_p, top_k, repetition penalty, stop sequences, seed, batch size, concurrency, latency, throughput, tokens/sec, GPU memory, KV cache, cost per request;Інструменти: vLLM, Ollama, llama.cpp, TGI, Prometheus/Grafana (як плюс);
- досвід підбору моделей під робочі завдання;
Необхідні знання: порівняння моделей за якістю, вартістю, latency, context window, multilingual quality, tool calling, structured output, safety, hallucination rate;
Інструменти: OpenRouter, LiteLLM, Hugging Face Leaderboards, LMSYS/Chatbot Arena (як орієнтир), Langfuse, LangSmith, PromptFoo, DeepEval, Ragas;
- досвід роботи з vector RAG;
Інструменти та технології: LangChain, LangGraph, LlamaIndex, Haystack, Qdrant, Weaviate, Pinecone, Chroma, FAISS, pgvector, Elasticsearch/OpenSearch, BM25, hybrid search, re-ranking;
Необхідні знання: chunking strategy, embeddings, metadata filtering, query rewriting, retrieval evaluation, rerankers, grounding, citations, hallucination control;
- досвід роботи з graph RAG / knowledge graph RAG;
Інструменти та технології: Neo4j, NetworkX, GraphRAG, LangChain Graph QA, LlamaIndex Knowledge Graph, RDF/SPARQL (як плюс);
Необхідні знання: entity extraction, relationship extraction, graph traversal, semantic links, hybrid retrieval, context assembly;
- досвід побудови агентних систем;
Інструменти та технології: LangGraph, LangChain Agents, LlamaIndex Agents, CrewAI, AutoGen, Semantic Kernel, Pydantic AI, OpenAI function calling / tool calling, Anthropic tool use, MCP;
Необхідні знання: ReAct, planner-executor, supervisor pattern, multi-agent orchestration, memory, tool routing, state management, fallback logic, human-in-the-loop, guardrails;
- досвід роботи з AI workflow engine, обов'язково n8n;
Інструменти та технології: n8n, webhook nodes, HTTP Request node, AI Agent node, credentials, triggers, queues, error workflows, custom nodes, workflow versioning;
- досвід побудови evaluation та observability для LLM-продуктів;
Інструменти та технології: Langfuse, LangSmith, PromptFoo, Ragas, DeepEval, TruLens, Arize Phoenix, Weights & Biases Weave, Helicone, OpenTelemetry;
Метрики: accuracy, groundedness, relevance, faithfulness, hallucination rate, refusal rate, latency, cost per request, token usage, context utilization, regression rate;
- розуміння інформаційної безпеки при роботі з ШІ;
Необхідні знання: PII, sensitive data, prompt injection, data leakage, secrets management, RBAC, audit logs, sandboxing tools, vendor data policies;
- англійська мова: Не нижче Upper-Intermediate. Необхідна для читання документації, роботи з API, аналізу моделей, технічного листування та підготовки design docs.
Буде плюсом:
- знання Node.js;
- глибокі знання context engineering;
- глибокі знання NLP;
- досвід fine-tuning моделей.
Основні задачі:
- розробляти production-ready ШІ-сервіси, backend-компоненти, API та інтеграції для внутрішніх і зовнішніх ШІ-продуктів компанії;
- писати чистий, підтримуваний, тестований та архітурно коректний код на Python;
- проєктувати та реалізовувати сервіси на Python/FastAPI для роботи з LLM, RAG, агентними системами та workflow-автоматизацією;
- інтегрувати пропрієтарні моделі через API: OpenAI, Anthropic Claude, Google Gemini, Azure OpenAI, Mistral, OpenRouter та інші затверджені компанією сервіси;
- піднімати, налаштовувати та підтримувати local-hosted моделі через vLLM, Ollama, llama.cpp, TGI або аналогічні інструменти;
- підбирати моделі під конкретні бізнес-завдання з урахуванням якості, швидкості, вартості, latency, context window, доступності, безпеки та стабільності результату;
- налаштовувати параметри інференсу моделей: temperature, top_p, max tokens, context window, batching, streaming, concurrency, rate limits, retry logic;
- реалізовувати vector RAG-пайплайни: завантаження даних, очищення, chunking, embeddings, індексація, retrieval, reranking, генерація відповіді, оцінка якості;
- реалізовувати graph RAG / knowledge graph RAG-підходи для завдань, де потрібна робота зі зв'язками між сутностями, документами, користувачами, договорами, клієнтами або бізнес-процесами;
- работувати з векторними базами даних: Qdrant, Weaviate, Pinecone, Chroma, FAISS, pgvector;
- работувати з графовими базами та інструментами: Neo4j, NetworkX, GraphRAG-підходи;
- будувати агентні системи: single-agent, multi-agent, planner-executor, supervisor, tool-using agents, human-in-the-loop flows;
- реалізовувати tool/function calling, structured outputs, JSON schema validation, retry/fallback logic та безпечну обробку відповідей моделей;
- інтегрувати агентні системи з корпоративними інструментами: CRM, бази знань, документи, пошта, календар, Slack/Teams, Jira, Confluence, Google Drive, Microsoft 365, внутрішні API;
- проєктувати та впроваджувати AI workflow automation на базі n8n: webhooks, triggers, AI Agent nodes, HTTP nodes, credentials, error workflows, черги, інтеграції з зовнішніми системами;
- розробляти eval/regression-фреймворки для перевірки якості LLM-відповідей, промптів, RAG та агентних сценаріїв;
налаштовувати observability та моніторинг ШІ-систем: Langfuse, LangSmith, PromptFoo, Ragas, DeepEval, Arize Phoenix, Helicone, OpenTelemetry; - контролювати ключові метрики: latency, cost per request, token usage, groundedness, hallucination rate, relevance, accuracy, refusal rate, error rate, regression rate;
проводити технічні експерименти з моделями, промптами, RAG-підходами, агентними патернами та параметрами інференсу; - брати участь у завданнях з fine-tuning / model adaptation за наявності потреби: підготовка датасетів, навчання, валідація, порівняння результатів з baseline;
- спільно з Prompt Spec Engineer впроваджувати prompt/spec architecture в код, забезпечувати версіонування промптів, трасування, тестування та контроль якості;
- спільно з Product Manager переводити продуктові вимоги в технічну архітектуру, API-контракти, схеми даних та план реалізації;
- забезпечувати безпеку ШІ-сервісів: захист від prompt injection, контроль доступу, фільтрація чутливих даних, логування, аудит, безпечне зберігання секретів;
- підтримувати сервіси в production: аналізувати інциденти, виправляти помилки, оптимізувати продуктивність, знижувати вартість запитів, покращувати стабільність.
Що компанія пропонує:
- працюємо в сучасному та стильному офіс в ближньому центрі;
- безкоштовний корпоративний трансфер (дім-офіс-дім);
- забезпечуємо якісним та смачним кейтерингом прямо в офісі;
- корпоративні заняття йогою та медитацією + корпоративні знижки на здорове харчування;
- WELCOME bonus - фінансовий бонус від компанії на початку співпраці;
- релокейт пакет (оплата квитків у Львів + перший та останній місяць + рієлторські послуги).
Required languages
| English | B2 - Upper Intermediate |
| Ukrainian | Native |