Applied AI Engineer (Document Intelligence and Prompting) в кльовий продукт to $7000
Вітаю тебе, фахівець \0/
Мене звати Кирил, я допомагаю зібрати дрім тім для своїх друзів з Hooh – це новонароджений стартап від фаундерів Depositphotos. ІМХО, опортʼюніті дуже кльове.
отже
Hooh – це AI-first startup.
Ми бачимо, що зараз обʼєм та концентрація інфо, що обробляє людина – збільшується, та дуже скоро всі ми перейдемо на новий рівень узагальнення в комунікації та прийнятті рішень, аутсорснув AIшці колупатись в деталях.
Це як з одягом, котрий ми вже давно не робимо собі самі.
Почуваючи тренд, вирішили зіграти на упередження, та почали розробляти свою систему, яка буде обслуговувати ту саму генералізацію процесів, яка нас всіх чекає.
Але як і все велике починається з малого, ми теж стартуємо з чогось зрозумілого, від якого будемо надалі відштовхуватись.
Почали з AIшки, що допомагає фотографувати, сумарізувати та менеджити документи юзера.
Зараз дуже цікава стадія ресерчу, в якій ми крісталізуємо продукт, маючи на думці баланс між ультра фʼюча та чимось земним, сьогоденним.
Отже, гонимся за інновацією, а не за ROI.
(а я казав, що вакансія кльова)
Далі дозволю собі перемкнутись на англійську, бо мова піде про конкретні речі.
_________________
CEO about the role: “We are looking for an Applied AI Engineer who will help us make messy documents reliably understandable, build accurate structure and entity extraction, strong retrieval, and cost‑efficient model orchestration."
Key Responsibilities
- Document analysis & taxonomy: Systematically analyze layouts/sections/entities/relations; define categories, types, and metadata schemas that generalize across domains.
- Prompting & schemas: Author, version, and maintain prompts/chains for classification, extraction, summarization, and Q&A; enforce JSON/JSON‑Schema outputs.
- Retrieval (RAG): Build hybrid retrieval (embeddings + keyword + graph traversal); manage embedding generation, indexing, dedupe, and drift.
- Cascades & MoE: Architect model cascades (fast filters → experts → fallback LLMs) and MoE routing to balance quality/cost/latency.
- Agentic orchestration: Use CrewAI (or similar) to coordinate multi‑step pipelines; add caching/batching/streaming and robust retries.
- Result fusion: Combine outputs via reranking, voting, and confidence/consistency checks; add guardrails and safety rules.
- Evaluation & monitoring: Run LangSmith/Evals (or similar), define golden sets, automate regressions, track quality/cost/latency; canary and observe.
- Operate models locally/hosted: Work with vLLM/TGI/Ollama/llama.cpp as well as API models; apply quantization/LoRA when useful.
- Data stores: Use vector DBs plus graph and relational DBs to power retrieval and joins (e.g., Qdrant/Weaviate/Milvus/pgvector + Neo4j + PostgreSQL).
Required Skills & Experience
- Strong programming skills in Python or JavaScript/TypeScript; ability to write clear, tested, maintainable code.
- Experience building at least one LLM‑powered feature end‑to‑end (prototype → production), or equivalent open‑source/portfolio work.
- Hands‑on with RAG, vector embeddings, and evaluation (offline + online A/B, error analysis).
- Familiarity with CrewAI and with model cascading/MoE concepts (or ability to learn quickly).
- Practical database skills: comfortable with SQL and with either graph or vector systems.
- Product mindset: bias to measure impact and iterate.
We hire for capability and learning speed. If you’re strong on fundamentals and can show work, we’d love to talk, even if you don’t check every box.
Nice to have:
- OCR/Document AI, ontology design, labeling workflows.
- LangSmith/Evals, LangChain/LlamaIndex; Ray/Airflow; GPU basics.
- Security & privacy for AI systems (PII handling, GDPR), prompt/response guardrails.
The Team
- CEO
- Backend
- Front-end
- Prompt engineer
- ML/Data Scientist
- 2х Designers
- 2x iOS Devs
What We Offer
- Flexible schedule and fully remote work from anywhere with reliable overlap to CET.
- 18 paid vacation days, 8 no-paperwork sick days, and 11 public holidays per year.
- Minimal bureaucracy, no micromanagement, and swift decision-making.
- Direct influence on strategy and the ability to see your experiments ship fast.
- Budget for tools, courses, and conferences to keep your skills sharp.
- A team of product-obsessed people who value experimentation and knowledge-sharing.
Чекніть вимоги і якщо це все про вас – буду радий познайомитись та розповісти більше.