Machine Learning Engineer (Prom.ua)
Prom.ua – найбільший маркетплейс України, де продаються понад 200 млн товарів від десятків тисяч підприємців з усієї країни.
На Prom.ua:
- кожен покупець може знайти все, що потрібно, за найкращою ціною: від зубної щітки до культиватора для саду та городу.
- кожен підприємець може продавати товари в каталозі маркетплейса, на сайті, створеному на платформі Prom та у мобільному додатку "Prom покупки".
Prom.ua в цифрах:
- щодня маркетплейс відвідують 4,8 млн осіб
- на маркетплейсі працюють понад 60 тис. компаній
- у каталозі 200 млн товарів
Про команду Data Science
Ми оптимізуємо різні частини продукту, використовуючи дані і алгоритми машинного навчання. Паралельно розбудовуємо ШІ-системи, що надають стратегічну перевагу компанії і допомагають їй слідувати візії - створення комерції майбутнього.
Зараз в команді 5 людей:
- 2 Senior Data Scientist,
- Middle Data Scientist,
- Senior Machine Learning Engineer,
- Team Lead.
Напрямки роботи команди:
- Рекомендації товарів і персоналізація,
- Згортання товарів в продуктові моделі,
- Автоматична оцінка якості та модерація контенту товарів: категоризація, машинний переклад, автозаповнення характеристик, генерація контенту,
- Пошук та ML-ранжування,
- Генерація і лінкування тегів для SEO.
Особливості роботи в команді
- активно занурюємось в продуктове середовище, тісно взаємодіємо з іншими командами - > мало досліджень йде під стіл, багато моделей в production;
- розуміємо поставлені цілі, орієнтуємось на результат -> модельки роблять те, що потрібно, і не роблять те, що не потрібно;
- мінімальна бюрократія, можна обирати задачки, які більше лежать до душі, заохочуємо ініціативу, але й розраховуємо на відповідальність за результат;
- фокусуємось на розбудові інфраструктури для більшої надійності рішень, автоматизації рутини і щоб легше було впроваджувати моделі з нуля;
- більшість проєктів версіонуємо і документуємо, це допомагає комфортно працювати паралельно декільком спеціалістам;
- багато працюємо в команді, віримо у зворотній звʼязок і підтримку, жартуємо жарти;
- обмінюємось досвідом: проводимо авторські курси, презентуємо свої проєкти, влаштовуємо брейн-шторми.
Розбудовуємо тісні зв’язки з командами розробки, тестування та аналітиками.
Для повсякденної роботи піднятий JupyterHub сервер з можливістю задавати необхідні характеристики робочого середовища, можна працювати на локальній машині. Маємо свої сервери з відеокартами для навчання і розгортання моделей.
Проєкти з технічного боку:
Мова програмування: Python
Аналіз і обробка даних: Jupyter Notebook, Pandas, NumPy
Machine Learning і Deep Learning: Scikit-learn, TensorFlow, PyTorch, FAISS, XGBoost
LLM API: Gemini, ChatGPT
Візуалізація даних і моніторинг: Matplotlib, Seaborn, Plotly, Bokeh, Tableau, Grafana
Бази даних: Postgres
Big Data і розподілені обчислення: Apache Spark, Hadoop
MLOps: MLflow, DVC, TensorFlow Serving, Python packaging, Fast API, uv
Даги: Airflow
Черги даних: Kafka
Пошук: Elasticsearch
Для даної ролі важливо:
- досвід класифікації/сегментації/генерації текстів як класичними методами, так і deep learning;
- досвід роботи з фреймворками для розробки нейромереж (PyTorch/TensorFlow);
- досвідченість у роботі з машинним навчанням: постановка задачі, збір і дослідження даних (PySpark, pandas), тренування моделі, оцінка результатів, аналіз роботи моделі, підготовка до розгортання;
- досвід розгортання та супроводження моделі в production, покращення вже існуючих моделей;
- вміння писати надійний і чистий код на python, розуміння і використання різних структур даних, OOP, а також, володіння VC (Git etc); користування лінтерами (ruff) і інструментами перевірки типів даних (mypy);
- досвід роботи з Docker, пакетними менеджерами (uv, pdm), CI/CD;
- готовність глибоко занурюватись в бізнес-задачі і перетворювати їх на технічні рішення (архітектура, функції втрат, метрики і т.д.);
- відповідальність та уважність до деталей;
- вміння тестувати свої рішення і забезпечувати їх безперебійну роботу.
Що буде плюсом:
- досвід навчання моделей на обʼємах даних, що значно перевищують обсяг оперативної пам'яті, досвід з високонавантаженими системами, Big Data і розподіленими обчисленнями;
- досвід побудови ETL-процесів, зокрема повʼязаних з регулярним перенавчанням моделей;
- досвід у застосуванні практик MLOps: контроль версій коду, даних і моделей, автоматичного розгортання, моніторингу і логування, тестування моделей, перенавчання моделей;
- досвід роботи з ембедингами і ANN.
Можливі задачі:
- розвиток системи класифікації товарів,
- масштабування привʼязки товарів до продуктових моделей,
- покращення моделі ранжування товарів у пошуковій видачі,
- дослідження нових напрямків застосування машинного навчання для вирішення задач бізнесу.
Режим роботи:
- режим роботи змішаний, практикуємо регулярні відвідування офісу в Києві,
- працюємо в зручний час, важливо бути на зв’язку з 11:00 до 18:00 і бути присутнім на зустрічах.
Етапи відбору:
- Знайомство.
- Технічне інтерв’ю.
- Фінальне інтерв’ю.
Про роботу в EVO:
- Соціальний пакет — офіційне працевлаштування, 24 дні оплачуваної відпустки на рік і необмежена кількість лікарняних, щоб ви могли відпочивати та дбати про своє здоров’я.
- Турбота про здоров’я — ми покриваємо медичне страхування та пропонуємо підтримку корпоративного психолога, адже переконані, що піклування про ментальне здоров’я є так само важливим, як і про фізичне.
- Гнучкий формат роботи — віддалено або в офісі. Ви можете працювати дистанційно або відвідувати наш затишний офіс в Києві, який повністю енергонезалежний та оснащений усім необхідним.
- Волонтерська спільнота – ми регулярно проводимо благодійні аукціони, збираємо гроші на дрони-розвідники та підтримуємо волонтерські ініціативи співробітників.
- Ми надаємо рівні можливості для всіх – тому не допускаємо дискримінації за будь-якими ознаками. Також ми відкриті до співпраці з ветеранами/ветеранками та готові підтримати їх на шляху до нових професійних досягнень.
- Можливість навчання та професійного зростання. Чесність та відкритість у всіх комунікаціях. Конструктивний зворотний зв’язок за результатами роботи. Підтримка лідера і команди.