Middle Data Scientist (offline)

EVO Ukrainian Product 🇺🇦
Prom.ua в цифрах:
- 20 млн переглядів сторінок щодня (260 млн подій при цьому)
- 100 млн запитів на пошукову видачу щомісяця
- Трафік в місяць близько 90 млн сесій
- В онлайні максимум одночасно 17 тис. користувачів

Про команду:
- ML пошук
- Автоматична модерація товарів у каталозі
- Рекомендації товарів та персоналізація
- Пошук дублікатів товарів
- Антифрод та інші

Технічний стек проекту, що вже використовуємо:
- ML сервіси: Tensorflow/Scikit Learn/Spark MLlib (як фреймворки навчання моделей) + FastAPI/Aiohttp (як фреймворки для веб обгортки) + Annoy/Faiss (для пошуку схожих векторів).
- Для роботи з великими даними: Python + Pyspark (як фреймворк обробки) + HDFS (як сторедж) + Airflow(шедулер) + JupyterHub і notebooks (середовище для експериментів/тестування гіпотез).
- Для роботи з пошуком: ElasticSearch (як пошуковий движок) + Python/Kotlin/Java (для написання сервісів/плагінів) + Kafka (як шина даних).

Що важливо для даної ролі в проекті:
- від 2 років досвіду роботи у машинному навчанні: постановка задачі, збір датасету, тренування моделі, оцінка точності результатів;
- досвід з Natural language processing, text representation techniques;
- вміння писати надійний і чистий код на python, розуміння і використання різних структур даних, OOP, а також, володіння VC (Git etc);
- досвід роботи з базами даних, SQL-запити.

Буде перевагою:
- Взагалі ідеально, якщо ви маєте досвід роботи з великими об’ємами даних та Elasticsearch;
- Досвід деплойменту моделей;
- Досвід роботи з нейронними мережами для роботи з текстом.

Задачі в проекті:
- Класифікація пошукових запитів;
- Визначення характеристик товарів в пошукових запитах (NER);
- Генерація синонімів для e-commerce лексики.

З нами ви:
- Будете впливати на користувацький досвід мільйонів людей;
- Отримаєте досвід викатки моделей та застосування ML в реальному світі, а також будете бачити вплив своєї роботи на результат;
- Отримаєте знання та вміння в напрямках, якими займається команда;
- Використовуватимете технології описані вище та впроваджуватимете нові, які найліпше вирішують поставлені завдання.

Як у нас проходить підбір та співбесіди?
- Ми чекаємо ваше резюме. Після чого воно потрапляє на розгляд команді.
- Співбесіда з Data Science командою для обговорення вашого досвіду, навичок, та вакансії (60 хвилин).
- Технічна співбесіда з тех. лідом та інженером з команди (60 хвилин).
- Знайомство з тім лідом та продакт менеджером команди (60 хвилин).

The job ad is no longer active
Job unpublished on 15 February 2022

Look at the current jobs Data Science Kyiv→