Middle Data Scientist Offline

Ukrainian Product 🇺🇦

Prom.ua в цифрах:

- 20 млн переглядів сторінок щодня (260 млн подій при цьому)

- 100 млн запитів на пошукову видачу щомісяця

- Трафік в місяць близько 90 млн сесій

- В онлайні максимум одночасно 17 тис. користувачів

 

Про команду:

- ML пошук

- Автоматична модерація товарів у каталозі

- Рекомендації товарів та персоналізація

- Пошук дублікатів товарів

- Антифрод та інші

 

Технічний стек проекту, що вже використовуємо:

- ML сервіси: Tensorflow/Scikit Learn/Spark MLlib (як фреймворки навчання моделей) + FastAPI/Aiohttp (як фреймворки для веб обгортки) + Annoy/Faiss (для пошуку схожих векторів).

- Для роботи з великими даними: Python + Pyspark (як фреймворк обробки) + HDFS (як сторедж) + Airflow(шедулер) + JupyterHub і notebooks (середовище для експериментів/тестування гіпотез).

- Для роботи з пошуком: ElasticSearch (як пошуковий движок) + Python/Kotlin/Java (для написання сервісів/плагінів) + Kafka (як шина даних).

 

Що важливо для даної ролі в проекті:

- від 2 років досвіду роботи у машинному навчанні: постановка задачі, збір датасету, тренування моделі, оцінка точності результатів;

- досвід з Natural language processing, text representation techniques;

- вміння писати надійний і чистий код на python, розуміння і використання різних структур даних, OOP, а також, володіння VC (Git etc);

- досвід роботи з базами даних, SQL-запити.

 

Буде перевагою:

- Взагалі ідеально, якщо ви маєте досвід роботи з великими об’ємами даних та Elasticsearch;

- Досвід деплойменту моделей;

- Досвід роботи з нейронними мережами для роботи з текстом.

 

Задачі в проекті:

- Класифікація пошукових запитів;

- Визначення характеристик товарів в пошукових запитах (NER);

- Генерація синонімів для e-commerce лексики.

 

З нами ви:

- Будете впливати на користувацький досвід мільйонів людей;

- Отримаєте досвід викатки моделей та застосування ML в реальному світі, а також будете бачити вплив своєї роботи на результат;

- Отримаєте знання та вміння в напрямках, якими займається команда;

- Використовуватимете технології описані вище та впроваджуватимете нові, які найліпше вирішують поставлені завдання.

 

Як у нас проходить підбір та співбесіди?

- Ми чекаємо ваше резюме. Після чого воно потрапляє на розгляд команді.

- Співбесіда з Data Science командою для обговорення вашого досвіду, навичок, та вакансії (60 хвилин).

- Технічна співбесіда з тех. лідом та інженером з команди (60 хвилин).

- Знайомство з тім лідом та продакт менеджером команди (60 хвилин).

Data Scientist

The job ad is no longer active
Job unpublished on 15 February 2022

Look at the current jobs Data Science Kyiv→

Loading...