Data scientist ( junior ) Offline

Мета діяльності на посаді:

Організація даних і аналіз великих обсягів даних та розробка предикативних моделей на мовах програмування Python / R, підготовка результатів аналізу в формі reproducible reports.

 

Функціональні обов'язки

• Побудова предикативних моделей з допомогою мов програмування Python / R, переважно застосовуючи методи регресійного аналізу, з метою оцінки ефективності маркетингових активностей брендів (сфери – finance, retail, mass media та інші).

• Feature engineering: підбір факторів для навчання предикативних моделей, перевірка даних на повноту, відсутність автокореляції та ін. За необхідності, парсинг даних з онлайн джерел для їх обробки і включення в датасет

• Перевірка моделей на точність, стабільність та надійність прогнозу з допомогою статистичних показників, що включають (але не обмежуються) R-squared, adjusted R-squared, F-statistic, Prob, LogLoss, Accuracy score, Durbin-Watson, Jaccard similarity score …)

• Надання аналітичних висновків по завершенню задачі на кожному етапі розробки моделі.

• Підготовка презентації з результатами аналізу та побудованою моделлю з інтерпретацією результатів моделювання та впливу факторів, що увійшли до моделі

• Регулярна робота з пошуку інсайтів/патернів в даних, що покращать ефективність вирішення задач бізнесу.

• Підготовка регулярних та adhoc аналітичних звітів в MS Excel, PowerPoint, PowerBI.

• Регулярна комунікація з бізнес-аналітиком щодо питань, пов’язаних з задачами моделювання та даними, що використовуються у моделюванні.

Вимоги до кандидатів

• Досвіт роботи від 1 року в реальних проектах або Кейси на Kaggle, портфоліо GitHub.

• Базова вища технічна освіта ВУЗів найвищого рівня акредитації, математичний профіль (мінімум 3 завершених курси).

• Розвинуте аналітичне мислення та навички системного аналізу (структурувати ситуацію, визначити фактори впливу на розвиток цільової змінної).

• Глибокі знання та розуміння теорії математичного аналізу, статистики.

• Знання основ статистичного аналізу та теорії ймовірності.

• Впевнені навички програмування на мовах Python, R.

• Знання та досвід роботи з бібліотеками Python: основних, для роботи з даними, для візуалізації (Pandas, NumPy, SciPy, Matplotlib, Seaborn, Scikit-learn).

• Досвід роботи з великими масивами інформації.

• Досвід побудови складних запитів та обробки даних з допомогою SQL.

• Знання методів обробки даних (Excel, Power Pivot, Power Query), візуалізації аналітичних звітів(Power BI, PowerPoint).

• Досвід побудови відтворюваних репортів дата аналізу (reproducible reports).

• Висока уважність до деталей.

• Високий рівень відповідальності.

• Навички самоорганізації.

• Високий рівень допитливості та жаги до самовдосконалення в галузі data science.

• Англійська – на рівні ефективного сприйняття професіональної інформації (більшість тренінгів, документація – на англійській).

Бажано

• Навички написання алгоритмів автоматичного збору даних, в т.ч. з підключенням через API.

• Знання підходів застосування машинного навчання у сфері предикативної аналітики та/чи методів кластерного, лінгвістичного аналізу.

• Участь у Kaggle challenges та інші профільні академічні / бізнес проекти.

• Навички роботи згідно принципів Agile та Lean розробки.

 

Компенсаційний пакет

• Офіційне працевлаштування в стабільній компанії з повною відповідністю трудовому законодавству.

• Своєчасна заробітна плата, виплата 2 рази на місяць.

• Піклування про ваше здоров'я: медичне страхування та можливість застрахувати рідних.

• Графік роботи п'ятиденний (пн-пт) - 10:00-19:00 або 9:00-18:00.

• Прозорі налагоджені процеси.

• Корпоративний університет, можливості для навчання, доступ до корпоративної бібліотеки.

• Знижки та пільги на заняття в спортклубі, курси англійської.

• Можливість працювати віддалено.

• Цікаві проекти, можливості для самореалізації та професійного розвитку.

Python, Pandas, numpy, matplotlib, API, Agile

The job ad is no longer active
Job unpublished on 24 July 2021

Look at the current jobs Data Science Kyiv→

Loading...