Data scientist (NLP) Middle, Senior (offline) $3000-5000

— Коммерческий опыт 3+ лет;
— Stack: NLP, Python; Tensorflow, Keras, PyTorch, etc);
— Условия сотрудничества, фултайм, удаленно;
— Английский: средний и выше;
— Проект: стартап в области фармация;
— Преимущества: полезный продукт для общества, использование новейших технологий, интересные и сложные задачи;
— Вилка до $5000 (зависит от опыта и позиции, нужны 2 Data Scientists Middle и Senior);

Компания о себе:

Мы разрабатываем инновационные продукты для фармацевтического ритейла с целью улучшать эффективность взаимодействия потребителей и производителей (Uniqa.ai). Используются технологии в области CV & Speech-to-Text с последующей обработкой естественного языка и визуализацией данных для улучшения качества обслуживания и удовлетворенности клиентов. Мы успешно прошли в программу от Nvidia Inception и готовы к глобальным вызовам. Сейчас у нас 2 команды. В проект вовлекаются сильные адвайзеры (например, по NLP - основатели DeepPavlov.ai)

Задачи:
Предобработка текстов.
Классификация, кластеризация текстов.
Извлечение именованных сущностей и ключевых слов.
Морфологический, синтаксический анализ.
Выявление интентов.
Тематическое моделирование.
Проверка правописания.
Информационный поиск и обнаружение дубликатов.
Дистрибутивная семантика: word2vec/paragraph2vec, fasttext, и др.
Анализ неструктурированной текстовой коммуникации
Работа с внешними источниками (arxiv, github)
Измерять/мониторить работу разметчиков.

Требования:
Язык программирования Python;
Опыт работы с алгоритмами и библиотеками машинного обучения в NLP (с некоторыми из представленных): nltk, Stanford NLP toolset(parser, NER, coreference resolution, word segmenter e.t.c.) spacy, genism и bigartm.
- морфология: pymystem3, pymorphy2
- парсеры грамматик: Tomita parser, yargy
- синтаксис: udpipe и\или syntax net и другие.
Опыт построения глубоких нейронных сетей с использованием фреймворков Tensorflow, Keras, PyTorch.
Контроль версий: git.
OS: Linux.

Будет плюсом:
Опыт построения моделей с использованием оптимальных эмбеддингов, памяти и внимания;
Знание английского языка (уровень Intermediate +);
Опыт работы с русским и казахским языком;
Опыт работы с ipavlov и alennlp; понимание особенностей русского языка;
Опыт тестирования и отладки методов/концептов обработки текстовых данных, работа с разметкой Universal Dependencies и аналогичными;
Разработка диалоговых систем.

Преимущества работы:
Интересный и полезный для общества проект, полный челенджей;
Возможность применить знания и заняться нетривиальными задачами;
Международная компания с распределенной командой;
Использование новейших технологий;
Поддержка и обмен опытом между двумя NLP командами;
Условия сотрудничества: удаленно, фултайм.

Присылайте резюме - будем рады познакомиться и обсудить детали :)

About Data Science UA

We make artificial intelligence evident by helping businesses to discover what they can do with AI

Company website:
https://data-science-ua.com/

DOU company page:
https://jobs.dou.ua/companies/data-science-ua/

The job ad is no longer active
Job unpublished on 10 May 2021

Look at the current jobs Data Science Vinnytsia→