Product

TTS/STT Engineer (Voice AI)

Ми шукаємо TTS/STT Engineer, який(а) допоможе побудувати з нуля напрямок синтезу та розпізнавання мовлення в компанії: від вибору моделей і підготовки датасетів до production-ready pipeline для AI-продуктів.

Це роль для спеціаліста, який хоче впливати на формування Voice AI-напрямку та працювати з сучасними TTS/STT технологіями. Також у межах академії готові розглядати кандидатів із мінімальним комерційним досвідом, але сильним інтересом до AI/ML та бажанням розвиватися в напрямку speech technologies.

Що потрібно буде робитиТехнічна розробка

  • Розгортання та fine-tuning TTS-моделей (XTTS v2, F5-TTS, OrpheusTTS) під конкретні голоси та мови
  • Налаштування STT pipeline на базі Whisper (faster-whisper, Whisper large-v3)
  • Voice cloning: підготовка референс-аудіо, навчання моделей, оцінка якості
  • Побудова мультимовних pipeline з підтримкою української та інших мов
  • Оцінка якості моделей: WER (Word Error Rate) для STT, MOS (Mean Opinion Score) для TTS
  • Інтеграція TTS як output-layer для AI-агентів та чат-ботів спільно з GenAI-командою

Робота з даними

  • Пошук, оцінка та підготовка аудіо-датасетів (Common Voice, власні записи тощо)
  • Розмітка та вирівнювання аудіо (Montreal Forced Aligner та аналоги)
  • Побудова pipeline для обробки та аугментації аудіо

Академія та розвиток напряму

  • Участь у розвитку внутрішньої експертизи Voice AI
  • Knowledge-sharing, code review та допомога у розвитку junior-спеціалістів академії
  • Документування моделей, pipeline та результатів експериментів (MLflow / W&B)

Що для нас важливо

  • Python та досвід роботи з ML/DL pipeline
  • Розуміння принципів роботи TTS/STT систем
  • Досвід роботи з Whisper, XTTS, Coqui TTS, PyTorch або HuggingFace
  • Досвід fine-tuning моделей та роботи з аудіо-даними
  • Вміння самостійно досліджувати та тестувати нові підходи

Буде плюсом

  • Досвід побудови мультимовних voice pipeline
  • Робота з GPU / inference optimization
  • Досвід інтеграції AI-рішень у production
  • Open-source або pet-projects у сфері AI

Ми пропонуємо

  • Можливість побудувати Voice AI напрямок практично з нуля
  • Роботу з сучасними TTS/STT та GenAI технологіями
  • Вплив на архітектуру та технічні рішення
  • Гнучкий формат співпраці та віддалену роботу
  • Швидкий професійний ріст та сильне AI-середовище

Required languages

English B1 - Intermediate
Published 28 May
20 views
·
3 applications
To apply for this and other jobs on Djinni login or signup.
Loading...