TTS/STT Engineer
$$$
Product
TTS/STT Engineer (Voice AI)
Ми шукаємо TTS/STT Engineer, який(а) допоможе побудувати з нуля напрямок синтезу та розпізнавання мовлення в компанії: від вибору моделей і підготовки датасетів до production-ready pipeline для AI-продуктів.
Це роль для спеціаліста, який хоче впливати на формування Voice AI-напрямку та працювати з сучасними TTS/STT технологіями. Також у межах академії готові розглядати кандидатів із мінімальним комерційним досвідом, але сильним інтересом до AI/ML та бажанням розвиватися в напрямку speech technologies.
Що потрібно буде робитиТехнічна розробка
- Розгортання та fine-tuning TTS-моделей (XTTS v2, F5-TTS, OrpheusTTS) під конкретні голоси та мови
- Налаштування STT pipeline на базі Whisper (faster-whisper, Whisper large-v3)
- Voice cloning: підготовка референс-аудіо, навчання моделей, оцінка якості
- Побудова мультимовних pipeline з підтримкою української та інших мов
- Оцінка якості моделей: WER (Word Error Rate) для STT, MOS (Mean Opinion Score) для TTS
- Інтеграція TTS як output-layer для AI-агентів та чат-ботів спільно з GenAI-командою
Робота з даними
- Пошук, оцінка та підготовка аудіо-датасетів (Common Voice, власні записи тощо)
- Розмітка та вирівнювання аудіо (Montreal Forced Aligner та аналоги)
- Побудова pipeline для обробки та аугментації аудіо
Академія та розвиток напряму
- Участь у розвитку внутрішньої експертизи Voice AI
- Knowledge-sharing, code review та допомога у розвитку junior-спеціалістів академії
- Документування моделей, pipeline та результатів експериментів (MLflow / W&B)
Що для нас важливо
- Python та досвід роботи з ML/DL pipeline
- Розуміння принципів роботи TTS/STT систем
- Досвід роботи з Whisper, XTTS, Coqui TTS, PyTorch або HuggingFace
- Досвід fine-tuning моделей та роботи з аудіо-даними
- Вміння самостійно досліджувати та тестувати нові підходи
Буде плюсом
- Досвід побудови мультимовних voice pipeline
- Робота з GPU / inference optimization
- Досвід інтеграції AI-рішень у production
- Open-source або pet-projects у сфері AI
Ми пропонуємо
- Можливість побудувати Voice AI напрямок практично з нуля
- Роботу з сучасними TTS/STT та GenAI технологіями
- Вплив на архітектуру та технічні рішення
- Гнучкий формат співпраці та віддалену роботу
- Швидкий професійний ріст та сильне AI-середовище
Required languages
| English | B1 - Intermediate |
Published 28 May
20 views
·
3 applications
📊
Average salary range of similar jobs in
analytics →
Loading...