Parakeet TDT 0.6B v3

Речь в текстДоступна

Релиз: 27 мая 2026 г.

600M параметров, FastConformer-TDT, все языки ЕС, WER 6.34%, обучена на 670K+ часах аудио.

Parakeet TDT 0.6B v3 — многоязычная модель преобразования речи в текст от NVIDIA с 600M параметров, построенная на архитектуре FastConformer-TDT. Обучена на датасете Granary (670 000+ часов аудио), поддерживает автоматическое определение языка для всех официальных языков ЕС и достигает средней частоты ошибки слов 6,34% на HuggingFace Open ASR Leaderboard. Возвращает транскрибированный текст с пунктуацией и таймстемпами сегментов.

Идеальный выбор для многоязычных STT-проектов с высокими требованиями к точности и поддержкой всех языков Европейского Союза.

Ключевые характеристики:

  • 600M параметров: FastConformer-TDT
  • Все языки ЕС: Автоопределение языка
  • WER 6.34%: Высокая точность
  • 670K+ часов: Масштабное обучение
  • Пунктуация: Чистые транскрипты
  • Таймстемпы: На уровне сегментов

Идеально подходит для:

  • Многоязычной транскрибации (все языки ЕС)
  • Высокоточных STT-проектов
  • Обработки аудио с неизвестным языком
  • Профессиональной транскрипции
  • Приложений с требованием к точности

Тарификация:

  • 22 Искры за час аудио

💡 Пример: 1 час аудио = 22 Искры

Дата релиза: 27 мая 2026 г.

🎙️ WER 6,34% — все языки ЕС с автоопределением