
Whisper (OpenAI)
Переводите аудио или видео в текст с языковым переводом
Описание Whisper (OpenAI)
Whisper — это система автоматического распознавания речи с открытым исходным кодом, обученная на 680 000 часов многоязычных и многозадачных контролируемых данных, собранных из Интернета. Он спроектирован так, чтобы быть устойчивым к акцентам, фоновому шуму и техническому языку, а также может расшифровывать и переводить речь на нескольких языках на английский язык. Это простой сквозной подход, реализованный в виде преобразователя кодер-декодер. Он также способен выполнять идентификацию языка и временные метки на уровне фраз. Он разработан, чтобы быть простым в использовании и иметь высокую точность, что позволяет разработчикам добавлять голосовые интерфейсы к большему количеству приложений.