Многоязычная идентификация и транскрипция.

Мировые медиаресурсы содержат аудио с носителями на разных языках. Большинство возможностей преобразования речи в текст требуют предварительной настройки распознавания звука, является препятствием для транскрибирования многоязычных видео. Новая автоматическая идентификация разговорной речи для нескольких контентов использует технологию машинного обучения для идентификации различных языков, используемых в медиа-активах. После обнаружения каждого языкового сегмента проходит процесс автоматической транскрипции на указанном языке, и все сегменты объединяются назад в один файл транскрипции.

Результирующая транскрипция доступна как в виде исходных данных JSON Video Indexer, так и в виде файлов с субтитрами. Выходная стенограмма также интегрирована с поиском Azure, что позволяет сразу же выполнять поиск по видео различных языковых сегментов.

Кроме того, многоязычная транскрипция доступна как часть работы портала Video Indexer, поэтому вы можете просматривать транскрипт и идентифицированного язык по времени или переходить к определенным местам в видео для каждого языка и видеть многоязычную транскрипцию в виде заголовков. Ты можешь перевести выходные данные на 54 различных языках через портал и API.