Багатомовна ідентифікація і транскрипція.
Світові медіаресурси містять аудіо з носіями на різних мовах. Більшість можливостей перетворення мови в текст вимагають попереднього налаштування розпізнавання звуку, що є перешкодою для транскрибування багатомовних відео. Нова автоматична ідентифікація розмовної мови для кількох контентів використовує технологію машинного навчання для ідентифікації різних мов, які використовуються в медіа-активах. Після виявлення кожного мовного сегменту проходить процес автоматичної транскрипції на зазначеному мовою, і всі сегменти об'єднуються назад в один файл транскрипції.
Результуюча транскрипція доступна як у вигляді вихідних даних JSON Video Indexer, так і у вигляді файлів з субтитрами. Вихідна стенограма також інтегрована з пошуком Azure, що дозволяє відразу ж виконувати пошук по відео для різних мовних сегментів.
Крім того, багатомовна транскрипція доступна як частина роботи порталу Video Indexer,тож ви можете переглядати транскрипт і ідентифіковану мову за часом або переходити до певних місць в відео для кожної мови і бачити багатомовну транскрипцію у вигляді заголовків. Ти можеш перевести вихідні дані на 54 різних мови через портал і API.