Технология распознавания речи (ASR) позволяет преобразовывать произнесенные слова в язык машинных кодов. Процесс распознавания состоит из предобработки и декодирования речи. На стадии предобработки осуществляется запись и оцифровка речи с последующим акустическим анализом. На стадии декодирования применяются акустико-фонетическая, лексическая и языковая модели, которые позволяют получить граф, содержащий множество наиболее вероятных последовательностей слов.
Использование ASR возможно в двух вариантах:
- Закрытая грамматика (Closed Grammar). Клиент произносит заранее определенное ключевое слово или фразу, например: «банкомат», «парковка», «справка», «расписание».
- Открытая грамматика (Open Grammar). Клиент произносит произвольную фразу, в которой распознаются ключевые слова в предложении (word and phrase spotting), например: «Я хочу получить информацию о возможности парковки на стоянке аэропорта».
Применение ASR в голосовом приложении возможно в двух режимах:
- Стандартный режим - клиент произносит ключевую фразу после окончания голосовой подсказки или информационного блока меню.
- Режим с прерыванием - клиент произносит ключевую фразу в любой момент прослушивания голосовой подсказки меню IVR, не дожидаясь ее окончания.
В зависимости от производителя системы распознавания речи поддерживается различный набор языков. Система распознавания речи, используемая в приложениях OPENCOM, поддерживает следующие языки: русский, английский, венгерский, голландский, греческий, датский, испанский, итальянский, китайский, немецкий, норвежский, польский, португальский, словацкий, словенский, уэльский, финский, фламандский, французский, шведский, чешский, японский. Возможность голосового приложения распознавать отдельные слова или фразы характеризуется количеством слов в подключенном словаре. Словарь может быть как общим – для всего приложения, так и индивидуальным для каждого из разделов меню.
Для английского, немецкого, французского и немецкого языков словарь содержит базовый набор грамматик, позволяющих распознавать: цифры, телефонные номера, почтовые коды, пин-коды, время, даты, праздники, валюты.
Для русского языка, в дополнение к перечисленным грамматикам, специалисты "Открытых коммуникаций" реализовали и апробировали следующие словари: числа (от 0 до 10000), города России, авиакомпании, аэропорты, улицы Москвы.







