Технология распознавания речи (ASR) позволяет преобразовывать произнесенные слова в язык машинных кодов. Процесс распознавания состоит из предобработки и декодирования речи. На стадии предобработки осуществляется запись и оцифровка речи с последующим акустическим анализом. На стадии декодирования применяются акустико-фонетическая, лексическая и языковая модели, которые позволяют получить граф, содержащий множество наиболее вероятных последовательностей слов.

Использование ASR возможно в двух вариантах: 

- Закрытая грамматика (Closed Grammar). Клиент произносит заранее определенное ключевое слово или фразу, например: «банкомат», «парковка», «справка», «расписание».

- Открытая грамматика (Open Grammar). Клиент произносит произвольную фразу, в которой распознаются ключевые слова в предложении (word and phrase spotting), например: «Я хочу получить информацию о возможности парковки на стоянке аэропорта».

Применение ASR в голосовом приложении возможно в двух режимах:

- Стандартный режим -  клиент произносит ключевую фразу после окончания голосовой подсказки или информационного блока меню.

- Режим с прерыванием -  клиент произносит ключевую фразу в любой момент прослушивания голосовой подсказки меню IVR, не дожидаясь ее окончания.

В зависимости от производителя системы распознавания речи поддерживается различный набор языков. Система распознавания речи, используемая в приложениях OPENCOM, поддерживает следующие языки: русский, английский, венгерский, голландский, греческий, датский, испанский, итальянский, китайский, немецкий, норвежский, польский, португальский, словацкий, словенский, уэльский, финский, фламандский, французский, шведский, чешский, японский. Возможность голосового приложения распознавать отдельные слова или фразы характеризуется количеством слов в подключенном словаре. Словарь может быть как общим – для всего приложения, так и индивидуальным для каждого из разделов меню.

Для английского, немецкого, французского и немецкого языков словарь содержит базовый набор грамматик, позволяющих распознавать: цифры, телефонные номера, почтовые коды, пин-коды, время, даты, праздники, валюты.

Для русского языка, в дополнение к перечисленным грамматикам, специалисты "Открытых коммуникаций" реализовали и апробировали следующие словари: числа (от 0 до 10000), города России, авиакомпании, аэропорты, улицы Москвы.


«Открытые Коммуникации»
в социальных сетях:
Открытые Коммуникации на facebook Открытые Коммуникации на twitter Открытые Коммуникации В Контакте


Блог о голосовых технологиях компании Opencom