call-центр, контакт-центр, распознавание речи, синтез речи, распознавание и синтез речи - OPENCOM

Телефонная функциональность  

  • Ответ входящего вызова;
  • Прекращение вызова;
  • Совершение исходящих вызовов;
  • Функция трансфера (перевод вызова) как внутри телефонного коммутатора, так и в ТфОП.

Голосовая функциональность

  • Проигрывание голосовых сообщений с локального диска, записанных в формате Microsoft wav или Dialogic ADPCM 8000 Hz;
  • Прием сигналов DTMF с определением конца ввода. Окончание ввода определяется:
    • Сигналом «#». (Символ по умолчанию, может быть изменен);
    • По количеству введенных цифр;
    • По таймауту.
  • Запись голосовых сообщений в файл на локальный диск.

AudioTex
В стандартную поставку платформы IPCC IVR включено приложение AudioTex. Данное приложение обеспечивает интерактивное взаимодействие с клиентами для организации круглосуточного быстрого доступа к стандартной (повторяющейся во многих запросах) информации, с возможностью доступа и обновления информации в режиме реального времени.

Common Data Speaker
В стандартную поставку платформы IPCC IVR входит компонента Common Data Speaker (CDS). Данная компонента служит для произнесения наиболее часто требуемой информации с соблюдением всех правил грамматики поддерживаемых языков (падежи, род, число).
В комплект поставки включены две идентичные базы голосовых данных, профессионально записанных мужским и женским голосами. Эти голосовые файлы могут быть легко заменены другими при необходимости (например, чтобы все приложение звучало одним голосом).

Поддерживаемые языки
В текущую версию IPCC IVR входит CDS с поддержкой следующих языков: русский, английский. Далее приводится функциональность CDS для русского языка. Функциональность CDS для английского языка аналогична русской.
Произнесение букв, цифр и специальных символов
В функциональность CDS входит возможность произнесения всех букв русского алфавита, цифр от 0 до 9 и специальных символов: ‘+’, ’-‘, ’.’, ’%’, ‘*’, ‘#’.
Произнесение целых чисел
CDS позволяет произносить целые числа в диапазоне от –999 триллионов 999 миллиардов 999 миллионов 999 тысяч 999 до 999 триллионов 999 миллиардов 999 миллионов 999 тысяч 999.
Произнесение дробных чисел
Максимально допустимая разрядность произнесения дробных чисел составляет 12 значащих цифр после запятой.
Произнесение сумм представленных в различных валютах
В стандартную поставку CDS входит произнесение следующих валют: рубли, доллары, евро. Область допустимых значений произнесения валют находится в диапазоне от –999 триллионов 999 миллиардов 999 миллионов 999 тысяч 999 до 999 триллионов 999 миллиардов 999 миллионов 999 тысяч 999 единиц. Также имеется возможность произнесения дробных частей денежных сумм установленной валюты: копейки, центы.
Произнесение порядковых числительных
Имеется возможность произношения порядковых числительных в диапазоне от –999 триллионов 999 миллиардов 999 миллионов 999 тысяч 999 до 999 триллионов 999 миллиардов 999 миллионов 999 тысяч 999 в мужском, женском и среднем роде в единственном числе.
Произнесение даты/времени
Поддерживается произнесения года, месяца, дня недели, числа, часа, минуты и секунды.

Доступ к базам данных
Доступ к базам данных осуществляется посредством стандарта MS ADO. Поддерживаемые базы данных:

  • MS SQL Server;
  • Oracle;
  • MS Access;
  • Другие (OLE DB драйверы).

Автоматическое распознавание голоса
IPCC IVR интегрирован с компонентой ASR (Automatic Speech Recognition): автоматического распознавания речи. 

ASR может использовать для распознавания:

  • Закрытую грамматику, при этом компонента ожидает на входе произнесение заранее определенной фразы, например: «открытие счета».
  • Открытую грамматику, при котором распознаются только ключевые слова (word and phrase spotting), основываясь на которых, система может, например, переводить абонента  в нужный пункт меню.
    Поддерживается русский, английский, а также еще более 30-ти языков. Словарь состоит из более 1500 наиболее употребляемых слов и имеет возможность определения новых слов автоматически и вручную, используя открытый фонемный набор.
    Имеется 3 уровня оптимизации баланса точности/производительности распознавания голоса.
    Компонента ASR доступна как опция к основной поставке IPCC IVR.

Синтез речи
IPCC IVR поддерживает функциональность TTS (Text-To-Speech): синтез речи - произнесение в телефонную линию произвольной информации, представленной в текстовом виде.
TTS ориентирован для использования в следующих приложениях:

  • озвучивание оперативно обновляемой новостной информации
  • доступ к индивидуальным, не стандартизированным клиентским данным

Для исполнения запросов и настройки  данного сервиса используются специализированный модуль синтеза речи (text-to-speech engine). IPCC IVR  обеспечивает поддержку  стандарта построения модулей синтеза речи Microsoft Speech API (SAPI) 5.1.

Основные характеристики модуля синтеза речи:

  • естественное, натуральное звучание
  • возможность создания пользовательских банков голосов, включая мужские и/или женские версии голосов взрослых, пожилых людей и детей
  • создание "единого голоса" компании, одинакового как для традиционных IVR-приложений, так и для TTS-сервисов
  • персонализация произношения за счет контроля и настройки таких параметров как громкость, темп и высота тона голоса
  • автоматическая настройка интонации, с возможностью ручной коррекции ударений, учета  вида фрагмента текста (дата, время, адрес)
  • оптимальное качество речи за счет дискретизации с частотами 8 KHz, 11 KHz, 16 KHz и 22 KHz.

Компонента TTS доступна как опция к основной поставке IPCC IVR.

Rambler's Top100
«Copyright © 2008 ЗАО "Открытые Коммуникации" - call-центр, контакт-центр, распознавание и синтез речи»
Вход