ИБРиС презентация 20052020

Views:
 
     
 

Presentation Description

No description available.

Comments

Presentation Transcript

Контакты:

ИБРиС Сервис автоматического распознавания личности по голосу в колл-центре банка

Контакты:

1 2 3 Пробл ем а c all- ц ентры банки бизнес в сфере B2C 7 - 9 рублей / звонок – средние затраты call- центра на неавтоматическую идентификацию звонящего 70 + млн рублей / год – общие затраты call- центра на неавтоматическую идентификацию звонящего

Контакты:

Решение Автоматическая идентификация звонящего Входящий звонок Система голосовой биометрии Идентификация Вадим Мария Не-клиент

Контакты:

Использование глубоких нейронных сетей для идентификации человека по его голосу Использование специальных методов противодействия попыткам обмана системы с помощью диктофонов и / или синтезаторов речи Стыковка решения с алгоритмом автоматического распознавания речи ( Google Speech API ) Стыковка решения с алгоритмом автоматического распознавания эмоций по голосу Особенности решения

Контакты:

Исследования и тесты Т ексто-зависимое и тексто-независимое распознавание Т елефонный (8 кГц) и широкополосный (16 кГц) каналы Число цифр в пароле Длительность записи голоса 3 цифры 4 цифры 5 цифр 5 сек 10 сек 15 сек Точность Точность 95 % 98 % 99.9 % 93 % 98.5 % 99.8 %

Контакты:

Сравнение с конкурентами Компания ЦРТ Nuance МЫ Точность * 88 % 92 % 99.97 % Используемые акустические параметры Стандартные мел-частотные кептральные коэффициенты ( MFCC ) MFCC + нестандартные параметры (результат нашего R&D ) Используемый классификатор Стандартный классификатор на базе x- векторов Классификатор на базе глубоких рекуррентных нейронных сетей * По результатам независимого тестирования, проведенного компанией « Одитек »

Контакты:

Противодействие попыткам обмана системы Метод обмана Запись на диктофон Автоматический синтез целевого голоса Воспроизведение целевого голоса с помощью технологии voice conversion Точность распознавания случаев обмана * 95% 97% 100 % Используемый алгоритм распознавания обмана 2-слойная Bi-LSTM- сеть, обученная на специальной базе, содержащей различные «обманные» записи * Результаты получены на базе «обманных» записей AVSpoof 2015

Контакты:

Распознавание эмоций Тип эмоции Точность распознавания Злость 9 0 % Отвращение 84% Страх 73% Радость 88% Нейтрал 85% Печаль 87% Удивление 62% * Результаты получены на базах эмоциональной речи Berlin , Emovo , Ravdess , Savee (британский и американский англ. я з., нем. яз. и итальянск . яз.)

Контакты:

Целевой рынок – call- центры (в первую очередь, кредитных организаций) Предлагаемая ценность – существенное сокращение расходов банков на обслуживание их call-центров за счет автоматизации процесса идентификации звонящего TAM (общий объем целевого рынка) - 9,6 млрд руб /год SAM (доступный объем рынка) - 2 млрд руб /год SOM (реально достижимый рынок) - 400 млн руб /год Модель монетизации – поминутная тарификация (0.5 рублей / минута) Рынок

Контакты:

Текущее состояние Raiffaisen - успешный пилот Криптонит - Challenge-2019 - победители NIST - П одготовка к международному тестированию

Контакты:

Илья Макаров, Генеральный директор 18 лет в речевых технологиях (проекты в области speech technologies для Intel, Microsoft, ФСБ РФ, Минздрава РФ) Дмитрий Чепелев , Технический директор 20+ лет в прикладном программировании Ключевые игроки

Контакты:

К онт акты Илья Макаров +7 (915) 382-14-81 s peechprod_mak @mail.ru ИБРиС

authorStream Live Help