0
0
1711

Российские технологии голосовой биометрии продемонстрировали выдающиеся результаты в международном конкурсе NIST

10:07 27.01.2022


Группа компаний ЦРТ (входит в экосистему Сбера) показала выдающиеся результаты в тестировании голосовой биометрии (алгоритмов распознавания человека по голосу) Национальным институтом стандартов и технологий США (NIST).

«Качественное распознавание человека по голосу позволяет совершенствовать бизнес и государственные сервисы, упрощая нашу жизнь, – отметил генеральный директор группы компаний ЦРТ Дмитрий Дырмовский. – Высококлассные речевые технологии помогают создавать лучших диалоговых ассистентов – оптимизируют работу контактных центров, офисов продаж и обслуживания. Речевая аналитика помогает делать выводы об удовлетворенности клиента и качестве диалога, а значит – непрерывно совершенствовать пользовательский опыт. И шире – идентификация людей по голосу востребована в биометрических системах национального масштаба».

Технология группы компаний ЦРТ показала выдающийся результат в конкурсе NIST SRE21 (Speaker Recognition Evaluation). «NIST SRE 21 – пятый конкурс 2021 года, где технологии ЦРТ получают высокий балл от компетентного международного жюри, – сообщил Дмитрий Дырмовский. – Признание ЦРТ в международных конкурсах – не только личная победа, но знаковое событие для всей индустрии. Мы рады выводить решение задач в области голосовой биометрии, над которыми работают сильнейшие команды со всего мира, на новый уровень, достойно представляя свои ключевые компетенции на глобальном рынке».

В конкурсе решалось несколько задач:

– распознавание говорящего по аудио разных источников: телефонных звонков (conversational telephone speech, CTS), звука из видео (audio from video, AfV). Для решения использовался алгоритм распознавания человека по голосу;

– распознавание говорящего по аудио и видео из разных источников: телефонных звонков (CTS), звука из видео (AfV) и просто видео. Для решения использовалась комбинация алгоритмов распознавания человека по голосу и по лицу.

Особенность конкурса в этом году – два варианта обучения алгоритмов: вариант Fixed допускал использование только звуковых данных от организаторов. Вариант Open допускал использование любых данных. Сложность заключалась в том, что данные записывались как через телефон (обычные телефонные разговоры), так и в микрофонном канале (записи с видеокамер), а люди на записях разговаривали на различных языках: английском, китайском, арабском и других.

Научная команда ЦРТ для решения задачи распознавания человека одна из первых успешно применила комбинацию архитектур нейронных сетей типа transformer, которая популярна в задачах компьютерного зрения, понимания естественного языка, и wav2vec, которая применяется в задачах распознавания речи. Такой подход позволил достичь низкого уровня ошибки верификации человека по голосу.

Также команда группы ЦРТ принимает участие в еще одном конкурсе – NIST CTS Speaker Recognition Challenge. Это конкурс в формате ongoing: соревнования длятся нон-стоп, периодически подводятся промежуточные результаты. В этом соревновании команда группы ЦРТ также демонстрирует высокие результаты. Основная задача CTS Challenge – распознать говорящего по записям в телефонном канале, при этом человек может говорить на разных языках – английском, французском, арабском, и с разных моделей смартфонов. В соревновании принимают участие 33 команды из ведущих университетов и коммерческих компаний.

Среди участников соревнований – сильнейшие научные команды ведущих университетов мира, команды коммерческих компаний – исследователи из Китая, США, Японии, Италии, Франции, Испании, Израиля, Сингапура, Чехии.

Группа компаний ЦРТ (входит в экосистему Сбера) – глобальный разработчик продуктов и решений на основе разговорного искусственного интеллекта, машинного обучения и компьютерного зрения c 30-летним опытом. Технологически эксперт в области речевых технологий, лицевой и голосовой биометрии. Группа ЦРТ фокусируется на создании AI-решений для сегментов B2B и B2G: реализовано более 5 тыс. AI-проектов по всему миру, в том числе – национального масштаба – в Мексике, Эквадоре, Ближнем Востоке. В России решения ЦРТ работают в крупнейших банках, телеком-компаниях, ТЭК, госсекторе, применяют для реализации концепции Safe&Smart сity. Технологии выявления подделок голоса и распознавания речи от группы ЦРТ занимают лидирующие позиции в мировых рейтингах NIST, VOiCES, CHiME.


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.


Комментарии отключены - материал старше 3 дней

Новости


19:20 04.02.2026
ВС Франции собираются заказать в 2026 году вооружений на 42 млрд евро - СМИ
0
68
19:05 04.02.2026
Трамп провел "прекрасный телефонный разговор" с Си Цзиньпином
0
99
18:55 04.02.2026
Рубио: Список нерешенных вопросов по конфликту на Украине существенно сократился
0
110
17:52 04.02.2026
На заседании коллегии прокуратуры Подмосковья обсудили поддержку участников СВО и снижение преступности
0
186
17:40 04.02.2026
Сход вагонов грузового поезда с возгоранием бензина произошел в Тамбовской области
0
256
17:22 04.02.2026
Сергей Иванов освобожден от должности спецпредставителя президента
0
307
17:00 04.02.2026
Власти Эстонии отбуксировали задержанный контейнеровоз с россиянами в порт Мууга
0
291
16:32 04.02.2026
ВСУ потеряли за сутки в зоне СВО около 1 390 военнослужащих
0
303
16:12 04.02.2026
ВС РФ освободили Степановку в ДНР и Староукраинку в Запорожской области
0
311
16:00 04.02.2026
Россия и Китай должны защищать международное право с ООН в ее основе — Си Цзиньпин
0
341

Возврат к списку