Ученые Сбера научили легковесные модели искусственного интеллекта распознавать эмоции в сложных условиях
16:15 23.04.2025
Ученые лаборатории искусственного интеллекта Сбербанка предложили инновационный подход к распознаванию эмоций в реальных условиях. Результаты исследования они представили в работе Leveraging Lightweight Facial Models and Textual Modality in Audio-visual Emotional Understanding in-the-Wild («Использование легковесных моделей анализа лица и текстовых модальностей в аудиовизуальном понимании эмоций в естественных условиях»). Ее приняли к публикации на международном воркшопе Affective Behaviour Analysis in-the-Wild (ABAW) конференции CVPR (Core A*).
Работа демонстрирует, как комбинация визуальных, акустических и текстовых данных повышает точность эмоционального анализа на основе моделей искусственного интеллекта. На практике системы распознавания эмоций часто сталкиваются с несколькими проблемами. Во-первых, это низкая точность в условиях изменяющегося освещения, ракурсов или фонового шума. Во-вторых, высокие вычислительные затраты современных алгоритмов, затрудняющие возможность обработки чувствительной персональной информации (видео лиц) на пользовательских устройствах. Наконец, для обучения моделей необходимы большие объемы данных, при этом качественная разметка несколькими экспертами эмоций на видео обычно занимает много времени.
Решение исследователей Сбера основано на трех ключевых аспектах. Эксперты предложили использовать обученные на открытых наборах фотографий эмоциональных лиц эффективные нейронные сети (EmotiEffNet, MobileViT, MobileFaceNet) для анализа мимики, что позволяет эффективно работать в режиме реального времени даже на обычных смартфонах. Кроме этого, для снижения нагрузки на систему и повышения точности проводится фильтрация кадров, эмоции на которых надежно распознаются с помощью предобученных моделей. Также ученые доказали, что комбинирование данных из разных источников (текст, аудио, видео) с помощью метода «позднего слияния» (late fusion) ускоряет адаптацию модели к решению новых задач.
На восьмом международном конкурсе ABAW такой подход занял 1-е место в задачах распознавания выражений лица и амбивалентности (нерешительности) и 3-е место в оценке интенсивности эмоций и детектировании микровыражений (action units). Точность (средняя F1-мера) выросла на 1,5–15% по сравнению с базовыми методами, которые основаны на традиционных нейросетевых моделях лиц (VGGFace) и акустических признаках (wav2vec 2). Материалы, которые были использованы в исследовании, собраны в библиотеке EmotiEffLib.
Виртуальные ассистенты и чат-боты на базе технологии российских ученых будут точнее определять эмоции пользователей. Например, образовательные платформы смогут адаптировать контент под настроение ученика, повышая эффективность обучения. Бизнес может получить инструмент для анализа эмоциональных реакций клиентов на продукты и рекламные кампании. В медицинской сфере умные системы мониторинга психического здоровья научатся выявлять признаки тревожности или депрессии на ранних стадиях. Инструменты на основе искусственного интеллекта, которые уже применяют в социальной сфере, станут более естественно взаимодействовать с людьми и точнее обрабатывать их запросы.
«Коллегам удалось разработать новые методы мультимодального анализа эмоций с оптимизацией вычислений. Это исследование приближает нас к созданию эмпатичного искусственного интеллекта, который сможет точно и быстро распознавать эмоции человека в реальных условиях, – отметил директор Лаборатории искусственного интеллекта Сбербанка Глеб Гусев. – Возможности для прикладного применения этой технологии очень широки – от виртуальных помощников до интеллектуальных систем в медицине и образовании. Такие решения в любой области помогут создать индивидуальный подход к каждому пользователю и, самое главное, будут эффективнее помогать людям справляться с разными задачами».
Комментарии отключены - материал старше 3 дней
Новости
- 18:30 19.12.2025
- Восьмой раз подряд Пентагон не прошел аудиторскую проверку - Reuters
- 17:40 19.12.2025
- Кредит ЕС на 90 млрд евро не спасет Украину от поражения — Орбан
- 17:18 19.12.2025
- Рост цен по итогам года будет минимальным за последние пять лет — Набиуллина
- 17:00 19.12.2025
- В РФ проживают 5-10 млн украинцев, они должны иметь право голоса — Путин
- 16:58 19.12.2025
- Нейросеть Kandinsky заняла первое место среди всех open-source решений на международной платформе LMArena
- 16:45 19.12.2025
- РФ готова подумать о прекращении ударов вглубь Украины в день выборов — Путин
- 16:35 19.12.2025
- Кадыров поблагодарил Путина за высокую оценку семейных традиций и ранних браков на Кавказе
- 16:20 19.12.2025
- Путин заявил, что его успехи не отделены от успехов страны
- 16:10 19.12.2025
- РФ с появлением мессенджера Мах стала обладать цифровым суверенитетом — Путин
- 16:00 19.12.2025
- Путин надеется, что повышение утильсбора будет не вечным



комментарии(0)