Ученые Сбера разработали модели искусственного интеллекта для распознавания сложных эмоций
12:18 24.10.2025
Учёные Центра практического искусственного интеллекта Сбера значительно повысили точность определения эмоций на фото и видео с помощью искусственного интеллекта. Их исследования, представленные на ведущей мировой конференции по компьютерному зрению ECCV 2024, открывают новые возможности для анализа сложных человеческих эмоций в реальных условиях.
В статье «Распознавание составных эмоций лиц на видео с помощью сглаживания предсказаний эффективных многозадачных нейронных сетей» (Smoothing Predictions of Multi-Task EmotiNet Models for Compound Facial Expression Recognition) решается задача распознавания составных эмоций. В жизни люди редко проявляют только одну базовую эмоцию. Чаще мы испытываем смешанные состояния — например, «радостно удивлённый» или «печально испуганный». Именно такие нюансы улавливает новый алгоритм. Он использует легковесные нейросетевые модели, такие как MT-EmotiMobileFaceNet, для извлечения эмоциональных признаков. Затем специальная постобработка сглаживает предсказания с помощью усреднения или гауссовских фильтров. Этот подход резко повышает точность, конкурируя с более сложными и ресурсоёмкими методами.
Практический результат впечатляет. Метод сглаживания предсказаний улучшил F1-меру классификации составных эмоций на 4,5 процентных пункта. Это позволило работе занять 2-е место в престижном конкурсе Compound Expression Recognition в рамках ABAW-7 на конференции ECCV. Ключевое преимущество — точное распознавание без дообучения модели на новых данных с составными эмоциями, что раньше было серьёзным препятствием для практического применения.
Второе исследование, «Анализ эмоций на фото и видео с использованием эффективных многозадачных нейросетевых моделей» (Multi-Task Affective Behaviour Analysis based on MT-EmotiNet Models), посвящено созданию лёгких моделей для одновременного решения нескольких задач. Они распознают выражения лица, знак (valence) и интенсивность (arousal) его эмоций, а также 12 кодов лицевых движений из классификации П. Экмана. Новая технология работает прямо на мобильных устройствах, не отправляя видео лиц в облако, что экономит вычислительные ресурсы и повышает уровень безопасности персональных данных.
Учёные разработали серию легковесных нейросетей, включая MT-EmotiDDAMFNet и MT-EmotiEffNet. Объединение признаков от двух лучших архитектур позволило значительно улучшить результаты базового решения конкурса ABAW-7. Точность распознавания выражений лица выросла на 7 процентных пунктов, а качество предсказания знака и интенсивности эмоций — в 1,25 раза. Суммарная метрика качества для трёх задач конкурса увеличилась в 4,5 раза. Это достижение принесло команде ученых Сбера серебряную медаль конкурса Multi-Task Learning Challenge.
Предложенные подходы демонстрируют, что эффективные легковесные модели с грамотной постобработкой могут успешно конкурировать с громоздкими ансамблями сложных нейросетей. Все модели и исходный код доступны в открытой библиотеке EmotiEffLib, что позволяет другим исследователям развивать это направление. Польза этих разработок многослойна. Для бизнеса их применение может привести к революции в цифровом маркетинге и анализе пользовательского опыта. Компании смогут точно оценивать эмоциональную реакцию на контент или продукты. Производители смартфонов и умных устройств смогут разработать более чуткие системы взаимодействия с пользователем. Автопроизводители смогут создать более надёжные системы мониторинга состояния водителя.
Для общества преимущества не менее значимы. Технология улучшает взаимодействие человека и компьютера, делая его более естественным и эмпатичным. Появляется возможность создания доступных диагностических инструментов в психологии и психиатрии для раннего выявления эмоциональных расстройств. Во всех этих случаях предложенный подход может применяться для того, чтобы сделать анализ сложных эмоций точным, доступным и безопасным.
Новости
- 10:05 24.01.2024
- КНДР запустила несколько крылатых ракет в сторону Желтого моря — Рёнхап
- 09:32 24.01.2024
- Жители Николаева отмечают большие колонны техники ВСУ, идущие в сторону Херсонской области
- 09:05 24.01.2024
- Силы ПВО РФ перехватили 4 украинских дрона над Орловской областью
- 20:00 23.01.2024
- ВМФ РФ получит первый боевой ледокол «Иван Папанин» в этом году — главком
- 17:00 23.01.2024
- В подконтрольном Киеву городе Херсоне вновь слышны взрывы
- 14:32 23.01.2024
- ВС РФ нанесли удар высокоточным оружием по объектам ВПК Украины
- 13:00 23.01.2024
- Удар ВС РФ по Киеву и Харькову нельзя считать ответом на удар ВСУ по Донецку — Песков
- 12:32 23.01.2024
- НАТО подписала контракт на $1,2 млрд на закупку боеприпасов калибра 155 мм
- 12:05 23.01.2024
- Белгородскую область атаковали более десяти украинских беспилотников за сутки
- 10:20 23.01.2024
- В Белоруссии началась штабная тренировка Вооруженных сил — Минобороны


Комментировать
комментарии(0)
Комментировать