0
0
2209

Ученые Сбера представили модели искусственного интеллекта, способные распознавать русский жестовый язык

15:53 23.11.2023


Сбер представил нейросетевые модели, позволяющие распознавать русский жестовый язык. Об этом на конференции AI Journey сообщил старший вице-президент, СTO, руководитель блока «Технологи» Сбербанка Андрей Белевцев.

Команда Vision RnD (из Управления экспериментальных систем машинного обучения) в SberDevices, разрабатывающая одно из таких решений, первой в мире представила прототип общения с генеративной языковой моделью при помощи жестового языка в открытом доступе. Это стало возможно благодаря использованию GigaChat API, программного интерфейса доступа к сервису GigaChat. Генеративная модель GigaChat сама, без дополнительных преобразований, понимает контекст распознанных жестов. Например, распознанные отдельные слова: «Я Идти Улица Гулять» сервис сам преобразовывает в корректную фразу: «Я пошел гулять на улицу», сохраняя контекст передачи информации.

Текущая версия модели позволяет распознавать более 2500 жестов, включая понимание дактиля (произношение слов по буквам) и возможность распознавать составные жесты. Кроме того, модель понимает терминологию по темам банковской сферы, транспорта, животных, и даже несколько слов из сферы медицины и образования. Этот объем покрывает существенную часть словаря русского жестового языка, позволяя создавать сервисы с нужным прикладным применением.

На базе этой модели были обучены нейросети для распознавания американского жестового языка, которые заняли первую строчку в публичном рейтинге WLASL-2000   Достичь такого результата позволило использование самого разнообразного и большого в мире датасета для распознавания русского жестового языка – Slovo. Датасет и обученная на нем модель выложены в открытый доступ https://github.com/hukenovs/slovo .

Другая команда исследователей, из подразделения Sber AI во благо общества, разработала и опубликовала в открытом доступе  легкую модель распознавания жестового языка, не требовательную к вычислительным ресурсам. Модель работает на CPU, что снижает себестоимость решений, создаваемых на ее основе. Это дает возможность широкому кругу разработчиков проектировать инклюзивное программное обеспечение, например, продукты и сервисы для коммуникации или инструменты для изучения жестового языка. На сегодняшний день алгоритм распознает 1600 жестов и преобразовывает в слова до трех жестов в секунду на стандартных персональных компьютерах. В 2024 году планируется тестирование и внедрение модели распознавания русского жестового языка и решений на ее основе в ряде регионов России.

«Сервисы для распознавания русского жестового языка и созданная Сбером система искусственного интеллекта GigaChat позволят преодолеть коммуникационный разрыв и сделают мир доступнее для людей с нарушением слуха, – отметил Андрей Белевцев. – Модели могут использоваться в рамках исследований, позволяющих развивать сервисы для пользователей с инвалидностью. Например, для создания доступной среды в многофункциональных центрах (МФЦ), в транспортной отрасли (аэропорты, вокзалы, метро), в больницах для общения пациента и врача, в банковских сервисах и адаптации онлайн и оффлайн-образования».


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.


Комментарии отключены - материал старше 3 дней

Новости


23:00 18.06.2025
Трамп: Я не хочу втягиваться в конфликт с Ираном
0
376
21:45 18.06.2025
Гросси сказал, что МАГАТЭ никогда не заявляли, что Иран разрабатывает ядерное оружие
0
451
20:34 18.06.2025
200 тысяч предпринимателей уже решают бизнес-задачи с помощью Giga-ассистента
0
442
20:00 18.06.2025
В Иране ограничен доступ к сети Интернет, NetBlocks пишет о почти полном его отключении
0
485
18:20 18.06.2025
При возвращении на рынок РФ, ни о каких преференциях для западных компаний не может быть и речи - Дмитриев
0
573
18:03 18.06.2025
Решение Сбера поможет бизнесу лучше прогнозировать поведение клиентов
0
501
17:40 18.06.2025
Вести переговоры с Ираном еще не слишком поздно — Трамп
0
591
17:30 18.06.2025
Сбер сообщил о запуске платформы кейсов внедрения искусственного интеллекта в БРИКС
0
574
17:12 18.06.2025
Израиль ликвидировал штаб внутренней безопасности Ирана — глава израильского МО
0
588
17:00 18.06.2025
Западные СМИ не искажают точку зрения Путина при прямом общении — Песков
0
621

Возврат к списку