Понедельник 06.10.2025 06:03
Войти
Войти Забыли пароль?
Зарегистрироваться
свежие приложения:   НГ-Exlibris
Бизнес оптимизирует налоги за счет сотрудников Экономика

Бизнес оптимизирует налоги за счет сотрудников

0
477
МВД России больше не будет заниматься проблемами кочевников Политика

МВД России больше не будет заниматься проблемами кочевников

0
503
Последние пять лет доля Росатома в энергобалансе России не растет От редакции

Последние пять лет доля Росатома в энергобалансе России не растет

0
6255
Константин Ремчуков. В КНР создали концепцию цивилизации, нацеленную на преодоление западного образца модернизации МониториНГ

Константин Ремчуков. В КНР создали концепцию цивилизации, нацеленную на преодоление западного образца модернизации

0
3307
Отечественную фармацевтику ведут по пути отстающего развития Экономика

Отечественную фармацевтику ведут по пути отстающего развития

0
463
КПРФ вышла на улицу против президента Ельцина Политика

КПРФ вышла на улицу против президента Ельцина

0
422
ВСУ готовятся увеличить штат армии дронов вдвое Воины и Армии

ВСУ готовятся увеличить штат армии дронов вдвое

0
570
Конфликт "кабульцев" и "кандагарцев" грозит Афганистану новой гражданской войной Эксклюзив НГ

Конфликт "кабульцев" и "кандагарцев" грозит Афганистану новой гражданской войной

0
3283
О замороженных российских активах, которые в ЕС не хотят конфисковать От редакции

О замороженных российских активах, которые в ЕС не хотят конфисковать

0
433
Китай поставил рекорд роботизации Экономика

Китай поставил рекорд роботизации

0
421
Войну в Газе пытаются потушить с разных сторон В мире

Войну в Газе пытаются потушить с разных сторон

0
391
"Грузинская мечта" одержала на выборах бессмысленную победу СНГ

"Грузинская мечта" одержала на выборах бессмысленную победу

0
478
Противники помощи Украине выиграли в Чехии В мире

Противники помощи Украине выиграли в Чехии

0
417
Новые власти Сирии предпочли непрямые выборы В мире

Новые власти Сирии предпочли непрямые выборы

0
392
Туркменистан теряет газовые рынки на Востоке и Юге СНГ

Туркменистан теряет газовые рынки на Востоке и Юге

0
461
Как Вашингтон намерен перевоспитать Каракас КАРТ-БЛАНШ

Как Вашингтон намерен перевоспитать Каракас

0
392
"Коллекция" намекает на масштаб Культура

"Коллекция" намекает на масштаб

0
361
Музыкальные исповеди и откровения фестиваля "Современная музыка" Культура

Музыкальные исповеди и откровения фестиваля "Современная музыка"

0
358
Ожившие рисунки нападают на людей Кино

Ожившие рисунки нападают на людей

0
368
Исторический корпус Московской шерстоткацкой мануфактуры помогут возродить студенты Москва

Исторический корпус Московской шерстоткацкой мануфактуры помогут возродить студенты

0
356
ХАМАС согласился с ключевыми тезисами плана Трампа по Газе... Неделя в обзоре

ХАМАС согласился с ключевыми тезисами плана Трампа по Газе...

0
466
Поток негативных экономических новостей становится все плотнее... Неделя в обзоре

Поток негативных экономических новостей становится все плотнее...

0
763
Путин на "Валдае" приветствует моду на кокошники... Неделя в обзоре

Путин на "Валдае" приветствует моду на кокошники...

0
427
В Киргизии предлагают вернуть смертную казнь... Неделя в обзоре

В Киргизии предлагают вернуть смертную казнь...

0
393
0
0
1724

Исследователи Сбера повысили точность распознавания русского языка искусственным интеллектом

11:37 21.08.2025


Исследователи Сбера нашли способ повысить качество распознавания русского языка искусственным интеллектом (AI). Новый метод предобучения AI-моделей, получивший название HuBERT-CTC, использует целевые переменные из CTC-модели распознавания (Connectionist Temporal Classification). Это позволяет формировать более семантические представления данных, в то время как существующие модели (wav2vec2.0, HuBERT и BEST-RQ) опираются на низкоуровневые акустические переменные.

Исследование подробно описано в научной статье «GigaAM: Efficient Self-Supervised Learner for Speech Recognition» («GigaAM: эффективный метод предобучения для распознавания речи») и представлено на международной конференции Interspeech 2025 — ключевом событии в области речевых технологий. Метод уже показал отличные результаты для русского языка. Он снижает количество ошибок распознавания (Word Error Rate) на 50% по сравнению с моделью Whisper-large-v3 от OpenAI.

Метод также решает ключевую проблему индустрии — зависимость от дефицитных размеченных аудиоданных. Self-supervised обучение позволяет моделям учиться на огромных массивах неразмеченных данных. Это открывает путь к созданию качественных систем для любых языков и специализированных доменов. Технология масштабируется по размеру модели и объёму данных. Динамическое маскирование self-attention наделяет модель уникальной гибкостью: одна архитектура работает в онлайн- и офлайн-режиме без необходимости инвестирования в переобучение.

Решение, предложенное исследователями Сбера, имеет большое практическое значение для сервисов автоматического распознавания речи и голосовых помощников, контакт-центров и систем аналитики телефонных звонков. Новый метод может быть очень востребован в мультимодальных системах, например, в чат-ботах с аудиопотоком. Исследователи получают новый мощный инструмент предобучения моделей. Открытый код позволяет AI-сообществу дообучать модели искусственного интеллекта и применять его под свои языки и задачи.

«Мы переосмыслили сам подход к предобучению моделей, сместив фокус на семантические представления, – отметил технический директор GigaChat Сбербанка Фёдор Минькин. – Это не просто инкрементальное улучшение метрики, а качественный скачок. Новая архитектура демонстрирует высокую эффективность и гибкость. Она ломает барьеры, которые долгое время сдерживали развитие ASR-систем для языков с малым количеством данных. Думаю, что метод HuBERT-CTC может стать новым стандартом для индустрии, ускорит прогресс и заложит основу для следующего поколения голосовых интерфейсов».


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.


Комментарии отключены - материал старше 3 дней

Новости


22:20 05.10.2025
В ХАМАС опровергли информацию СМИ о прекращении огня и сдаче оружия
0
467
20:45 05.10.2025
Нетаньяху распорядился направить делегацию в Египет для переговоров по Газе
0
517
19:31 05.10.2025
ХАМАС сможет освободить всех израильских заложников за день и сдать оружие - СМИ
0
582
18:39 05.10.2025
Трамп о предложении Путина по ДСНВ: Для меня это звучит как хорошая идея
0
626
17:30 05.10.2025
ЦИК Молдавии привел окончательные данные по выборам в парламент
0
716
17:15 05.10.2025
Рубио: Продолжающиеся переговоры между ХАМАС и Израилем еще не означают конец войны
0
662
14:10 05.10.2025
Зеленский: «Одностороннее прекращение огня в небе возможно»
0
947
11:44 05.10.2025
Поставка Киеву ракет Tomahawk разрушит позитивные тенденции в отношениях РФ и США - Путин
0
917
11:05 05.10.2025
Премьер Грузии сказал, что в Молдавии сложилась «трагическая ситуация»
0
1038
09:46 05.10.2025
Страны мира «роют окопы и ждут начала» войны - Вучич
0
1139

Возврат к списку