Четверг 21.08.2025 21:10
Войти
Войти Забыли пароль?
Зарегистрироваться
свежие приложения:   НГ-Exlibris
Механизм инфраструктурных кредитов дает сбои в регионах Экономика

Механизм инфраструктурных кредитов дает сбои в регионах

0
70
США и их союзники готовятся к миру с позиции силы В мире

США и их союзники готовятся к миру с позиции силы

0
127
Совершил ли Трамп геополитическую ошибку в отношении Индии От редакции

Совершил ли Трамп геополитическую ошибку в отношении Индии

0
1741
Константин Ремчуков. Си Цзиньпин заявил, что Китай готов сотрудничать с Бразилией, чтобы показать пример единства стран глобального Юга МониториНГ

Константин Ремчуков. Си Цзиньпин заявил, что Китай готов сотрудничать с Бразилией, чтобы показать пример единства стран глобального Юга

0
1037
Перспектива переговоров ожесточает бои в зоне СВО Воины и Армии

Перспектива переговоров ожесточает бои в зоне СВО

0
175
Сезонная дефляция соревнуется с подорожанием услуг ЖКХ Экономика

Сезонная дефляция соревнуется с подорожанием услуг ЖКХ

0
26
Общественники обещают научить партии эффективному наблюдению за выборами Политика

Общественники обещают научить партии эффективному наблюдению за выборами

0
54
Константин Ремчуков. Главный итог встречи на Аляске – превосходная химия между Дональдом Трампом и Владимиром Путиным Политика

Константин Ремчуков. Главный итог встречи на Аляске – превосходная химия между Дональдом Трампом и Владимиром Путиным

0
4903
Психологи и зарплаты выведут судей из стресса Политика

Психологи и зарплаты выведут судей из стресса

0
103
БРИКС перестраивает торговлю в ответ на американские пошлины Экономика

БРИКС перестраивает торговлю в ответ на американские пошлины

0
3
Верховный суд ограничил вмешательство в работу присяжных Политика

Верховный суд ограничил вмешательство в работу присяжных

0
84
Запрет интернет-звонков совпал с интересами крупного бизнеса и чиновников Экономика

Запрет интернет-звонков совпал с интересами крупного бизнеса и чиновников

0
2747
Санду согласилась на переговоры о вступлении в ЕС без Украины СНГ

Санду согласилась на переговоры о вступлении в ЕС без Украины

0
144
Запад вступает в ледокольную гонку с Россией В мире

Запад вступает в ледокольную гонку с Россией

0
119
ХАМАС загоняют под землю В мире

ХАМАС загоняют под землю

0
117
Святослав Рыбас. Кассандра-2025: сегодняшние прогнозы и вчерашние аналогии Non-fiction

Святослав Рыбас. Кассандра-2025: сегодняшние прогнозы и вчерашние аналогии

0
1135
Белорусским идеологам будут ставить оценки СНГ

Белорусским идеологам будут ставить оценки

0
118
Буддизм в Тибете будет социалистическим В мире

Буддизм в Тибете будет социалистическим

0
126
Поедут ли иностранцы учиться в Америку Я так вижу

Поедут ли иностранцы учиться в Америку

0
92
"Золотой мост дружбы" свяжет Казахстан и Киргизию СНГ

"Золотой мост дружбы" свяжет Казахстан и Киргизию

0
141
Левон Аронян выиграл 4-й этап Гранд-чесс-тура Шахматы

Левон Аронян выиграл 4-й этап Гранд-чесс-тура

0
155
Телеканал "Ю" отправил подростков-мажоров в многодетные семьи, а "Пятница!" – детей звезд на остров в Таиланде Телевидение

Телеканал "Ю" отправил подростков-мажоров в многодетные семьи, а "Пятница!" – детей звезд на остров в Таиланде

0
153
День Государственного флага в столице начали отмечать московской кадрилью Москва

День Государственного флага в столице начали отмечать московской кадрилью

0
72
Мировые премьеры сочинений Георгия Свиридова пройдут осенью в Москве Культура

Мировые премьеры сочинений Георгия Свиридова пройдут осенью в Москве

0
54
0
0
436

Исследователи Сбера повысили точность распознавания русского языка искусственным интеллектом

11:37 21.08.2025


Исследователи Сбера нашли способ повысить качество распознавания русского языка искусственным интеллектом (AI). Новый метод предобучения AI-моделей, получивший название HuBERT-CTC, использует целевые переменные из CTC-модели распознавания (Connectionist Temporal Classification). Это позволяет формировать более семантические представления данных, в то время как существующие модели (wav2vec2.0, HuBERT и BEST-RQ) опираются на низкоуровневые акустические переменные.

Исследование подробно описано в научной статье «GigaAM: Efficient Self-Supervised Learner for Speech Recognition» («GigaAM: эффективный метод предобучения для распознавания речи») и представлено на международной конференции Interspeech 2025 — ключевом событии в области речевых технологий. Метод уже показал отличные результаты для русского языка. Он снижает количество ошибок распознавания (Word Error Rate) на 50% по сравнению с моделью Whisper-large-v3 от OpenAI.

Метод также решает ключевую проблему индустрии — зависимость от дефицитных размеченных аудиоданных. Self-supervised обучение позволяет моделям учиться на огромных массивах неразмеченных данных. Это открывает путь к созданию качественных систем для любых языков и специализированных доменов. Технология масштабируется по размеру модели и объёму данных. Динамическое маскирование self-attention наделяет модель уникальной гибкостью: одна архитектура работает в онлайн- и офлайн-режиме без необходимости инвестирования в переобучение.

Решение, предложенное исследователями Сбера, имеет большое практическое значение для сервисов автоматического распознавания речи и голосовых помощников, контакт-центров и систем аналитики телефонных звонков. Новый метод может быть очень востребован в мультимодальных системах, например, в чат-ботах с аудиопотоком. Исследователи получают новый мощный инструмент предобучения моделей. Открытый код позволяет AI-сообществу дообучать модели искусственного интеллекта и применять его под свои языки и задачи.

«Мы переосмыслили сам подход к предобучению моделей, сместив фокус на семантические представления, – отметил технический директор GigaChat Сбербанка Фёдор Минькин. – Это не просто инкрементальное улучшение метрики, а качественный скачок. Новая архитектура демонстрирует высокую эффективность и гибкость. Она ломает барьеры, которые долгое время сдерживали развитие ASR-систем для языков с малым количеством данных. Думаю, что метод HuBERT-CTC может стать новым стандартом для индустрии, ускорит прогресс и заложит основу для следующего поколения голосовых интерфейсов».


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.

Новости


21:00 21.08.2025
Трамп сообщил, что лично вместе с гвардией пойдет ночью патрулировать улицы Вашингтона
0
35
20:45 21.08.2025
Нетаньяху : Я прибыл в сектор Газа, чтобы утвердить планы армии по захвату города Газа
0
74
20:30 21.08.2025
Трамп дал две недели на определение возможности мирного урегулирования на Украине
0
118
20:30 21.08.2025
Сборник The Beatles Anthology 4 выйдет в свет в сентябре – Пол Маккартни
0
107
20:00 21.08.2025
Задержанный в Италии по подозрению в подрыве «Северных потоков» украинец раньше служил в ВСУ и СБУ - WSJ
0
152
19:45 21.08.2025
Падение БПЛА в Воронежской области привело к задержке более 70 поездов дальнего следования
0
159
18:50 21.08.2025
Экзамен для кандидатов в председатели Верховного суда РФ, так как не поступило ни одной заявки
0
240
17:40 21.08.2025
Минтранс РФ ожидает, что к 2050 г. 50% всех транспортных средств будут беспилотными
0
283
17:12 21.08.2025
«Ангара-1.2» вывела на орбиту военные спутники
0
368
17:00 21.08.2025
Украина будет «дисфункциональным государством-обрубком», если продолжит конфликт — эксперт
0
404

Возврат к списку