Четверг 20.11.2025 23:56
Войти
Войти Забыли пароль?
Зарегистрироваться
свежие приложения:   НГ-Exlibris
Белый дом рассматривает варианты завершения конфликта между Россией и Украиной В мире

Белый дом рассматривает варианты завершения конфликта между Россией и Украиной

0
698
Правительство развертывает киберплатформы для противостояния аферистам Экономика

Правительство развертывает киберплатформы для противостояния аферистам

0
225
На транспортный комплекс России за три года потратят 6 триллионов рублей Экономика

На транспортный комплекс России за три года потратят 6 триллионов рублей

0
244
Константин Ремчуков. Японо-китайские отношения резко обострились из-за слов, а также из-за действий и намерений МониториНГ

Константин Ремчуков. Японо-китайские отношения резко обострились из-за слов, а также из-за действий и намерений

0
1299
В коррупционном скандале в Киеве возникла пауза СНГ

В коррупционном скандале в Киеве возникла пауза

0
247
Молдавия ищет свой газ в украинских и румынских хранилищах СНГ

Молдавия ищет свой газ в украинских и румынских хранилищах

0
205
Счетная палата оценила эффективность финансирования Кавказа Экономика

Счетная палата оценила эффективность финансирования Кавказа

0
249
Мысль изреченная есть фейк (+Аудиоверсия) От редакции

Мысль изреченная есть фейк (+Аудиоверсия)

0
6647
"Яблоко" отбрасывают от думских выборов Политика

"Яблоко" отбрасывают от думских выборов

0
241
КПРФ показывает знаковые фигуры электорату и спонсорам Политика

КПРФ показывает знаковые фигуры электорату и спонсорам

0
195
Лукашенко освободил священников СНГ

Лукашенко освободил священников

0
241
Академик Арбатов: Ядерное оружие рельефно вернулось в отношения великих держав Дипкурьер

Академик Арбатов: Ядерное оружие рельефно вернулось в отношения великих держав

0
7364
Итальянские премьер-министр и президент борются друг с другом за власть В мире

Итальянские премьер-министр и президент борются друг с другом за власть

0
271
Китай потеснил США в Африке В мире

Китай потеснил США в Африке

0
276
Газу готовят к миссии неарабских миротворцев В мире

Газу готовят к миссии неарабских миротворцев

0
257
Германия будет защищать свои интересы в космосе В мире

Германия будет защищать свои интересы в космосе

0
238
Вещи на выброс странствуют в поисках Рая Кино

Вещи на выброс странствуют в поисках Рая

0
258
О любви за кадром и в кадре Телевидение

О любви за кадром и в кадре

0
230
На Кубке мира в индийском Гоа определился состав полуфиналистов Шахматы

На Кубке мира в индийском Гоа определился состав полуфиналистов

0
337
От аквацентра в Пыть-Яхе до образовательного центра в Малом Атлыме Регионы России

От аквацентра в Пыть-Яхе до образовательного центра в Малом Атлыме

0
209
Жизнь прекрасна, как писали в «Известиях» Главная тема

Жизнь прекрасна, как писали в «Известиях»

0
1161
В древнерусской радости Персона

В древнерусской радости

0
931
Молчи, грусть, молчи Кафедра, факультатив

Молчи, грусть, молчи

0
1004
Культура – защитница детства Non-fiction

Культура – защитница детства

0
780
0
0
1913

Исследователи Сбера повысили точность распознавания русского языка искусственным интеллектом

11:37 21.08.2025


Исследователи Сбера нашли способ повысить качество распознавания русского языка искусственным интеллектом (AI). Новый метод предобучения AI-моделей, получивший название HuBERT-CTC, использует целевые переменные из CTC-модели распознавания (Connectionist Temporal Classification). Это позволяет формировать более семантические представления данных, в то время как существующие модели (wav2vec2.0, HuBERT и BEST-RQ) опираются на низкоуровневые акустические переменные.

Исследование подробно описано в научной статье «GigaAM: Efficient Self-Supervised Learner for Speech Recognition» («GigaAM: эффективный метод предобучения для распознавания речи») и представлено на международной конференции Interspeech 2025 — ключевом событии в области речевых технологий. Метод уже показал отличные результаты для русского языка. Он снижает количество ошибок распознавания (Word Error Rate) на 50% по сравнению с моделью Whisper-large-v3 от OpenAI.

Метод также решает ключевую проблему индустрии — зависимость от дефицитных размеченных аудиоданных. Self-supervised обучение позволяет моделям учиться на огромных массивах неразмеченных данных. Это открывает путь к созданию качественных систем для любых языков и специализированных доменов. Технология масштабируется по размеру модели и объёму данных. Динамическое маскирование self-attention наделяет модель уникальной гибкостью: одна архитектура работает в онлайн- и офлайн-режиме без необходимости инвестирования в переобучение.

Решение, предложенное исследователями Сбера, имеет большое практическое значение для сервисов автоматического распознавания речи и голосовых помощников, контакт-центров и систем аналитики телефонных звонков. Новый метод может быть очень востребован в мультимодальных системах, например, в чат-ботах с аудиопотоком. Исследователи получают новый мощный инструмент предобучения моделей. Открытый код позволяет AI-сообществу дообучать модели искусственного интеллекта и применять его под свои языки и задачи.

«Мы переосмыслили сам подход к предобучению моделей, сместив фокус на семантические представления, – отметил технический директор GigaChat Сбербанка Фёдор Минькин. – Это не просто инкрементальное улучшение метрики, а качественный скачок. Новая архитектура демонстрирует высокую эффективность и гибкость. Она ломает барьеры, которые долгое время сдерживали развитие ASR-систем для языков с малым количеством данных. Думаю, что метод HuBERT-CTC может стать новым стандартом для индустрии, ускорит прогресс и заложит основу для следующего поколения голосовых интерфейсов».


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.


Комментарии отключены - материал старше 3 дней

Новости


22:38 20.11.2025
Уиткофф и Рубио последний месяц «тихо работали над планом» урегулирования на Украине – Белый дом
0
162
22:00 20.11.2025
Путин: Эти люди (украинская власть — прим. ТАСС), сидя на золотых горшках, вряд ли думают о судьбе своей страны
0
175
21:30 20.11.2025
Путин в четверг, 20 ноября, посетил один из командных пунктов группировки «Запад»
0
248
20:38 20.11.2025
В Москве наградили лауреатов национальной премии «Лидеры ИИ»
0
274
20:10 20.11.2025
Две вакцины против опухолей получили разрешение Минздрава на использование
0
316
19:34 20.11.2025
План Трампа по урегулированию получили в Киеве - офис Зеленского
0
379
19:02 20.11.2025
Сбер и Аэрофлот договорились совместно развивать технологии генеративного искусственного интеллекта
0
364
18:50 20.11.2025
Каллас заявила, что у ЕС есть план по Украине всего из двух пунктов…
0
484
18:32 20.11.2025
Предложения США по Украине предполагают снятие санкций с России – Bloomberg
0
428
17:43 20.11.2025
Киев шантажирует персонал ЗАЭС через давление на родственников за пределами РФ — Ульянов
0
436

Возврат к списку