Среда 15.04.2026 06:08
Войти
Войти Забыли пароль?
Зарегистрироваться
свежие приложения:   Наука
Переговоры США и Ирана обошли морскую блокаду В мире

Переговоры США и Ирана обошли морскую блокаду

0
540
Мадьяру предписано захватить власть после выборов В мире

Мадьяру предписано захватить власть после выборов

0
478
Константин Ремчуков. Франция вывела с территории США все свое золото до последней унции Политика

Константин Ремчуков. Франция вывела с территории США все свое золото до последней унции

0
3188
Константин Ремчуков: Китай защищает здоровье учащихся, запрещая большие домашние задания и частые экзамены МониториНГ

Константин Ремчуков: Китай защищает здоровье учащихся, запрещая большие домашние задания и частые экзамены

0
4659
Зеленский втягивает Европу в воздушную войну против России Воины и Армии

Зеленский втягивает Европу в воздушную войну против России

0
533
Почти две трети российских семей финансово неустойчивы Экономика

Почти две трети российских семей финансово неустойчивы

0
441
Банкиров просят поделиться сверхприбылью Экономика

Банкиров просят поделиться сверхприбылью

0
412
Александр Ципко. Лидеры перестройки стали жертвами слома культуры мышления Идеи и люди

Александр Ципко. Лидеры перестройки стали жертвами слома культуры мышления

0
5438
КПРФ воодушевляют и настораживают перемены в Венгрии Политика

КПРФ воодушевляют и настораживают перемены в Венгрии

0
400
Цивилева сообщила депутатам об указании президента Политика

Цивилева сообщила депутатам об указании президента

0
448
Результаты бюджетной поддержки спорта в России вызывают большие сомнения Экономика

Результаты бюджетной поддержки спорта в России вызывают большие сомнения

0
359
Мягкие бюджетные ограничения тянут экономику России на дно От редакции

Мягкие бюджетные ограничения тянут экономику России на дно

0
14206
Судебно-экспертную деятельность наладят через пять лет Политика

Судебно-экспертную деятельность наладят через пять лет

0
371
В Киеве связывают кризис в агросекторе с иранским конфликтом СНГ

В Киеве связывают кризис в агросекторе с иранским конфликтом

0
355
Афганская разведка в Пекине объяснится за погибших китайцев В мире

Афганская разведка в Пекине объяснится за погибших китайцев

0
406
Ограничения интернета мешают РФ вписаться в новый технологический уклад От редакции

Ограничения интернета мешают РФ вписаться в новый технологический уклад

0
14922
Тбилиси потерял главного друга в Европе СНГ

Тбилиси потерял главного друга в Европе

0
403
Канадский премьер переманил оппозицию на свою сторону В мире

Канадский премьер переманил оппозицию на свою сторону

0
409
Китайские танкеры игнорируют американскую угрозу В мире

Китайские танкеры игнорируют американскую угрозу

0
424
Константин Ремчуков: Может ли Трамп в одиночку завершить войну, в которой участвуют трое Политика

Константин Ремчуков: Может ли Трамп в одиночку завершить войну, в которой участвуют трое

0
16607
Лукашенко поздравил противника Орбана с победой СНГ

Лукашенко поздравил противника Орбана с победой

0
335
Жизнь с "Чайфом" Культура

Жизнь с "Чайфом"

0
443
Екатеринбургский театр кукол показал в конкурсе "Золотой маски" спектакль "Зойкина квартира" Культура

Екатеринбургский театр кукол показал в конкурсе "Золотой маски" спектакль "Зойкина квартира"

0
380
Конкурс ММКФ-2026 будет решать семейные проблемы Кино

Конкурс ММКФ-2026 будет решать семейные проблемы

0
338
0
0
670

Российские исследователи нашли способ проверять качество моделей ИИ без размеченных данных

18:54 14.04.2026


Исследователи Центра практического искусственного интеллекта Сбербанка и НИУ ВШЭ предложили способ оценивать качество векторных представлений (эмбеддингов) без участия человека и размеченных данных. Специализированная метрика Persistence помогает выбрать лучшую архитектуру модели и вовремя остановить её обучение, экономя GPU-часы и ускоряя выход ИИ-решений в реальный бизнес. Результаты исследования изложены в научной статье, которая принята на конференцию высшего уровня ECIR 2026 (48-я Европейская конференция по информационному поиску) в Делфте, Нидерланды.

В современном машинном обучении модели, которые учатся без ручной разметки, становятся основой для рекомендаций, финансовой аналитики и поведенческого моделирования. Но у разработчиков долго не было инструмента, чтобы без ручной разметки данных понять, хорошие ли эмбеддинги получились. Существующие метрики предполагают линейную разделимость данных или работают только в узких сценариях. Предложенная метрика решает ключевые задачи автоматически: подбирает оптимальный размер эмбеддинга, количество слоёв и функцию потерь, а также указывает, на какой эпохе обучения нужно остановиться, чтобы модель не переобучилась и не осталась сырой.

Метрика основана на методе топологического анализа данных. Над множеством точек в пространстве эмбеддингов строится фильтрация Вьеториса–Рипса, а суммарная персистентность топологических признаков отражает геометрическое богатство этого пространства. Метрика российских ученых устойчиво превосходит зарубежных конкурентов (RankMe, α-ReQ, NESum, SelfCluster) по корреляции с качеством на прикладных задачах — в финансовой аналитике, поведенческом моделировании и коллаборативной фильтрации.

Для бизнеса это прямая экономия. Раньше выбор лучшей модели эмбеддингов требовал тестирования каждой конфигурации на размеченных данных — требует ресурсов и времени. Persistence оценивает качество модели без лишних задач и находит оптимальную эпоху обучения, когда эмбеддинги максимально структурированы (без пере- или недообучения). Компании тратят меньше ресурсов на эксперименты и быстрее запускают лучшую модель в прод. Даже при малом количестве разметки или её отсутствии (например, новая категория товаров) Persistence работает. Метрика универсальна: подходит для любых бизнес-задач, а эмбеддинги не заточены под один классификатор. Persistence устойчива там, где валидация падает (временной сдвиг, сложные пайплайны), — она оценивает внутреннюю геометрию эмбеддингов, а не конкретную выборку.

Решение позволит получать более точные рекомендации в онлайн-кинотеатрах и маркетплейсах. Он улучшит работу голосовых помощников и ускорит внедрение ИИ в медицину. Снизится барьер применения моделей без учителя в областях с дефицитом разметки: здравоохранение, социальные науки, гуманитарные дисциплины.

«До появления специализированной метрики аналитики данных выбирали архитектуру и момент остановки обучения модели вслепую или через ресурсозатратные эксперименты с разметкой. Это требовало сотен GPU-часов и замедляло вывод моделей в прод. Наша метрика автоматически оценивает качество эмбеддингов по их внутренней геометрии, - рассказал Сергей Рябов, директор департамента развития ИИ-решений Сбербанка. - Обучают несколько конфигураций — Persistence указывает лучшую. Или обучают одну модель — метрика определяет эпоху остановки, избегая переобучения. В результате происходит экономия ресурсов, развиваются универсальные модели, устойчивые к сдвигам распределения данных. Для бизнеса — скорость и предсказуемость, для пользователей — более точные ИИ-сервисы, быстрее адаптирующиеся к новым сценариям без длительной настройки».


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.

Новости


21:30 14.04.2026
Уолц рассказал, чем займутся США после решения проблемы на Ближнем Востоке
0
659
20:50 14.04.2026
В Совбезе РФ отметили, что у Ирана еще есть значительное количество оружия
0
657
18:58 14.04.2026
Сбер запустил программу поддержки бизнеса в Дагестане и Чечне для пострадавших от ЧС
0
642
18:26 14.04.2026
После мартовского рейда в регионах РФ было принято порядка 6 тыс решений о выдворении – МВД России
0
692
17:40 14.04.2026
В Минпросвещения РФ уверены в пользе обязательных школьных дежурств
0
690
17:12 14.04.2026
МВФ улучшил прогноз темпов роста ВВП РФ в 2026 году до 1,1%
0
800
17:00 14.04.2026
Зеленский заявил, что ВСУ ждут возвращения уехавших украинцев
0
913
16:32 14.04.2026
Вучич ожидает тяжелейшего со времен Великой депрессии мирового экономического кризиса
0
733
16:12 14.04.2026
ЕК отложила выделение Киеву первых траншей из 90 млрд евро на второе полугодие 2026 года
0
810
16:00 14.04.2026
США увеличат группировку кораблей в Аравийском море до 20
0
649

Возврат к списку