Российские ученые научили рекомендательные системы глубже понимать пользователей
11:30 16.04.2026 Источник: Информационное агентство России "ТАСС"
Учёные Центра практического искусственного интеллекта Сбербанка вместе с исследователями Института AIRI, Университета Иннополис и ИТМО нашли способ переносить глубокие семантические знания из больших языковых моделей в компактные рекомендательные системы. Для пользователя это повышает точность подбора товаров, фильмов и другого контента и при этом не замедляет работу сервисов — скорость выдачи рекомендаций остаётся на уровне исходной лёгкой модели. Свои результаты исследователи опубликовали в научной статье, подготовленной под руководством Алексея Васильева — исполнительного директора по исследованию данных Центра практического искусственного интеллекта Сбербанка. Работа объединённой команды исследователей была представлена на престижной конференции ECIR 2026.
Задача рекомендательных систем на последовательностях заключается в том, что они хорошо улавливают временные цепочки действий пользователя, но хуже понимают его истинные предпочтения, особенно если данных о человеке мало. Большие языковые модели умеют восстанавливать эти скрытые смыслы, но использовать их напрямую в реальных сервисах ресурсозатратно: один запрос к LLM может длиться более 10 минут. Подход российских ученых решает эту задачу. На этапе обучения модели по истории взаимодействий и текстовым метаданным формируется профиль пользователя — его предпочтения и особенности поведения. Затем он превращается в вектор, с которым выравниваются внутренние представления самой рекомендательной модели. В итоге, когда система выдаёт рекомендации реальному человеку (на этапе инференса), ресурсоёмкая модель уже не требуется.
Проверка на четырёх наборах данных показала: добавление LLM-дистилляции к популярным моделям SASRec и BERT4Rec даёт устойчивый прирост качества. На датасете ML-20M точность NDCG@10 выросла на 5,62%, а полнота Recall@10 — на 4,74% по сравнению с обычным SASRec. При этом скорость создания рекомендаций оказалась в 190 раз выше (4,37 секунды против 840 секунд) по сравнению с базовым методом IDGenRec на основе больших языковых моделей.
«Большие языковые модели обладают колоссальным объёмом знаний о мире и о том, как люди формулируют свои предпочтения, – отметил Николай Тиден, директор Центра практического искусственного интеллекта Сбербанка. – Но использовать их напрямую в рекомендательных сервисах — всё равно что приглашать профессора лингвистики для ответа на каждый вопрос в чате. Наш подход берёт у "профессора" самое ценное — понимание глубинных мотивов пользователя — и передаёт это быстрому и лёгкому "ассистенту". В итоге человек получает более точные рекомендации без задержек, а бизнес — масштабируемое решение без лишних расходов на инференс».
Использование решения позволит цифровым сервисам еще лучше понимать предпочтения пользователя. Кинотеатр подберёт фильм, который действительно понравится, интернет-магазин покажет нужный товар, даже если клиент ещё сам не сформулировал запрос. Компании же получают готовый метод повышать качество рекомендаций без роста вычислительных затрат, перестройки архитектуры и необходимости держать в продакшене тяжёлую большую языковую модель. Это особенно важно для крупных промышленных систем, где важна каждая миллисекунда.
Новости
- 11:00 18.04.2026
- Самозанятые смогут получить больничные через полгода оплаты взносов — Буцкая
- 10:30 18.04.2026
- В Оренбуржье задержан мужчина, убивший полицейского и ранивший еще троих
- 10:20 18.04.2026
- Московская неделя моды: пять показов, которые советуем запомнить
- 10:00 18.04.2026
- Оспа обезьян начала активно приспосабливаться к человеку — инфекционист
- 09:30 18.04.2026
- Лукашенко заявил, что Запад всегда провоцировал постсоветские республики против России
- 09:00 18.04.2026
- Над регионами РФ за ночь сбиты 258 украинских БПЛА
- 08:50 18.04.2026
- Российские шахматисты выиграли 10 медалей на юношеском чемпионате мира
- 08:40 18.04.2026
- США разрешили до 16 мая операции по продаже нефти РФ, загруженной на танкеры до 17 апреля
- 08:30 18.04.2026
- БПЛА упал рядом с родильным домом в Новокуйбышевске Самарской области
- 21:20 17.04.2026
- Крупнейший в России проект комплексного развития территории реализуют в Республике Алтай


Комментировать
комментарии(0)
Комментировать