0
0
2345

GigaChat обошел большинство моделей искусственного интеллекта по результатам русскоязычного теста MERA

17:15 06.02.2024


Нейросетевая модель Сбера GigaChat обошла большинство моделей в открытом доступе по итогам открытого бенчмарка MERA.

Для замера были представлены две инструктивные модели Сбера – GigaChat PRO и GigaChat Lite+. Бенчмарк MERA представляет собой набор из 21 задачи в формате инструкций на различные области знаний, в которых проверялся широкий ряд навыков моделей: от знаний о мире до умения программировать на Python. По итогу теста GigaChat PRO набрал 51,3 балла из 100, обогнав ближайшую модель Mixtral 8x7B Instruct (47,8).

Система открытый оценки позволяет объективнее и более прозрачно оценивать способности моделей. Чем больше модель набирает баллов, тем точнее искусственный интеллект может решать множество интеллектуальных или бытовых задач: помогать писать статьи в нужном стиле и формате, искать информацию и подготавливать на ее основе аналитику. А бизнес с его помощью может создавать собственные решения и оптимизировать внутренние процессы.

«В условиях, когда большие языковые модели активно развиваются, важно иметь актуальное представление об их реальных способностях, – отметил Андрей Белевцев, старший вице-президент, CTO, руководитель блока «Технологии» Сбербанка. – Благодаря оценке пользователи могут понять, как применять GigaChat, а исследователи – получить объективную информацию для дальнейшего обучения, адаптации и развития больших языковых моделей. Это не только признание работы нашей команды, но и задел совершенствовать сервис, чтобы он становился еще более полезным и удобным как обычным пользователям, так и бизнесу».

Концепция бенчмарка MERA (Multimodal Evaluation for Russian-language Architectures) была анонсирована на международной конференции AI Journey 2023. В создании тестов участвовали ряд компании-участников Альянса в сфере искусственного интеллекта, а также академические партнеры Skoltech AI и НИУ ВШЭ. MERA воплотила в себе концепцию единого независимого лидерборда с фиксированными задачами и стандартизированными конфигурациями промптов и параметров. Бенчмарк позволяет оценивать предобученные модели (формат претрейнов), а также модели дополнительно дообученные на инструкционных данных (SFT формат).

Недавно система искусственного интеллекта от Сбера получила мощное обновление. Модели стали лучше отвечать на экономические, медицинские и правовые вопросы. Появилось больше экспертности и точности в сложных терминах, что видно в соответствующих датасетах на MERA.

Модель GigaChat Pro доступна всем пользователям бесплатно в веб-версии, Telegram, а также «ВКонтакте». Разработчикам и бизнесу все модели доступны через GigaChat API.


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.


Комментарии отключены - материал старше 3 дней

Новости


17:32 08.08.2025
Индия и РФ привержены углублению сотрудничества — Моди по итогам разговора с Путиным
0
64
17:12 08.08.2025
Белоруссия не предлагала РФ помощь с Украиной, опасаясь вторжения НАТО — Лукашенко
0
103
17:00 08.08.2025
Путин рассказал Си Цзиньпину об основных итогах беседы с Уиткоффом
0
124
16:32 08.08.2025
Минпромторг РФ изыщет 10 млрд руб. для дополнительной поддержки льготного автокредитования
0
157
16:25 08.08.2025
«Роснефть» поможет восстанавливать в РФ популяцию лошадей Пржевальского
0
163
16:12 08.08.2025
Лукашенко заявил, что «с петлей на шее» не будет защищать Польшу и Балтию от мигрантов
0
194
16:00 08.08.2025
У КПП «Псоу» на границе Абхазии с РФ образовалась автомобильная пробка в 2 км
0
231
15:32 08.08.2025
Нидерланды аннулировали лицензии на поставку техники для ВМС Израиля из-за ситуации в Газе
0
245
15:12 08.08.2025
Путин обсудил с членами СБ РФ региональную безопасность
0
284
15:00 08.08.2025
Киев будет направлять НАТО списки желаемого оружия США — CNN
0
265

Возврат к списку