Суббота 06.09.2025 02:01
Войти
Войти Забыли пароль?
Зарегистрироваться
свежие приложения:   НГ-Exlibris
Новости

Конфискация суверенных активов РФ может подорвать доверие к евро - МИД Бельгии

0
277
Новости

Мошенники рассылают пенсионерам сообщения якобы от Пенсионного фонда РФ

0
374
Новости

Проблемы с налогами привели к отставке вице-премьера Великобритании

0
429
Константин Ремчуков. Китай назвал призыв Трампа к переговорам по ядерному разоружению «нерациональным и нереалистичным» МониториНГ

Константин Ремчуков. Китай назвал призыв Трампа к переговорам по ядерному разоружению «нерациональным и нереалистичным»

0
1883
Новости

Зеленский и Фицо провели встречу в Ужгороде

0
488
Новости

США прекращают программу военной поддержки европейских стран

0
468
Владимирская епархия считает, что поэма "Москва-Петушки" имеет деструктивный характер Вера и общество

Владимирская епархия считает, что поэма "Москва-Петушки" имеет деструктивный характер

0
1351
Отечественную историю предлагают чествовать 28 января Политика

Отечественную историю предлагают чествовать 28 января

0
1093
Россияне будут чаще платить за депортацию нелегалов Политика

Россияне будут чаще платить за депортацию нелегалов

0
1275
Украина ждет переговоров по заморозке линии фронта Воины и Армии

Украина ждет переговоров по заморозке линии фронта

0
2217
Восстановление инвестиций переносится на 2026 год Экономика

Восстановление инвестиций переносится на 2026 год

0
1475
Игорь Никитин: «Именно благодаря ЦСКА я состоялся как тренер» Общество

Игорь Никитин: «Именно благодаря ЦСКА я состоялся как тренер»

0
424
КПРФ вроде бы спешит в Иркутск на помощь Левченко Политика

КПРФ вроде бы спешит в Иркутск на помощь Левченко

0
1099
Евросоюз погодит ставить на новенького СНГ

Евросоюз погодит ставить на новенького

0
1331
«Коалиция решительных» решительно отказалась воевать с РФ В мире

«Коалиция решительных» решительно отказалась воевать с РФ

0
1548
Варшава вновь готова строить «Форт Трампа» КАРТ-БЛАНШ

Варшава вновь готова строить «Форт Трампа»

0
917
Тегерану отрезают пути к отступлению В мире

Тегерану отрезают пути к отступлению

0
1544
Индийцев призывают бойкотировать все американское В мире

Индийцев призывают бойкотировать все американское

0
1253
США обязались уважать суверенитет Мексики В мире

США обязались уважать суверенитет Мексики

0
1061
Восстановление инвестиций переносится на 2026 год Экономика

Восстановление инвестиций переносится на 2026 год

0
1475
Венецианский кинофестиваль полюбил китч Кино

Венецианский кинофестиваль полюбил китч

0
1041
В Самарканде стартовали «Большие швейцарки» ФИДЕ Шахматы

В Самарканде стартовали «Большие швейцарки» ФИДЕ

0
919
От «Лихие. Глава 2» до братьев Стругацких и Тоцкого полигона Телевидение

От «Лихие. Глава 2» до братьев Стругацких и Тоцкого полигона

0
946
Москва на день станет казачьей станицей Москва

Москва на день станет казачьей станицей

0
934
0
0
1953

Альянс в сфере искусственного интеллекта представил новый стандарт оценки больших языковых моделей

16:10 05.06.2025


Альянс в сфере искусственного интеллекта (ИИ) на конференции ЦИПР объявил о запуске нового раздела MERA «MERA Industrial» – бенчмарка для оценки больших языковых моделей (LLM) в различных отраслях. На платформе уже доступны бенчмарки по медицине и сельскому хозяйству, которые помогут компаниям и экспертам выбрать и внедрить LLM, максимально соответствующие их бизнес-задачам.

В настоящий момент на сайте размещены три задачи, две из которых по сельскому хозяйству и одна по медицине:

– ruTXTAgroBench: датасет, предназначенный для измерения профессиональных знаний модели, приобретенных в процессе предобучения в области агрономии. Состоит из 2935 оригинальных вопросов по агрономии, охватывающих ботанику, кормопроизводство и луговодство, мелиоративное земледелие, общую генетику, общее земледелие, основы селекции, растениеводство, семеноводство и семеноведение, системы земледелия на различных агроландшафтах, технологии возделывания сельскохозяйственных культур;

– ruTXTAquaBench: датасет, предназначенный для измерения профессиональных знаний модели, приобретенных в процессе предобучения в области аквакультуры. Состоит из 1102 задания по аквакультуре, включая индустриальную аквакультуру, кормление рыбы и гидробионтов, марикультуру (например, разведение раков, креветок, выращивание жемчуга), а также ихтиопатологию (ветеринария, профилактика и оптимизация технологий выращивания рыбы);

– ruTXTMedQFundamental: датасет, в котором охвачены 17 фундаментальных медицинских дисциплин от клеточной биологии до клинических практик (хирургия, терапия, лабораторная диагностика, фармакология). Тест включает 270 вопросов и 30 тренировочных задач по каждой дисциплине, что позволяет сопоставлять уровень знаний моделей с уровнем выпускника медицинского вуза.

Датасеты являются полностью оригинальными и составлены на русском языке.

Бенчмарк MERA Industrial создан при поддержке академического сообщества, в частности в проекте приняли участие Сколковский институт науки и технологий, Кубанский государственный аграрный университет, Национальный медицинский исследовательский центр имени В.А. Алмазова, РАНХиГС, Нижегородский государственный архитектурно-строительный университет и другие. Ведущими экспертами тщательно формулируются задания, чтобы обеспечить:

– достоверность информации на основе подтвержденных источников;

– полное покрытие отраслевой таксономии;

– разнообразие сложности и типов задач (от академических до практических кейсов);

– оригинальность формулировок и отсутствие интернет-заимствований.

MERA Industrial – это не только инструмент для оценки больших языковых моделей, но и площадка для формулирования новых задач и кейсов, валидации заданий, использования готовых бенчмарков для выбора и внедрения LLM в бизнес-процессы.

«Сегодня искусственный интеллект становится неотъемлемой частью бизнес-процессов в самых разных отраслях. И бизнесу как никогда нужны надежные инструменты для оценки больших языковых моделей, способных решать реальные отраслевые задачи с высокой точностью и достоверностью, – отметил старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев. – Запуск нового бенчмарка MERA Industrial на площадке Альянса в сфере ИИ – это значимый шаг в сторону прозрачности и качества LLM моделей в различных отраслях, где важен каждый аспект: от проверки знаний модели до ее способности работать с уникальными бизнес-кейсами. В Сбере мы активно используем подобные инструменты оценки, чтобы внедрять только проверенные и эффективные решения для наших клиентов».

Бенчмарк MERA, созданный при участии команд Сбербанка, MTS AI, Skoltech AI и НИУ ВШЭ, был представлен на международной конференции AI Journey в 2023 году. Впоследствии методологию теста также презентовали на ACL, ведущей научной конференции по компьютерной лингвистике, которая проводится с 1963 года и пользуется поддержкой крупнейших IT-компаний со всего мира, в числе которых Apple, Google Deep Mind, Baidu, IBM и другие. В прошлом году в бенчмарк для русскоязычных LLM добавили новые датасеты, поддержку API и особенностей SFT-моделей, а также обновленный лидерборд с удобной системой фильтрации результатов.


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.


Комментарии отключены - материал старше 3 дней

Новости


22:46 05.09.2025
Собянин: Реконструкция Киностудии Горького выходит на финишную прямую
0
270
22:45 05.09.2025
США хотят переключиться с противодействия КНР и РФ на континентальную оборону - СМИ
0
286
22:32 05.09.2025
Выставка Русского музея на ВДНХ продлится до 1 февраля 2026 года — Собянин
0
287
22:05 05.09.2025
«Роснефть» участвует в фестивале «Лето в Москве»
0
302
20:15 05.09.2025
Конфискация суверенных активов РФ может подорвать доверие к евро - МИД Бельгии
0
470
18:45 05.09.2025
Мошенники рассылают пенсионерам сообщения якобы от Пенсионного фонда РФ
0
550
17:40 05.09.2025
Мошенники будут использовать Max, как и другие мессенджеры — Песков
0
516
17:12 05.09.2025
Проблемы с налогами привели к отставке вице-премьера Великобритании
0
577
17:00 05.09.2025
США прекращают программу военной поддержки европейских стран
0
626
16:32 05.09.2025
Зеленский и Фицо провели встречу в Ужгороде
0
649

Возврат к списку