Понедельник 20.04.2026 03:14
Войти
Войти Забыли пароль?
Зарегистрироваться
свежие приложения:   НГ-Exlibris
Константин Ремчуков: Гипотеза Набиуллиной не находит подтверждения в многоукладной экономике России От редакции

Константин Ремчуков: Гипотеза Набиуллиной не находит подтверждения в многоукладной экономике России

0
933
Бизнес отправляют на биржу Экономика

Бизнес отправляют на биржу

0
546
Правила выборов опять изменят в пользу только одной партии Политика

Правила выборов опять изменят в пользу только одной партии

0
505
Константин Ремчуков: Си Цзиньпин признал, что угольная генерация остается основой энергетической системы Китая МониториНГ

Константин Ремчуков: Си Цзиньпин признал, что угольная генерация остается основой энергетической системы Китая

0
2991
Здравоохранению обозначили цели к 2030 году Экономика

Здравоохранению обозначили цели к 2030 году

0
438
Трамп возвращается к угрозам в адрес Ирана В мире

Трамп возвращается к угрозам в адрес Ирана

0
396
Украину ждут в новом европейском военном блоке Воины и Армии

Украину ждут в новом европейском военном блоке

0
623
Адвокаты посмотрят на состязательность со своей стороны Политика

Адвокаты посмотрят на состязательность со своей стороны

0
364
Дефицит сжиженного газа в мире восполнят США Экономика

Дефицит сжиженного газа в мире восполнят США

0
438
Коммунистов не пускают массово протестовать на улицах Политика

Коммунистов не пускают массово протестовать на улицах

0
387
Китай возобновляет борьбу за туркменский газ СНГ

Китай возобновляет борьбу за туркменский газ

0
434
Центральная Азия – внутренняя и внешняя трансформация в условиях мировой турбулентности Я так вижу

Центральная Азия – внутренняя и внешняя трансформация в условиях мировой турбулентности

0
372
Американцы впервые за десятилетие высадились на Острове свободы В мире

Американцы впервые за десятилетие высадились на Острове свободы

0
443
НАТО и Япония создают единый "антикитайский фронт" В мире

НАТО и Япония создают единый "антикитайский фронт"

0
387
Европейская "боевая авиационная система будущего" рискует остаться в прошлом В мире

Европейская "боевая авиационная система будущего" рискует остаться в прошлом

0
406
В Грузии предлагают покончить с политической поляризацией СНГ

В Грузии предлагают покончить с политической поляризацией

0
415
Переохлаждение экономики обсуждается в закрытом формате Неделя в обзоре

Переохлаждение экономики обсуждается в закрытом формате

0
601
Борьба с интернетом пока дала только политический результат Неделя в обзоре

Борьба с интернетом пока дала только политический результат

0
573
Российским офицерам запрещено выезжать из Приднестровья Неделя в обзоре

Российским офицерам запрещено выезжать из Приднестровья

0
578
Ормузский пролив открылся и закрылся... Неделя в обзоре

Ормузский пролив открылся и закрылся...

0
496
Впервые в России поставили балеты Вайля и Хиндемита Культура

Впервые в России поставили балеты Вайля и Хиндемита

0
435
Транссибирские вечера воспоминаний Культура

Транссибирские вечера воспоминаний

0
416
Софи Тернер и Кит Харингтон спасаются от проклятого рыцаря Кино

Софи Тернер и Кит Харингтон спасаются от проклятого рыцаря

0
440
Москва собрала звезд ушу из семи государств Москва

Москва собрала звезд ушу из семи государств

0
373
0
0
1721

Создан инструмент для удешевления вычислений при разработке ИИ

12:40 05.03.2026


На фоне стремительного роста затрат на обучение и эксплуатацию моделей искусственного интеллекта компании ищут не только более мощные GPU, но и способы эффективнее использовать уже имеющиеся ресурсы. Команда ученых Института AIRI опубликовала в открытом доступе KernelEvo — фреймворк автоматической генерации и оптимизации GPU-ядер, который позволяет снижать стоимость вычислений за счёт более эффективного кода.

Современные ИИ-системы опираются на графические ускорители, где исполняются специализированные программы — GPU-ядра (kernels). Именно они реализуют ключевые операции: умножение матриц, нормализации, свёртки, агрегации. Хотя сами элементарные операции относительно просты, объединить их в общий код без потери производительности на GPU — задача куда более сложная.

Универсальные библиотеки не всегда дают максимальную эффективность. В реальных продуктовых сценариях часто требуется объединить несколько операций в одну, добавить нестандартную логику или оптимизировать использование памяти под конкретную архитектуру. В таких случаях компании пишут собственные CUDA или Triton-ядра.

Хорошо оптимизированное ядро способно ускорить операцию на десятки процентов. В масштабах крупных ИИ-проектов это означает тысячи сэкономленных GPU-часов и миллионы рублей в год. Создание такого кода — дорогой и дефицитный навык.

Традиционно разработка GPU-ядра представляет из себя итеративный процесс, когда инженер проектирует схему параллелизации, управляет иерархией, тестирует разные размеры блоков и стратегию доступа к данным, затем профилирует результат и вносит изменения. Этот цикл может длиться дни и недели. Более того, он плохо масштабируется: каждую новую задачу приходится оптимизировать заново. Сильные специалисты по GPU — ограниченный ресурс, а рост вычислительных нагрузок в ИИ-индустрии только усиливает дефицит.

KernelEvo предлагает заменить ручной перебор гипотез автоматическим циклом поиска. Вместо модели «написал — проверил — переписал» используется автоматический цикл, в котором система генерирует варианты CUDA или Triton-реализации, запускает тесты и профилирование, исправляет ошибки и повторяет цикл. Оптимизация превращается в управляемый перебор пространства решений. Типовой запуск может включать генерацию до миллиона токенов кода и комментариев. Несмотря на вычислительные затраты на сам процесс, подход экономически оправдан при регулярном использовании и масштабировании на множество задач.

Сегодня компании, работающие с GPU-кодом, фактически выбирают между четырьмя подходами: полностью ручная разработка и оптимизация; использование LLM как «ко-пилота» с активным участием инженера; автоматический цикл с обратной связью — как в KernelEvo; полностью автономные агенты, самостоятельно проектирующие стратегию поиска. По мере движения от первого варианта к четвёртому снижается требуемая экспертиза, но растёт денежная стоимость процесса, однако, на практике баланс достигается во втором и третьем сценариях. Автоматическая эволюция ядер позволяет системно снижать долю ручного труда и повторно использовать инфраструктуру оптимизации для разных задач.

Для бизнеса GPU-ядро — это не просто фрагмент кода, а элемент юнит-экономики. Быстрее работающая операция означает сокращение времени обучения моделей, снижение затрат на облачную инфраструктуру, ускорение вывода продуктов на рынок и возможность обучать более крупные модели в рамках того же бюджета.

Если ключевая операция ускоряется в 1.5-2 раза, это напрямую влияет на стоимость одного эксперимента, релиза или запроса в системе инференса. В компаниях с большими вычислительными кластерами такие изменения масштабируются до значительных сумм.

Кроме того, автоматизация снижает зависимость от редких специалистов по низкоуровневой оптимизации. Это упрощает масштабирование команд и делает производительность более воспроизводимой.

«На фоне роста конкуренции в сфере ИИ компании всё чаще конкурируют не только качеством моделей, но и эффективностью их обучения и эксплуатации. В этой логике автоматическая эволюция GPU-ядер — не просто инструмент для разработчиков, а способ повысить маржинальность и устойчивость бизнеса. Представленный подход показывает, что снижение стоимости ИИ-вычислений возможно не только за счёт покупки более мощного оборудования, но и за счёт интеллектуальной автоматизации самого кода, который это оборудование использует», — отметил Иван Оселедец, доктор физико-математических наук, генеральный директор Института AIRI.

Получить доступ к KernelEvo можно по ссылкам на GitHub и GitVerse, использование инструмента бесплатное, распространяется под лицензией MIT.


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.


Комментарии отключены - материал старше 3 дней

Новости


20:12 19.04.2026
На улицах Кишинева замечены спецавтомобили немецкой полиции с номерами ФРГ - СМИ
0
551
19:15 19.04.2026
Пока Украина не откроет нефтепровод, Венгрия не снимает вето на выделение Киеву 90 млрд евро - Орбан
0
612
18:51 19.04.2026
Поступают противоречивые сообщения об участии делегации Ирана в планируемых переговорах с США
0
613
15:55 19.04.2026
Делегация США отправляется в Пакистан для переговоров с Ираном - Трамп
0
676
15:20 19.04.2026
Глава МВД Украины призвал легализовать оружие для гражданского населения
0
772
14:36 19.04.2026
МИД Приднестровья: Происходит попытка скрыть экологическую катастрофу и уничтожение Днестра
0
787
13:00 19.04.2026
Президент Ирана: Кто Трамп такой в этом мире, чтобы лишать народ его законных прав?
0
893
09:20 19.04.2026
Советники Трампа рекомендуют ему реже давать СМИ интервью
0
1174
09:15 19.04.2026
МИД Ирана: Мы не отправим в США никаких обогащенных материалов
0
1109
09:10 19.04.2026
Свыше 300 гуманоидных роботов вышли на совместный с людьми полумарафон в Пекине
0
992

Возврат к списку