Четверг 05.03.2026 14:18
Войти
Войти Забыли пароль?
Зарегистрироваться
свежие приложения:   НГ-Exlibris
Константин Ремчуков: Трамп нацелен только на трехсторонние соглашения в сфере контроля над вооружениями – с участием РФ, КНР и США МониториНГ

Константин Ремчуков: Трамп нацелен только на трехсторонние соглашения в сфере контроля над вооружениями – с участием РФ, КНР и США

0
1124
Новости

В Белоруссии за 5 лет число многодетных семей выросло на 15% — Лукашенко

0
120
Новости

Продолжительная военная операция в Иране может сделать США уязвимыми — Блинкен

0
149
О необходимости смены модели экономического роста в России. Прежние факторы не действуют, новые – игнорируются От редакции

О необходимости смены модели экономического роста в России. Прежние факторы не действуют, новые – игнорируются

0
8957
Новости

Два дрона, летевших со стороны Ирана, упали и взорвались в Нахичевани — агентство Trend

0
169
Новости

У Саудовской Аравии осталось две недели, прежде чем придется сокращать добычу нефти — FT

0
213
Цементному рынку выписали китайский рецепт на зиму Экономика

Цементному рынку выписали китайский рецепт на зиму

0
91
Константин Ремчуков: Натоцентричная архитектура европейской безопасности против России Политика

Константин Ремчуков: Натоцентричная архитектура европейской безопасности против России

0
6141
Конституционный суд выстроил все права в очередность Политика

Конституционный суд выстроил все права в очередность

0
934
Пакистан балансирует между США и Ираном В мире

Пакистан балансирует между США и Ираном

0
1072
Туркменистан открыл границу для бегущих от боевых действий СНГ

Туркменистан открыл границу для бегущих от боевых действий

0
1148
Власти Армении и Грузии устроили пир во время войны СНГ

Власти Армении и Грузии устроили пир во время войны

0
1267
Американцам пообещали долгую войну В мире

Американцам пообещали долгую войну

0
1036
Иранскую власть хотят поднять на курдские штыки В мире

Иранскую власть хотят поднять на курдские штыки

0
1137
Приднестровцам пригрозили лишением гражданства Молдовы СНГ

Приднестровцам пригрозили лишением гражданства Молдовы

0
1163
Трамп решил пойти по стопам врагов Америки От редакции

Трамп решил пойти по стопам врагов Америки

0
1102
Молодые учителя умеют считать деньги, но боятся детей Образование

Молодые учителя умеют считать деньги, но боятся детей

0
968
Экономика знаний должна работать в формате 24/7 Я так вижу

Экономика знаний должна работать в формате 24/7

0
888
Преподаватель театрального вуза о том, чем поражают ее сегодняшние студенты Образование

Преподаватель театрального вуза о том, чем поражают ее сегодняшние студенты

0
1053
От премьер молодых композиторов до реквиема по "Болеро" Равеля Культура

От премьер молодых композиторов до реквиема по "Болеро" Равеля

0
1409
Соседи с того света Главная тема

Соседи с того света

0
831
Таинственные страшилки из Японии Персона

Таинственные страшилки из Японии

0
867
«Туманность Андромеды»: спиной к прошлому Кафедра, факультатив

«Туманность Андромеды»: спиной к прошлому

0
862
Рецензируя рецензируемое Non-fiction

Рецензируя рецензируемое

0
736
0
0
194

Создан инструмент для удешевления вычислений при разработке ИИ

12:40 05.03.2026


На фоне стремительного роста затрат на обучение и эксплуатацию моделей искусственного интеллекта компании ищут не только более мощные GPU, но и способы эффективнее использовать уже имеющиеся ресурсы. Команда ученых Института AIRI опубликовала в открытом доступе KernelEvo — фреймворк автоматической генерации и оптимизации GPU-ядер, который позволяет снижать стоимость вычислений за счёт более эффективного кода.

Современные ИИ-системы опираются на графические ускорители, где исполняются специализированные программы — GPU-ядра (kernels). Именно они реализуют ключевые операции: умножение матриц, нормализации, свёртки, агрегации. Хотя сами элементарные операции относительно просты, объединить их в общий код без потери производительности на GPU — задача куда более сложная.

Универсальные библиотеки не всегда дают максимальную эффективность. В реальных продуктовых сценариях часто требуется объединить несколько операций в одну, добавить нестандартную логику или оптимизировать использование памяти под конкретную архитектуру. В таких случаях компании пишут собственные CUDA или Triton-ядра.

Хорошо оптимизированное ядро способно ускорить операцию на десятки процентов. В масштабах крупных ИИ-проектов это означает тысячи сэкономленных GPU-часов и миллионы рублей в год. Создание такого кода — дорогой и дефицитный навык.

Традиционно разработка GPU-ядра представляет из себя итеративный процесс, когда инженер проектирует схему параллелизации, управляет иерархией, тестирует разные размеры блоков и стратегию доступа к данным, затем профилирует результат и вносит изменения. Этот цикл может длиться дни и недели. Более того, он плохо масштабируется: каждую новую задачу приходится оптимизировать заново. Сильные специалисты по GPU — ограниченный ресурс, а рост вычислительных нагрузок в ИИ-индустрии только усиливает дефицит.

KernelEvo предлагает заменить ручной перебор гипотез автоматическим циклом поиска. Вместо модели «написал — проверил — переписал» используется автоматический цикл, в котором система генерирует варианты CUDA или Triton-реализации, запускает тесты и профилирование, исправляет ошибки и повторяет цикл. Оптимизация превращается в управляемый перебор пространства решений. Типовой запуск может включать генерацию до миллиона токенов кода и комментариев. Несмотря на вычислительные затраты на сам процесс, подход экономически оправдан при регулярном использовании и масштабировании на множество задач.

Сегодня компании, работающие с GPU-кодом, фактически выбирают между четырьмя подходами: полностью ручная разработка и оптимизация; использование LLM как «ко-пилота» с активным участием инженера; автоматический цикл с обратной связью — как в KernelEvo; полностью автономные агенты, самостоятельно проектирующие стратегию поиска. По мере движения от первого варианта к четвёртому снижается требуемая экспертиза, но растёт денежная стоимость процесса, однако, на практике баланс достигается во втором и третьем сценариях. Автоматическая эволюция ядер позволяет системно снижать долю ручного труда и повторно использовать инфраструктуру оптимизации для разных задач.

Для бизнеса GPU-ядро — это не просто фрагмент кода, а элемент юнит-экономики. Быстрее работающая операция означает сокращение времени обучения моделей, снижение затрат на облачную инфраструктуру, ускорение вывода продуктов на рынок и возможность обучать более крупные модели в рамках того же бюджета.

Если ключевая операция ускоряется в 1.5-2 раза, это напрямую влияет на стоимость одного эксперимента, релиза или запроса в системе инференса. В компаниях с большими вычислительными кластерами такие изменения масштабируются до значительных сумм.

Кроме того, автоматизация снижает зависимость от редких специалистов по низкоуровневой оптимизации. Это упрощает масштабирование команд и делает производительность более воспроизводимой.

«На фоне роста конкуренции в сфере ИИ компании всё чаще конкурируют не только качеством моделей, но и эффективностью их обучения и эксплуатации. В этой логике автоматическая эволюция GPU-ядер — не просто инструмент для разработчиков, а способ повысить маржинальность и устойчивость бизнеса. Представленный подход показывает, что снижение стоимости ИИ-вычислений возможно не только за счёт покупки более мощного оборудования, но и за счёт интеллектуальной автоматизации самого кода, который это оборудование использует», — отметил Иван Оселедец, доктор физико-математических наук, генеральный директор Института AIRI.

Получить доступ к KernelEvo можно по ссылкам на GitHub и GitVerse, использование инструмента бесплатное, распространяется под лицензией MIT.


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.

Новости


14:12 05.03.2026
В Швеции значительно сократилось доверие населения к НАТО — опрос
0
13
14:00 05.03.2026
РФ не получала от Ирана просьб о помощи, в том числе с вооружением — Песков
0
58
13:32 05.03.2026
В Белоруссии за 5 лет число многодетных семей выросло на 15% — Лукашенко
0
127
13:12 05.03.2026
Продолжительная военная операция в Иране может сделать США уязвимыми — Блинкен
0
154
13:00 05.03.2026
Два дрона, летевших со стороны Ирана, упали и взорвались в Нахичевани — агентство Trend
0
172
12:32 05.03.2026
Нефть сорта Brent торгуется около $84,1 за баррель
0
197
12:20 05.03.2026
У Саудовской Аравии осталось две недели, прежде чем придется сокращать добычу нефти — FT
0
216
12:05 05.03.2026
Найдены 87 тел погибших с потопленного у берегов Шри-Ланки иранского фрегата
0
241
12:00 05.03.2026
В колонии на Кубани осужденный склонял сокамерников к госизмене — ФСБ
0
239
11:32 05.03.2026
В ЕС задумались, как избежать возможной волны беженцев из Ирана — Politico
0
310

Возврат к списку