Четверг 04.06.2026 05:53
Войти
Войти Забыли пароль?
Зарегистрироваться
свежие приложения:   НГ-Exlibris
Константин Ремчуков: Ван И назвал пять ключевых пунктов, касающихся глобального управления МониториНГ

Константин Ремчуков: Ван И назвал пять ключевых пунктов, касающихся глобального управления

0
618
«Либеральная парадигма» не мешает Илону Маску, но почему-то мешает философу Дугину От редакции

«Либеральная парадигма» не мешает Илону Маску, но почему-то мешает философу Дугину

0
753
Молдаване тоже хотят стать россиянами СНГ

Молдаване тоже хотят стать россиянами

0
461
Константин Ремчуков. Об опыте США в реализации стратегии новой индустриализации От редакции

Константин Ремчуков. Об опыте США в реализации стратегии новой индустриализации

0
3143
Добровольно-принудительный MAX обращает городского избирателя к КПРФ Политика

Добровольно-принудительный MAX обращает городского избирателя к КПРФ

0
435
"Российский Давос" встречают два прогноза стагнации Экономика

"Российский Давос" встречают два прогноза стагнации

0
489
В Москве представили сразу два проекта поэта и переводчика Наталии Азаровой Общество

В Москве представили сразу два проекта поэта и переводчика Наталии Азаровой

0
1235
Константин Ремчуков. Новый глава ФРС доказывает, что рост потребительских цен не есть инфляция Экономика

Константин Ремчуков. Новый глава ФРС доказывает, что рост потребительских цен не есть инфляция

0
4832
Регионы освобождают от долгов Экономика

Регионы освобождают от долгов

0
382
Россия может сократить энергопотребление почти вдвое Экономика

Россия может сократить энергопотребление почти вдвое

0
461
Конституционный суд остался на стороне следствия Политика

Конституционный суд остался на стороне следствия

0
387
Разработка для чистого воздуха Экономика

Разработка для чистого воздуха

0
710
Нетаньяху пробивает дорогу в обход Ормуза В мире

Нетаньяху пробивает дорогу в обход Ормуза

0
443
Китай превращается из технологической мишени в охотника Экономика

Китай превращается из технологической мишени в охотника

0
1507
Куба становится самой отсталой экономикой Латинской Америки КАРТ-БЛАНШ

Куба становится самой отсталой экономикой Латинской Америки

0
422
Из Улан-Удэ – навстречу Пегому псу Культура

Из Улан-Удэ – навстречу Пегому псу

0
766
"Фактор Бакиева" исключен из повестки Бишкека и Минска СНГ

"Фактор Бакиева" исключен из повестки Бишкека и Минска

0
406
Австралия отбивает Океанию у Китая В мире

Австралия отбивает Океанию у Китая

0
384
Искусственная кожа, печень и нейроимпланты от московских производителей Москва

Искусственная кожа, печень и нейроимпланты от московских производителей

0
353
Каникулы без происшествий: спасатели готовят детей и взрослых к безопасному лету Москва

Каникулы без происшествий: спасатели готовят детей и взрослых к безопасному лету

0
373
Книга недели - Александр Воловик. "По замкнутой спирали. Избранные стихи" Книга недели

Книга недели - Александр Воловик. "По замкнутой спирали. Избранные стихи"

0
396
Человек в системе Главная тема

Человек в системе

0
440
Псковская жатва. Год 1581-й Проза, периодика

Псковская жатва. Год 1581-й

0
439
Симфоническая личность Non-fiction

Симфоническая личность

0
428
0
0
1793

Создан инструмент для удешевления вычислений при разработке ИИ

12:40 05.03.2026


На фоне стремительного роста затрат на обучение и эксплуатацию моделей искусственного интеллекта компании ищут не только более мощные GPU, но и способы эффективнее использовать уже имеющиеся ресурсы. Команда ученых Института AIRI опубликовала в открытом доступе KernelEvo — фреймворк автоматической генерации и оптимизации GPU-ядер, который позволяет снижать стоимость вычислений за счёт более эффективного кода.

Современные ИИ-системы опираются на графические ускорители, где исполняются специализированные программы — GPU-ядра (kernels). Именно они реализуют ключевые операции: умножение матриц, нормализации, свёртки, агрегации. Хотя сами элементарные операции относительно просты, объединить их в общий код без потери производительности на GPU — задача куда более сложная.

Универсальные библиотеки не всегда дают максимальную эффективность. В реальных продуктовых сценариях часто требуется объединить несколько операций в одну, добавить нестандартную логику или оптимизировать использование памяти под конкретную архитектуру. В таких случаях компании пишут собственные CUDA или Triton-ядра.

Хорошо оптимизированное ядро способно ускорить операцию на десятки процентов. В масштабах крупных ИИ-проектов это означает тысячи сэкономленных GPU-часов и миллионы рублей в год. Создание такого кода — дорогой и дефицитный навык.

Традиционно разработка GPU-ядра представляет из себя итеративный процесс, когда инженер проектирует схему параллелизации, управляет иерархией, тестирует разные размеры блоков и стратегию доступа к данным, затем профилирует результат и вносит изменения. Этот цикл может длиться дни и недели. Более того, он плохо масштабируется: каждую новую задачу приходится оптимизировать заново. Сильные специалисты по GPU — ограниченный ресурс, а рост вычислительных нагрузок в ИИ-индустрии только усиливает дефицит.

KernelEvo предлагает заменить ручной перебор гипотез автоматическим циклом поиска. Вместо модели «написал — проверил — переписал» используется автоматический цикл, в котором система генерирует варианты CUDA или Triton-реализации, запускает тесты и профилирование, исправляет ошибки и повторяет цикл. Оптимизация превращается в управляемый перебор пространства решений. Типовой запуск может включать генерацию до миллиона токенов кода и комментариев. Несмотря на вычислительные затраты на сам процесс, подход экономически оправдан при регулярном использовании и масштабировании на множество задач.

Сегодня компании, работающие с GPU-кодом, фактически выбирают между четырьмя подходами: полностью ручная разработка и оптимизация; использование LLM как «ко-пилота» с активным участием инженера; автоматический цикл с обратной связью — как в KernelEvo; полностью автономные агенты, самостоятельно проектирующие стратегию поиска. По мере движения от первого варианта к четвёртому снижается требуемая экспертиза, но растёт денежная стоимость процесса, однако, на практике баланс достигается во втором и третьем сценариях. Автоматическая эволюция ядер позволяет системно снижать долю ручного труда и повторно использовать инфраструктуру оптимизации для разных задач.

Для бизнеса GPU-ядро — это не просто фрагмент кода, а элемент юнит-экономики. Быстрее работающая операция означает сокращение времени обучения моделей, снижение затрат на облачную инфраструктуру, ускорение вывода продуктов на рынок и возможность обучать более крупные модели в рамках того же бюджета.

Если ключевая операция ускоряется в 1.5-2 раза, это напрямую влияет на стоимость одного эксперимента, релиза или запроса в системе инференса. В компаниях с большими вычислительными кластерами такие изменения масштабируются до значительных сумм.

Кроме того, автоматизация снижает зависимость от редких специалистов по низкоуровневой оптимизации. Это упрощает масштабирование команд и делает производительность более воспроизводимой.

«На фоне роста конкуренции в сфере ИИ компании всё чаще конкурируют не только качеством моделей, но и эффективностью их обучения и эксплуатации. В этой логике автоматическая эволюция GPU-ядер — не просто инструмент для разработчиков, а способ повысить маржинальность и устойчивость бизнеса. Представленный подход показывает, что снижение стоимости ИИ-вычислений возможно не только за счёт покупки более мощного оборудования, но и за счёт интеллектуальной автоматизации самого кода, который это оборудование использует», — отметил Иван Оселедец, доктор физико-математических наук, генеральный директор Института AIRI.

Получить доступ к KernelEvo можно по ссылкам на GitHub и GitVerse, использование инструмента бесплатное, распространяется под лицензией MIT.


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.


Комментарии отключены - материал старше 3 дней

НОВОСТИ


22:35 03.06.2026
ВМС Ирана атаковали американский эсминец в Оманском заливе - Fars
0
551
22:00 03.06.2026
Президент США примет участие в саммите НАТО в Турции - глава Госдепа
0
598
21:38 03.06.2026
Около 650 организаций России бесплатно получают аналитику Сбера по кибербезопасности
0
596
21:30 03.06.2026
Рубио: Как минимум, мы должны поддерживать отношения и вести диалог с Россией
0
610
21:00 03.06.2026
Киргизия впервые в своей истории станет непостоянным членом Совбеза ООН
0
572
20:37 03.06.2026
Сбер: В эпоху ИИ первое и последнее слово должно быть за человеком
0
542
20:15 03.06.2026
Более 60% молодежи считают креативные профессии полезными
0
584
20:12 03.06.2026
Пока Иран не откажется от обогащения урана, «он не получат никакого снятия санкций» - Рубио
0
665
19:40 03.06.2026
Оборот курьерских/почтовых и телеком компаний за год показал рост в 9,9% и 11,3% соотвественно - Росстат
0
605
17:54 03.06.2026
Рубио признал, что США не являются беспристрастным посредником на Украине
0
845

Возврат к списку