Вторник 16.12.2025 00:21
Войти
Войти Забыли пароль?
Зарегистрироваться
свежие приложения:   НГ-Энергия
Переговоры о мире могут споткнуться о Славянско-Краматорский укрепрайон В мире

Переговоры о мире могут споткнуться о Славянско-Краматорский укрепрайон

0
297
Верховный суд ужесточил требования к выступлениям перед присяжными Политика

Верховный суд ужесточил требования к выступлениям перед присяжными

0
175
Индексация пенсий обгонит инфляцию, но не рост зарплат Экономика

Индексация пенсий обгонит инфляцию, но не рост зарплат

0
201
Константин Ремчуков:Китай ужесточает борьбу с коррупцией и наращивает профицит во внешней торговле МониториНГ

Константин Ремчуков:Китай ужесточает борьбу с коррупцией и наращивает профицит во внешней торговле

0
3253
Министры агитируют молодежь личным примером Экономика

Министры агитируют молодежь личным примером

0
143
Ситуацию в экономике закладывают в выборные стратегии Политика

Ситуацию в экономике закладывают в выборные стратегии

0
178
Китайский стартап оставил позади андроида от Илона Маска Экономика

Китайский стартап оставил позади андроида от Илона Маска

0
234
Смогут ли посланцы Трампа убедить Путина принять их план От редакции

Смогут ли посланцы Трампа убедить Путина принять их план

0
11582
Систему бесплатной юрпомощи гражданам будут расширять Политика

Систему бесплатной юрпомощи гражданам будут расширять

0
1089
Киев хотел бы опять управлять Запорожской АЭС СНГ

Киев хотел бы опять управлять Запорожской АЭС

0
246
Тбилиси вдохновил пример Лукашенко СНГ

Тбилиси вдохновил пример Лукашенко

0
272
Центральноазиатские страны отказываются от кириллицы СНГ

Центральноазиатские страны отказываются от кириллицы

0
278
За терактом в Сиднее стоит глобальный джихад В мире

За терактом в Сиднее стоит глобальный джихад

0
254
Мьянма устала от иностранных мошенников В мире

Мьянма устала от иностранных мошенников

0
194
Теракт в Австралии не повлек за собой ограничения миграции В мире

Теракт в Австралии не повлек за собой ограничения миграции

0
195
Германия нуждается в глубокой модернизации В мире

Германия нуждается в глубокой модернизации

0
189
Энергетический стресс-тест. Почему России может грозить дефицит мощности НГ-Энергия

Энергетический стресс-тест. Почему России может грозить дефицит мощности

0
349
Климатические саммиты вышли на системные противоречия НГ-Энергия

Климатические саммиты вышли на системные противоречия

0
295
Мир не хочет отказываться от нефти и газа НГ-Энергия

Мир не хочет отказываться от нефти и газа

0
338
Запорожская АЭС стала разменной монетой НГ-Энергия

Запорожская АЭС стала разменной монетой

0
362
Устойчивое виноградарство набирает популярность Стиль жизни

Устойчивое виноградарство набирает популярность

0
237
"А жизнь не так уж пакостна порой". Евгению Лесину - 60 Культура

"А жизнь не так уж пакостна порой". Евгению Лесину - 60

0
973
Как спасали любавичского ребе Шнеерсона Идеи и люди

Как спасали любавичского ребе Шнеерсона

0
255
Сердцевина жизни. К 35-летию «Независимой газеты» ЗАВИСИМАЯ ГАЗЕТА

Сердцевина жизни. К 35-летию «Независимой газеты»

0
4617
0
0
3950

Cloud.ru представил облачный сервис Evolution ML Inference

18:16 17.04.2025


Провайдер облачных и AI-технологий Cloud.ru представил Evolution ML Inference – первый в России готовый облачный сервис для инференса (вывода) больших языковых моделей (LLM) с возможностью разделения графических процессоров (GPU) и гибким подходом к утилизации вычислительных ресурсов.

Помимо уже доступных в рамках сервиса Cloud.ru моделей GigaChat бизнес может запускать и развертывать собственные AI-модели и любые ML/DL open source модели из библиотеки Hugging Face на базе облачных GPU в несколько кликов.

Сервис уже доступен для пользователей в режиме General availability и войдет в состав Cloud.ru Evolution AI Factory – готового набора инструментов для работы с AI в облаке, анонсированного на ежегодной конференции GoCloud.

Evolution ML Inference подойдет для компаний и пользователей, которые разрабатывают AI- и ML-решения и хотят быстро и с минимальными затратами запустить собственную ML-модель и персональный конечный продукт для работы. Это полностью управляемый сервис – пользователь только настраивает конфигурацию, модель и тип масштабирования. При этом Cloud.ru предоставляет доступ к мощным графическим процессорам, а также выполняет полное администрирование и обслуживание инфраструктуры.

Ключевые преимущества сервиса:

– Shared GPU – технология позволяет разделять GPU-ресурсы и потреблять то количество vRAM (видеопамяти), которое необходимо для эффективной работы самой модели без задержек, с возможностью динамически перераспределять ресурсы в зависимости от текущих потребностей клиентов. Это повышает утилизацию мощностей в AI-проектах от 15 до 45% в сравнении со сценарием, когда графические процессоры используется полностью;

– простота и гибкость управления сервисом дают возможность, как запускать модели без необходимости сборки образа напрямую из Hugging Face, так и запускать собственные образы со своим окружением;

– решение обеспечивает высокую степень адаптации и рациональное использование доступных ресурсов: на одной видеокарте можно одновременно запускать несколько моделей. Это делает технологию наиболее оптимальной для распределенных систем с разнородной вычислительной инфраструктурой и помогает эффективно масштабировать нагрузку;

– режим скайлирования (эффективного масштабирования) – тарификация за использование модели начинается только в момент обращения к ней.

«По нашим оценкам, около 70% пользователей загружают GPU-ресурсы, зарезервированные под инференс в процессе эксплуатации ML-моделей, менее чем на 55%, – рассказал генеральный директор провайдера облачных и AI-технологий Cloud.ru Евгений Колбин. – При внедрении AI в большинстве случаев базой становится именно среда исполнения модели. Поэтому для получения экономии ресурсов и оптимизации затрат в ходе использовании технологий искусственного интеллекта, особенно GenAI, необходима производительная инфраструктура с гибким масштабированием в реальном времени».

«Глубоко изучив потребности клиентов и наиболее популярные запросы на инфраструктуру и сервисы для AI, мы представили рынку первый управляемый облачный сервис для инференса LLM. С его помощью бизнес может эффективно управлять вычислительными ресурсами в среде с высокой интенсивностью обработки данных. Благодаря размещению Evolution ML Inference в облаке компании могут упростить доступ к AI и сделать использование AI-инструментов проще и удобнее», – добавил Евгений Колбин.


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.


Комментарии отключены - материал старше 3 дней

Новости


22:40 15.12.2025
Европейские лидеры хотят создания возглавляемых ЕС «многонациональных сил» Украины
0
198
22:00 15.12.2025
Зеленский назвал переговоры с США непростыми
0
246
21:20 15.12.2025
Путин подписал закон о штрафах за несообщение в военкомат о переезде
0
296
20:40 15.12.2025
ЕС хочет направить военную миссию на Украину, Венгрия этого не допустит — Сийярто
0
336
20:00 15.12.2025
Путин подписал закон о ратификации соглашения с Индией о порядке отправки военных
0
381
19:20 15.12.2025
Нижегородцу, который делал мумии из умерших, продлили принудительное лечение
0
385
18:40 15.12.2025
Путин подписал законы об оплате больничных и декрета для самозанятых
0
439
18:00 15.12.2025
Украинская энергосистема находится на грани коллапса — WP
0
481
17:32 15.12.2025
США производят всего одну гиперзвуковую ракету для комплекса Dark Eagle в месяц — СМИ
0
509
17:22 15.12.2025
Сбер: Законодательство в сфере искусственного интеллекта должно быть выстроено вокруг гражданина
0
487

Возврат к списку