Среда 30.04.2025 23:11
Войти
Войти Забыли пароль?
Зарегистрироваться
свежие приложения:   НГ-Exlibris
Константин Ремчуков. Из-за сокращения рекламных бюджетов китайских компаний американский рынок может потерять 45 млрд долл МониториНГ

Константин Ремчуков. Из-за сокращения рекламных бюджетов китайских компаний американский рынок может потерять 45 млрд долл

0
343
Новости

Годовая инфляция в РФ в марте ускорилась до 10,34%

0
112
Константин Ремчуков. Истинные причины тарифной войны Трампа Экономика

Константин Ремчуков. Истинные причины тарифной войны Трампа

0
3170
Константин Ремчуков. Нормализация полноценных отношений с США – логичная цель для России Экономика

Константин Ремчуков. Нормализация полноценных отношений с США – логичная цель для России

0
3402
Новости

Железнодорожный вокзал Донецка, не принимавший поезда с 2014 года, заработает с 9 мая

0
178
Новости

В Европе используют террористические группировки в геостратегических целях — Шойгу

0
263
Странам Ближнего Востока, Персидского залива и Северной Африки для долгосрочной стабильности нужны новые решения От редакции

Странам Ближнего Востока, Персидского залива и Северной Африки для долгосрочной стабильности нужны новые решения

0
2798
Константин Ремчуков. В каких границах Россия признаёт новые территории Политика

Константин Ремчуков. В каких границах Россия признаёт новые территории

0
14923
Война в Йемене истощает американские арсеналы В мире

Война в Йемене истощает американские арсеналы

0
1361
КПРФ начинает работу над политическими ошибками Политика

КПРФ начинает работу над политическими ошибками

0
1028
Эн+ наращивает инвестиции и выработку чистой энергии Экономика

Эн+ наращивает инвестиции и выработку чистой энергии

0
794
Как Сикстинскую капеллу готовят к конклаву Вера и общество

Как Сикстинскую капеллу готовят к конклаву

0
926
В Киеве подготовили "равноправное" соглашение с США по ресурсам СНГ

В Киеве подготовили "равноправное" соглашение с США по ресурсам

0
1213
Молдавия становится банкротом СНГ

Молдавия становится банкротом

0
1483
Процессы с участием присяжных замедляются и дорожают Политика

Процессы с участием присяжных замедляются и дорожают

0
932
Можно ли разглашать детали незавершенных переговоров От редакции

Можно ли разглашать детали незавершенных переговоров

0
1178
Пять книг недели Пять книг недели

Пять книг недели

0
4858
Голос Наташи Ростовой Недетский уголок

Голос Наташи Ростовой

0
4598
Кто же основал журнал «Октябрь» Кафедра, факультатив

Кто же основал журнал «Октябрь»

0
2870
Отморозки в Арктике Кафедра, факультатив

Отморозки в Арктике

0
4316
"Нашествие", "Эшелон" и "Три сестры" в советской Эстонии Культура

"Нашествие", "Эшелон" и "Три сестры" в советской Эстонии

0
871
Классику приправили канканом Культура

Классику приправили канканом

0
987
Николас Кейдж борется за право быть "Серфером" Кино

Николас Кейдж борется за право быть "Серфером"

0
933
Московские пожарные и дорожные инспекторы готовят школьников к безопасному лету Москва

Московские пожарные и дорожные инспекторы готовят школьников к безопасному лету

0
545
0
0
3444

Cloud.ru представил облачный сервис Evolution ML Inference

18:16 17.04.2025


Провайдер облачных и AI-технологий Cloud.ru представил Evolution ML Inference – первый в России готовый облачный сервис для инференса (вывода) больших языковых моделей (LLM) с возможностью разделения графических процессоров (GPU) и гибким подходом к утилизации вычислительных ресурсов.

Помимо уже доступных в рамках сервиса Cloud.ru моделей GigaChat бизнес может запускать и развертывать собственные AI-модели и любые ML/DL open source модели из библиотеки Hugging Face на базе облачных GPU в несколько кликов.

Сервис уже доступен для пользователей в режиме General availability и войдет в состав Cloud.ru Evolution AI Factory – готового набора инструментов для работы с AI в облаке, анонсированного на ежегодной конференции GoCloud.

Evolution ML Inference подойдет для компаний и пользователей, которые разрабатывают AI- и ML-решения и хотят быстро и с минимальными затратами запустить собственную ML-модель и персональный конечный продукт для работы. Это полностью управляемый сервис – пользователь только настраивает конфигурацию, модель и тип масштабирования. При этом Cloud.ru предоставляет доступ к мощным графическим процессорам, а также выполняет полное администрирование и обслуживание инфраструктуры.

Ключевые преимущества сервиса:

– Shared GPU – технология позволяет разделять GPU-ресурсы и потреблять то количество vRAM (видеопамяти), которое необходимо для эффективной работы самой модели без задержек, с возможностью динамически перераспределять ресурсы в зависимости от текущих потребностей клиентов. Это повышает утилизацию мощностей в AI-проектах от 15 до 45% в сравнении со сценарием, когда графические процессоры используется полностью;

– простота и гибкость управления сервисом дают возможность, как запускать модели без необходимости сборки образа напрямую из Hugging Face, так и запускать собственные образы со своим окружением;

– решение обеспечивает высокую степень адаптации и рациональное использование доступных ресурсов: на одной видеокарте можно одновременно запускать несколько моделей. Это делает технологию наиболее оптимальной для распределенных систем с разнородной вычислительной инфраструктурой и помогает эффективно масштабировать нагрузку;

– режим скайлирования (эффективного масштабирования) – тарификация за использование модели начинается только в момент обращения к ней.

«По нашим оценкам, около 70% пользователей загружают GPU-ресурсы, зарезервированные под инференс в процессе эксплуатации ML-моделей, менее чем на 55%, – рассказал генеральный директор провайдера облачных и AI-технологий Cloud.ru Евгений Колбин. – При внедрении AI в большинстве случаев базой становится именно среда исполнения модели. Поэтому для получения экономии ресурсов и оптимизации затрат в ходе использовании технологий искусственного интеллекта, особенно GenAI, необходима производительная инфраструктура с гибким масштабированием в реальном времени».

«Глубоко изучив потребности клиентов и наиболее популярные запросы на инфраструктуру и сервисы для AI, мы представили рынку первый управляемый облачный сервис для инференса LLM. С его помощью бизнес может эффективно управлять вычислительными ресурсами в среде с высокой интенсивностью обработки данных. Благодаря размещению Evolution ML Inference в облаке компании могут упростить доступ к AI и сделать использование AI-инструментов проще и удобнее», – добавил Евгений Колбин.


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.


Комментарии отключены - материал старше 3 дней

НОВОСТИ


22:40 30.04.2025
Тарифы на электроэнергию для россиян с июля вырастут на 12,6%, через год — на 9,3%
0
93
22:00 30.04.2025
Годовая инфляция в РФ в марте ускорилась до 10,34%
0
161
21:20 30.04.2025
Железнодорожный вокзал Донецка, не принимавший поезда с 2014 года, заработает с 9 мая
0
215
20:40 30.04.2025
Путин не против подумать над переименованием Волгограда в Сталинград
0
269
20:00 30.04.2025
В Европе используют террористические группировки в геостратегических целях — Шойгу
0
297
19:20 30.04.2025
РСФСР больше всех положила на алтарь Победы, заявил Путин
0
305
18:40 30.04.2025
МУС невозможно реформировать, лучше «прикрыть эту лавочку» — бывший эксперт СПЧ ООН
0
332
18:00 30.04.2025
Трамп утверждает, что спад в экономике США связан с политикой Байдена
0
373
17:32 30.04.2025
С 2026 года использование семян из РФ станет условием гранта на семеноводство — Мишустин
0
349
17:12 30.04.2025
Новая военная помощь США Украине будет считаться взносом в совместный инвестфонд — Шмыгаль
0
460

Возврат к списку