Вторник 17.06.2025 21:47
Войти
Войти Забыли пароль?
Зарегистрироваться
свежие приложения:   НГ-Религии
Форум охлаждающих и охлажденных Экономика

Форум охлаждающих и охлажденных

0
169
Израилю не нужны посредники в конфликте с Ираном В мире

Израилю не нужны посредники в конфликте с Ираном

0
212
Антониу Гутерриш. План спасения устойчивого развития КАРТ-БЛАНШ

Антониу Гутерриш. План спасения устойчивого развития

0
202
Константин Ремчуков. Китайские ограничения в торговле редкоземельными металлами сильно «напрягли» ЕС и США МониториНГ

Константин Ремчуков. Китайские ограничения в торговле редкоземельными металлами сильно «напрягли» ЕС и США

0
3784
От борьбы с иноагентами никто не уйдет Политика

От борьбы с иноагентами никто не уйдет

0
133
Цены новостроек отстают от общей инфляции Экономика

Цены новостроек отстают от общей инфляции

0
126
Госдума приняла живое участие в "Бесогоне" Политика

Госдума приняла живое участие в "Бесогоне"

0
151
Война на Ближнем Востоке может лишить Киев поддержки Вашингтона Воины и Армии

Война на Ближнем Востоке может лишить Киев поддержки Вашингтона

0
168
Зеленский приготовился подкупить президента США СНГ

Зеленский приготовился подкупить президента США

0
220
Кананаскис обнажил разногласия в "большой семерке" В мире

Кананаскис обнажил разногласия в "большой семерке"

0
173
Тегеран готовят к опустошению В мире

Тегеран готовят к опустошению

0
192
"Гражданская инициатива" начала свой судебный путь Политика

"Гражданская инициатива" начала свой судебный путь

0
138
Трамп передал Грузии требования по перезагрузке отношений СНГ

Трамп передал Грузии требования по перезагрузке отношений

0
214
Белорусских детей учат бороться с диверсантами СНГ

Белорусских детей учат бороться с диверсантами

0
176
Венесуэла лишается самого важного зарубежного актива В мире

Венесуэла лишается самого важного зарубежного актива

0
180
Китай стал рекордсменом по росту ядерного арсенала В мире

Китай стал рекордсменом по росту ядерного арсенала

0
162
Зарубежная церковь отговаривает Россию от «богопротивной идеологии» Факты и комментарии

Зарубежная церковь отговаривает Россию от «богопротивной идеологии»

0
322
«Гоните прочь всех тех, кто призывает встать на борьбу с мусульманами» Факты и комментарии

«Гоните прочь всех тех, кто призывает встать на борьбу с мусульманами»

0
325
Социологи обнаружили незначительное снижение числа верующих в РФ Тенденции

Социологи обнаружили незначительное снижение числа верующих в РФ

0
299
Выборы архиепископа Кентерберийского покрыты туманом Альбиона Факты и комментарии

Выборы архиепископа Кентерберийского покрыты туманом Альбиона

0
221
Курентзис заставляет время и чувства замереть Культура

Курентзис заставляет время и чувства замереть

0
192
Выставка Карла Брюллова "Рим–Москва–Петербург" в Новой Третьяковке продлится полгода Культура

Выставка Карла Брюллова "Рим–Москва–Петербург" в Новой Третьяковке продлится полгода

0
201
Задача трех вождей Идеи и люди

Задача трех вождей

0
240
От скалодромов до цифровых лабораторий: как гранты Эн+ меняют городскую среду Общество

От скалодромов до цифровых лабораторий: как гранты Эн+ меняют городскую среду

0
164
0
0
3669

Cloud.ru представил облачный сервис Evolution ML Inference

18:16 17.04.2025


Провайдер облачных и AI-технологий Cloud.ru представил Evolution ML Inference – первый в России готовый облачный сервис для инференса (вывода) больших языковых моделей (LLM) с возможностью разделения графических процессоров (GPU) и гибким подходом к утилизации вычислительных ресурсов.

Помимо уже доступных в рамках сервиса Cloud.ru моделей GigaChat бизнес может запускать и развертывать собственные AI-модели и любые ML/DL open source модели из библиотеки Hugging Face на базе облачных GPU в несколько кликов.

Сервис уже доступен для пользователей в режиме General availability и войдет в состав Cloud.ru Evolution AI Factory – готового набора инструментов для работы с AI в облаке, анонсированного на ежегодной конференции GoCloud.

Evolution ML Inference подойдет для компаний и пользователей, которые разрабатывают AI- и ML-решения и хотят быстро и с минимальными затратами запустить собственную ML-модель и персональный конечный продукт для работы. Это полностью управляемый сервис – пользователь только настраивает конфигурацию, модель и тип масштабирования. При этом Cloud.ru предоставляет доступ к мощным графическим процессорам, а также выполняет полное администрирование и обслуживание инфраструктуры.

Ключевые преимущества сервиса:

– Shared GPU – технология позволяет разделять GPU-ресурсы и потреблять то количество vRAM (видеопамяти), которое необходимо для эффективной работы самой модели без задержек, с возможностью динамически перераспределять ресурсы в зависимости от текущих потребностей клиентов. Это повышает утилизацию мощностей в AI-проектах от 15 до 45% в сравнении со сценарием, когда графические процессоры используется полностью;

– простота и гибкость управления сервисом дают возможность, как запускать модели без необходимости сборки образа напрямую из Hugging Face, так и запускать собственные образы со своим окружением;

– решение обеспечивает высокую степень адаптации и рациональное использование доступных ресурсов: на одной видеокарте можно одновременно запускать несколько моделей. Это делает технологию наиболее оптимальной для распределенных систем с разнородной вычислительной инфраструктурой и помогает эффективно масштабировать нагрузку;

– режим скайлирования (эффективного масштабирования) – тарификация за использование модели начинается только в момент обращения к ней.

«По нашим оценкам, около 70% пользователей загружают GPU-ресурсы, зарезервированные под инференс в процессе эксплуатации ML-моделей, менее чем на 55%, – рассказал генеральный директор провайдера облачных и AI-технологий Cloud.ru Евгений Колбин. – При внедрении AI в большинстве случаев базой становится именно среда исполнения модели. Поэтому для получения экономии ресурсов и оптимизации затрат в ходе использовании технологий искусственного интеллекта, особенно GenAI, необходима производительная инфраструктура с гибким масштабированием в реальном времени».

«Глубоко изучив потребности клиентов и наиболее популярные запросы на инфраструктуру и сервисы для AI, мы представили рынку первый управляемый облачный сервис для инференса LLM. С его помощью бизнес может эффективно управлять вычислительными ресурсами в среде с высокой интенсивностью обработки данных. Благодаря размещению Evolution ML Inference в облаке компании могут упростить доступ к AI и сделать использование AI-инструментов проще и удобнее», – добавил Евгений Колбин.


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(0)


Вы можете оставить комментарии.


Комментарии отключены - материал старше 3 дней

Новости


21:34 17.06.2025
Цена на нефть на лондонской бирже ICE растет более чем на 5%
0
25
19:30 17.06.2025
Трамп: Мы получили полный и тотальный контроль над небом Ирана
0
243
18:45 17.06.2025
Власти Израиля начали сбор информации от туристов, желающих срочно покинуть страну
0
260
18:30 17.06.2025
Технологии искусственного интеллекта Сбера помогут всем гостям и участникам ПМЭФ
0
273
17:40 17.06.2025
Путин завтра встретится с главами международных информагентств — Ушаков
0
366
17:12 17.06.2025
Медведев назвал G7 мертвым клубом
0
338
17:00 17.06.2025
США остановили работу группы, разрабатывающей стратегии давления на РФ — Reuters
0
386
16:42 17.06.2025
Сбер сохраняет прогноз по росту корпоративного кредитования в 2025 году на уровне 9-11%
0
329
16:40 17.06.2025
В Сбере назвали стабильным качество обслуживания долга компаниями
0
313
16:37 17.06.2025
Сбер: Массовых запросов на реструктуризацию у крупных компаний нет
0
325

Возврат к списку