Объем российского рынка платформ для инференса моделей искусственного интеллекта в 2025 году превысит 15 млрд руб., а среднегодовой темп роста составляет около 20%, рассказали в MWS Cloud (входит в МТС).
Инференс — это этап работы модели ИИ, на котором она применяет уже обученные алгоритмы для обработки новых данных и выдачи результата. В отличие от обучения, инференс выполняется быстрее, но требует значительных вычислительных мощностей при работе с крупными нейросетями.
Читайте также:
По словам участников рынка, за последние годы крупные компании заметно расширили парки ML-моделей, используемых в IT-процессах. Более того, появляется все больше готовых open source—моделей (на открытом исходном коде), которые можно выводить на инференс без обучения. Также наблюдается кадровый дефицит специалистов по машинному обучению, но входной порог для среднего и малого бизнеса снижается за счет готовых инструментов и облачных сервисов.
На этом фоне MWS Cloud запускает свою платформу — Inferance Valve, которая позволит выводить любые обученные ML-модели, большие языковые модели (LLM) и модели компьютерного зрения (CV). Спрос на инференс-платформы становится зрелым, подтверждает руководитель направления AI в Cloud.ru Дмитрий Юдин. Лидируют госсектор, финтех, телеком, ритейл и e-commerce, где заказчики четко понимают свои сценарии и ждут быстрой реализации. По его словам, средний бизнес активно тестирует большие языковые модели для ассистентов, автоматизации поддержки, генерации контента и маркетинга.
Филипп Крупанин

SIA.RU: Главное