搜索_华为云

MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

MaaS大模型即服务平台功能介绍对于普通企业来说，大模型开发不仅需要强大的算力，还需要学习训练、部署的相关参数配置和规格选择等专业知识。ModelArts Studio大模型即服务平台（后续简称为MaaS服务）作为一个面向客户的大模型服务化平台，提供简单易用的模型开发工具链，支

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
模型训练计费项 - AI开发平台ModelArts

事件通知（不开启则不计费）订阅消息使用消息通知服务，在事件列表中选择特定事件，在事件发生时发送消息通知。如果想使用消息通知，需要在创建训练作业时开启“事件通知”功能。具体计费可见消息通知服务价格详情。按实际用量付费发送短信通知费用构成：短信通知条数发送电子邮件费用构成：电子邮件+外网下行流量

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
欠费说明 - AI开发平台ModelArts
欠费说明 - AI开发平台ModelArts

欠费说明用户在使用云服务时，账户的可用额度小于待结算的账单，即被判定为账户欠费。欠费后，可能会影响云服务资源的正常运行，请及时充值。欠费原因已购买资源包，但使用量超出资源包额度或资源包属性与桶属性不匹配，进而产生按需费用，同时账户中的余额不足以抵扣产生的按需费用。请参考如何

 帮助中心 > AI开发平台ModelArts > 计费说明
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

性能预期：QPS 20/s - 业务访问方式推理业务访问：“客户端 -> 云服务” 或 “云客户端 -> 云服务”。推理业务时延要求，客户端到云服务端到端可接受时延。例如：当前是“客户端 -> 云服务”模式，客户端请求应答可接受的最长时延为2秒。 - 模型参数规模，是否涉及分布式推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

ModelArts服务涉及对互联网开放的Web应用，采用了统一推荐的Web安全组件防范Web安全风险，并且通过WAF进行安全防护。所有承载ModelArts服务的主机部署了主机安全防护产品。包括不限于华为自研HSS或计算安全平台CSP。 ModelArts服务部署了漏洞扫描服务并自行进行例行扫描，能快速发现漏洞并能及时修复。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
更新服务配置 - AI开发平台ModelArts

更新服务配置更新当前服务对象配置。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数；其它平台的Session鉴权请参考Session鉴权。方式1：根据部署在线服务生成的服务对象进行更新服务配置 1 2 3 4 5 6 7

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
推理业务迁移评估表 - AI开发平台ModelArts

性能预期：QPS 20/s - 业务访问方式推理业务访问：“客户端 -> 云服务” 或 “云客户端 -> 云服务”。推理业务时延要求，客户端到云服务端到端可接受时延。例如：当前是“客户端 -> 云服务”模式，客户端请求应答可接受的最长时延为2秒。 - 模型参数规模，是否涉及分布式推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
部署在线服务 - AI开发平台ModelArts

部署在线服务部署在线服务包括：已部署为在线服务的初始化。部署在线服务predictor。部署批量服务transformer。部署服务返回服务对象Predictor，其属性包括服务管理章节下的所有功能。示例代码在ModelArts notebook平台，Session

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

在线服务列表页，查看服务状态变为“运行中”，表示服务部署成功。 WebSocket在线服务调用 WebSocket协议本身不提供额外的认证方式。不管自定义镜像里面是ws还是wss，经过ModelArts平台出去的WebSocket协议都是wss的。同时wss只支持客户端对服务端的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
审计与日志 - AI开发平台ModelArts

deleteConvert 服务管理支持审计的关键操作列表表5 服务管理支持审计的关键操作列表操作名称资源类型事件名称部署服务 service addService 删除服务 service deleteService 更新服务 service updateService 启停服务 service

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。数据从平台发送到服务，服务预测推理，再将结果返回的时间不超过限制，可以成功返回预测结果。当服务预测的时间过长或者频繁预测导致服务接收不过来请求，即会出现该报错。可以通过以下方式解决问题：服务预测请求内容过大时，会因数

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
创建AI应用 - AI开发平台ModelArts

请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。表3 请求Body参数参数是否必选参数类型描述 model_docs

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
推理精度测试 - AI开发平台ModelArts

eval_test.py # 启动脚本，建立线程池发送请求，并汇总结果 ├── readme.md # 说明文档 ├── requirements.txt # 第三方依赖 ├── service_predict.py # 发送请求的服务上传精度测试代码到推理容器中。如果在Step5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
AI开发基本流程介绍 - AI开发平台ModelArts

AI开发基本流程介绍什么是AI开发 AI（人工智能）是通过机器来模拟人类认识能力的一种科技能力。AI最核心的能力就是根据给定的输入做出判断或预测。 AI开发的目的是什么 AI开发的目的是将隐藏在一大批数据背后的信息集中处理并进行提炼，从而总结得到研究对象的内在规律。对数据进行

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。准备工作使用专属资源池部署在线服务，服务状态为“运行中”。只有专属资源池部署的服务才支持VPC直连的高速访问通道。 VPC直连的高速访问通道，目前只支持访问在线服务。因流量限控，获取在线服务的IP和端口号次数有限制

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
发布解决方案 - AI开发平台ModelArts

发布解决方案如果你已经注册成为了AI Gallery平台上的合作伙伴，AI Gallery支持发布共享你的解决方案。在“AI Gallery”页面中，单击右上角“我的Gallery > 我的主页”进入个人中心页面。左侧菜单栏选择“解决方案”进入解决方案列表页，单击右上方的“发布”，进入发布解决方案页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 合作伙伴
使用MaaS部署模型服务 - AI开发平台ModelArts

在“模型部署”页面，单击“我的服务”页签，在目标服务右侧，单击操作列的“停止”。在“停止服务”对话框，单击“确定”。启动部署服务在“模型部署”页面，单击“我的服务”页签，在目标服务右侧，单击操作列的“启动”。在“启动服务”对话框，仔细阅读提示信息，单击“确定”。服务状态为运行中时会产生费用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
自动学习/Workflow计费项 - AI开发平台ModelArts

创建桶不收取费用，按实际使用的存储容量和时长收费消息通知（不开启则不计费）消息通知服务订阅消息使用消息通知服务，在事件列表中选择需要监控的节点/Workflow状态，在事件发生时发送消息通知。如果想使用消息通知，需要提前在自动学习、Workflow中开启消息通知功能。具体计费可见消息通知服务价格详情。按实际用量付费

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
推理性能测试 - AI开发平台ModelArts

参数说明 --backend：服务类型，支持tgi、vllm、mindspore、openai等。上面命令中使用vllm举例。 --host ${docker_ip}：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口8080。 --tok

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）
推理性能测试 - AI开发平台ModelArts

--backend：服务类型，支持tgi、vllm、mindspore、openai等。本文档使用的推理接口是vllm。 --host ${docker_ip}：服务部署的IP地址，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口8080。 --t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）

总条数： 2654

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

模型训练计费项 - AI开发平台ModelArts

欠费说明 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

审计与日志 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

AI开发基本流程介绍 - AI开发平台ModelArts

通过VPC高速访问通道的方式访问在线服务 - AI开发平台ModelArts

发布解决方案 - AI开发平台ModelArts

使用MaaS部署模型服务 - AI开发平台ModelArts

自动学习/Workflow计费项 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线