搜索_华为云

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

该指标用于统计每秒从磁盘读出的数据量。只考虑被容器使用的数据盘。千字节/秒（Kilobytes/Second） ≥0 NA NA NA 磁盘写入速率 ma_node_disk_write_rate_kilobytes_seconds 该指标用于统计每秒写入磁盘的数据量。只考虑被容器使用的数据盘。千

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
删除AI应用 - AI开发平台ModelArts

删除AI应用功能介绍删除AI应用，根据AI应用ID删除指定AI应用，cascade取值为true时除了删除AI应用ID指定的AI应用，还会删除其他与指定AI应用同名不同版本的AI应用；默认只删除当前AI应用ID所对应的AI应用。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
创建AI应用 - AI开发平台ModelArts

创建AI应用功能介绍导入元模型创建AI应用。执行代码、模型需先上传至OBS（训练作业生成的模型已默认存储到OBS）。接口约束使用模板导入模型与不使用模板导入这两类导入方式的Body参数要求不一样。以下Body参数说明中以模板参数表示适合使用模板导入模型时填写的参数，非模

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

在MaaS应用实践中心查看应用解决方案 ModelArts Studio大模型即服务平台提供了MaaS应用实践中心，为具体的应用场景提供一整套解决方案。应用中心介绍 “MaaS应用实践中心”提供基于行业客户应用场景的AI解决方案。MaaS提供的模型服务和华为云各AI应用层构建工具

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
开发环境的应用示例 - AI开发平台ModelArts

开发环境的应用示例本节通过调用一系列API，以创建开发环境实例为例介绍ModelArts API的使用流程。概述创建开发环境实例的流程如下：调用认证鉴权接口获取用户Token，在后续的请求中需要将Token放到请求消息头中作为认证。调用查询支持的镜像列表接口查看开发环境的镜像类型和版本。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
分离部署推理服务 - AI开发平台ModelArts

第二个元素(group_id="1")代表全量实例信息，长度即为全量实例个数。其中需要配置每个全量实例的ip信息以及使用的device信息。rank_id为逻辑卡号，必然从0开始计算，device_id为物理卡号，device_ip则通过上面的hccn_tool获取。第三个元素(group_id="2")代表增

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

第二个元素(group_id="1")代表全量实例信息，长度即为全量实例个数。其中需要配置每个全量实例的ip信息以及使用的device信息。rank_id为逻辑卡号，必然从0开始计算，device_id为物理卡号，device_ip则通过上面的hccn_tool获取。第三个元素(group_id="2")代表增

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
调整模型后，部署新版本AI应用能否保持原API接口不变？ - AI开发平台ModelArts

调整模型后，部署新版本AI应用能否保持原API接口不变？ ModelArts提供多版本支持和灵活的流量策略，您可以通过使用灰度发布，实现模型版本的平滑过渡升级。修改服务部署新版本模型或者切换模型版本时，原服务预测API不会变化。调整模型版本的操作可以参考如下的步骤。前提条件已存在部署完成的服务。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
分离部署推理服务 - AI开发平台ModelArts

第二个元素(group_id="1")代表全量实例信息，长度即为全量实例个数。其中需要配置每个全量实例的ip信息以及使用的device信息。rank_id为逻辑卡号，必然从0开始计算，device_id为物理卡号，device_ip则通过上面的hccn_tool获取。第三个元素(group_id="2")代表增

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
Standard资源池节点故障定位 - AI开发平台ModelArts

dcmi接口检测到driver异常。 NPU驱动环境异常。 A050122 NPU 其他 npu dcmi device异常。 NPU设备异常，昇腾dcmi接口中返回设备存在重要或紧急告警。 A050123 NPU 链路 npu dcmi net异常。 NPU网络链接异常。 A050129

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
昇腾迁移快速入门案例 - AI开发平台ModelArts

Stable Diffusion模型迁移到Ascend上进行推理：介绍如何将Stable Diffusion模型通过MSLite进行转换后，迁移在昇腾设备上运行。图7 Stable Diffusion模型迁移到Ascend上进行推理父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
AI应用计费项 - AI开发平台ModelArts

AI应用计费项计费说明在ModelArts创建AI应用不收费，但在通过OBS导入模型创建AI应用时，需要先将模型包文件存放到OBS中，OBS会产生费用。存储资源包括数据存储到OBS的计费。具体内容如表1所示。表1 存储计费项计费项计费项说明适用的计费模式计费公式存储资源

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

n/npu-smi --shm-size 300g --device=/dev/davinci_manager --device=/dev/hisi_hdc --device=/dev/devmm_svm --device=/dev/davinci0 --security-opt

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

使用其中的“networks/merge_lora.py”把lora模型合入unet和text-encoder模型。数据类型不匹配问题如何处理？报错“data type not equal”时，按照堆栈信息，将对应的行数的数据类型修改为匹配的类型。图1 报错信息处理该问题时，pipeline_onnx_s

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
单模型性能调优AOE - AI开发平台ModelArts

k/static_shape_convert/mindir_models/unet_graph.mindir --device=Ascend --numThreads=1 --parallelNum=1 --workersNum=1 --warmUpLoopCount=100 --loopCount=100

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优
SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。检查环境。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info 如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
使用CES监控Lite Server资源 - AI开发平台ModelArts

npu_link_cap_speed NPU链路最大传输速度该指标描述NPU设备支持的最大传输速度 GT/s instance_id，npu npu_link_cap_width NPU链路最大传输宽度该指标描述NPU设备支持的最大传输宽度 count instance_id，npu n

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。配置Cluster资源，确保可以通过公网访问Cluster机器，具体配置请参见配置Lite Cluster网络。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

安全防护套件覆盖和使用堡垒机，增强入侵检测和防御能力 ModelArts服务部署主机层、应用层、网络层和数据层的安全防护套件。及时检测主机层、应用层、网络层和数据层的安全入侵行为。 ModelArts服务涉及对互联网开放的Web应用，采用了统一推荐的Web安全组件防范Web安全风险，并且通过WAF进行安全防护。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
应用迁移 - AI开发平台ModelArts
应用迁移 - AI开发平台ModelArts

应用迁移模型适配 pipeline代码适配父主题：基于AIGC模型的GPU推理业务迁移至昇腾指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导

总条数： 1384

上一页
1
...
6
7
8
...
70
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

删除AI应用 - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

开发环境的应用示例 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

调整模型后，部署新版本AI应用能否保持原API接口不变？ - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

昇腾迁移快速入门案例 - AI开发平台ModelArts

AI应用计费项 - AI开发平台ModelArts

Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

单模型性能调优AOE - AI开发平台ModelArts

SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

应用迁移 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线