搜索_华为云

更新模型服务的单个属性 - AI开发平台ModelArts

String 模型ID。响应参数状态码：200 表5 响应Header参数参数参数类型描述 X-Request-Id String 链路追踪ID。表6 响应Body参数参数参数类型描述 update_time String 本次更新时间，仅触发服务配置升级时会返回，

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询支持的镜像列表 - AI开发平台ModelArts

"description" : "AI inference application development, preconfigured ModelBox and AI engine LibTorch, only SSH connection supported.", "dev_services"

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

和工具链，以及具体的Notebook代码运行示例和最佳实践，并对于实际的操作原理和迁移流程进行说明，包含迁移后的精度和性能验证、调试方法说明。核心概念推理业务昇腾迁移整体流程及工具链图1 推理业务昇腾迁移整体路径推理业务昇腾迁移整体分为七个大的步骤，并以完整工具链覆盖全链路：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
通过patch操作对服务进行更新 - AI开发平台ModelArts

String 替换的目标值。响应参数状态码：200 表5 响应Header参数参数参数类型描述 X-Request-Id String 请求链路编号，可用于日志追踪表6 响应Body参数参数参数类型描述 update_time String 本次更新时间，仅触发服务配置升级

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用CES监控Lite Server资源 - AI开发平台ModelArts

npu_link_status_speed NPU链路当前传输速度该指标描述NPU设备链路的实际传输速度 GT/s ≥0 instance_id，npu 38 npu_link_status_width NPU链路当前传输宽度该指标描述NPU设备链路的实际传输宽度 count ≥0 instance_id，npu

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

如果容器引擎客户端机器为云上的ECS或CCE节点，根据机器所在区域有两种网络链路可以选择：如果机器与容器镜像仓库在同一区域，则上传镜像走内网链路。如果机器与容器镜像仓库不在同一区域，则上传镜像走公网链路，机器需要绑定弹性公网IP。使用客户端上传镜像，镜像的每个layer大小不能大于10G。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
MA-Advisor性能调优建议工具使用指导 - AI开发平台ModelArts

对于集群训练场景，昇腾提供了集群分析工具cluster_analysis，当前主要对基于通信域的迭代内耗时分析、通信时间分析以及通信矩阵分析为主，从而定位慢卡、慢节点以及慢链路问题。父主题： PyTorch迁移性能调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移性能调优
服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

当使用API调用地址预测时，请求体的大小限制是12MB，超过12MB时，请求会被拦截。使用ModelArts console的预测页签进行的预测，由于console的网络链路的不同，要求请求体的大小不超过8MB。图2 请求报错APIG.0201 APIG.0301 鉴权失败通过API进行服务预测，或者使用T

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

NPU设备异常，昇腾dcmi接口中返回设备存在重要或紧急告警。可能是亚健康，建议先重启节点，如果重启节点后未恢复，发起维修流程。 NT_NPU_NET NPU 链路 npu dcmi net异常。 NPU网络链接异常。可能是亚健康，建议先重启节点，如果重启节点后未恢复，发起维修流程。 NT_NPU_CARD_LOSE

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

html），后台的实例运行是一直稳定的，重连即可再次连上。解决方法如果想保持长时间连接不断开，可以通过配置SSH定期发送通信消息，避免防火墙认为链路空闲而关闭。客户端配置（用户可根据需要自行配置，不配置默认是不给服务端发心跳包），如图1，图2所示。图1 打开VS Code ssh config配置文件

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

-s / --service String 否注册镜像的服务类型，NOTEBOOK或者MODELBOX，默认是NOTEBOOK。可以输入多个值，如-s NOTEBOOK -s MODELBOX。 -rs / --resource-category String 否注册镜像能够使用的资源类型，默认是CPU和GPU。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

如果容器引擎客户端机器为云上的ECS或CCE节点，根据机器所在区域有两种网络链路可以选择：如果机器与容器镜像仓库在同一区域，则上传镜像走内网链路。如果机器与容器镜像仓库不在同一区域，则上传镜像走公网链路，机器需要绑定弹性公网IP。使用客户端上传镜像，镜像的每个layer大小不能大于10G。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
开发环境的应用示例 - AI开发平台ModelArts

"description": "AI inference application development, preconfigured ModelBox and AI engine LibTorch, only SSH connection supported.", "dev_services":

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
线下容器镜像构建及调试 - AI开发平台ModelArts

Notebook依赖。推荐使用Dockerfile的方式构建镜像。这样既满足dockerfile可追溯及构建归档的需求，也保证镜像内容无冗余和残留。每层构建的时候都尽量把tar包等中间态文件删除，保证最终镜像更小，清理缓存的方法可参考：conda clean。构建参考样例 Dockerfile样例：

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
什么是Workflow - AI开发平台ModelArts

会使用这条流水线在持续产生的数据中持续迭代训练，确保这条流水线生产出来的模型始终维持在一个较好的状态。图1 MLOps MLOps的整条链路需要有一个工具去承载，MLOps打通了算法开发到交付运维的全流程。和以往的开发交付不同，以往的开发与交付过程是分离的，算法工程师开发完的模

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
自定义脚本代码示例 - AI开发平台ModelArts

model.output} ) # 定义保存路径 builder = tf.saved_model.builder.SavedModelBuilder('./mnist_keras/') builder.add_meta_graph_and_variables( sess

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
查询服务详情 - AI开发平台ModelArts

在线/批量服务使用的AI专属资源池弹性集群的资源池ID，仅当配置专属资源池时返回。 load_balancer_policy String 在线同步服务设置elb后端转发策略详情枚举值：ROUND_ROBIN(加权轮询算法)，LEAST_CONNECTIONS(加权最少连接)，SOURCE_IP(源ip算法)

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
更新服务配置 - AI开发平台ModelArts

erties> 服务级别附加属性，便于服务管理。 load_balancer_policy 否 String 只支持在线同步服务设置后端elb转发策略，枚举值：ROUND_ROBIN(加权轮询算法)，LEAST_CONNECTIONS(加权最少连接)，SOURCE_IP(源ip算法)

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
更新Workflow Execution - AI开发平台ModelArts

ecutions/fa412c98-6d94-42a2-891a-99cd1da93916 { "labels" : [ "labelb" ] } 响应示例状态码：200 OK { "created_at" : "2022-06-16T23:12:48.458022+08:00"

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

org/models/vgg16-397923af.pth vgg.pth 官网下载地址：https://heibox.uni-heidelberg.de/f/607503859c864bc1b30b/?dl=1 将权重vgg16-397923af.pth复制到 /home/ma-user/

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理

总条数： 62

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

更新模型服务的单个属性 - AI开发平台ModelArts

查询支持的镜像列表 - AI开发平台ModelArts

简介 - AI开发平台ModelArts

通过patch操作对服务进行更新 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

MA-Advisor性能调优建议工具使用指导 - AI开发平台ModelArts

服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

开发环境的应用示例 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

什么是Workflow - AI开发平台ModelArts

自定义脚本代码示例 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

更新Workflow Execution - AI开发平台ModelArts

Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线