搜索_华为云

Lite Server高危操作一览表 - AI开发平台ModelArts

Lite Server高危操作一览表 ModelArts Lite Server在日常操作与维护过程中涉及的高危操作，需要严格按照操作指导进行，否则可能会影响业务的正常运行。高危操作风险等级说明：高：对于可能直接导致业务失败、数据丢失、系统不能维护、系统资源耗尽的高危操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
安装Gallery CLI配置工具 - AI开发平台ModelArts

安装Gallery CLI配置工具场景描述 Gallery CLI配置工具支持将AI Gallery仓库的资产下载到云服务端，便于在云服务本地进行训练、部署推理。 Gallery CLI配置工具支持将单个超过5GB的文件从本地上传至AI Gallery仓库中。约束限制 Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
部署模型为在线服务 - AI开发平台ModelArts

如果您的元模型是自定义的，即推理代码和配置文件是自行编写的（配置文件编写说明），“调用指南”只是将您编写的配置文件进行了可视化展示。调用指南的输入参数与配置文件对应关系如下所示。图2 配置文件与调用指南的对应关系不同输入请求的预测方式如下： JSON文本预测登录ModelArts管理控制台，在左侧菜单栏中选择“模型部署

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

资源池创建失败的原因与解决方法？本文主要介绍在ModelArts资源池创建失败时，如何查找失败原因，并解决问题。问题定位您可以参考以下步骤，查看资源池创建失败的报错信息，并根据相应的解决方法解决问题：登录ModelArts控制台，单击弹性集群，单击资源池列表上方的“操作记录”查看创建失败的资源池。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
认证鉴权 - AI开发平台ModelArts
认证鉴权 - AI开发平台ModelArts

从而通过身份认证。 AK(Access Key ID)：访问密钥ID。与私有访问密钥关联的唯一标识符；访问密钥ID和私有访问密钥一起使用，对请求进行加密签名。 SK(Secret Access Key)：与访问密钥ID结合使用的密钥，对请求进行加密签名，可标识发送方，并防止请求被修改。

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

AK/SK签名认证方式，仅支持Body体12M以内，12M以上的请求，需使用Token认证。客户端须注意本地时间与时钟服务器的同步，避免请求消息头X-Sdk-Date的值出现较大误差。因为API网关除了校验时间格式外，还会校验该时间值与网关收到请求的时间差，如果时间差超过15分钟，API网关将拒绝请求。约束限制

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
删除节点池 - AI开发平台ModelArts

删除节点池功能介绍删除节点池。包周期资源池不支持。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE /v2/{project_id}/pools/{

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
查询指定节点池详情 - AI开发平台ModelArts

查询指定节点池详情功能介绍查询指定节点池详情。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/pools/{pool_

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
导出ModelArts数据集中的数据到AI Gallery - AI开发平台ModelArts

可选择“ModelArts”、“对象存储服务（OBS）”、“本地上传”。 ModelArts区域选择当前控制台所在的区域。 OBS区域选择与当前控制台一致的区域。存储位置用来存储发布的资产。数据类型当前数据集的数据类型。选择数据集选择需要发布的数据集。许可证类型根

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

TensorFlow导出ONNX模型，操作指导请见此处。如何导出PTH模型 PyTorch模型导出时需要包含模型的结构信息，需要利用jit.trace方式完成模型的导出与保存。 # If you are instantiating the model with *from_pretrained* you can

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
设置断点续训练 - AI开发平台ModelArts

train_url = args_opt.train_url # 初始定义的网络、损失函数及优化器，详细请参见MindSpore保存与加载。 # 1.初始定义的网络,以“ResNet50”为例。详细请参见ResNet50。 net = resnet50(args_opt.batch_size

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
查询节点池列表 - AI开发平台ModelArts

查询节点池列表功能介绍查询节点池列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/pools/{pool_name}/nodepools

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

据传输。前提条件在线服务部署时需选择“升级为WebSocket”。在线服务中的模型导入选择的镜像需支持WebSocket协议。约束与限制 WebSocket协议只支持部署在线服务。只支持自定义镜像导入模型部署的在线服务。调用API访问在线服务时，对预测请求体大小和预测时间有限制：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
ModelArts支持云审计的关键操作 - AI开发平台ModelArts

ModelArts支持云审计的关键操作公有云平台提供了云审计服务。通过云审计服务，您可以记录与ModelArts相关的操作事件，便于日后的查询、审计和回溯。前提条件已开通云审计服务。数据管理支持审计的关键操作列表表1 数据管理支持审计的关键操作列表操作名称资源类型事件名称

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用CTS审计ModelArts服务
增量模型训练 - AI开发平台ModelArts

train_url = args_opt.train_url # 初始定义的网络、损失函数及优化器，详细请参见MindSpore保存与加载。 # 1.初始定义的网络,以“ResNet50”为例。详细请参见ResNet50。 net = resnet50(args_opt.batch_size

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

在线服务ID。 model_id 模型负载ID。设置告警规则通过设置ModelArts在线服务和模型负载告警规则，用户可自定义监控目标与通知策略，及时了解ModelArts在线服务和模型负载状况，从而起到预警作用。设置ModelArts服务和模型的告警规则包括设置告警规则名

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
训练作业容错检查 - AI开发平台ModelArts

败场景。针对硬件故障场景，ModelArts提供容错检查功能，帮助用户隔离故障节点，优化用户训练体验。容错检查包括两个检查项：环境预检测与硬件周期性检查。当环境预检查或者硬件周期性检查任一检查项出现故障时，隔离故障硬件并重新下发训练作业。针对于分布式场景，容错检查会检查本次训练作业的全部计算节点。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

每个节点的需求卡数，key保持不变。与MA_NUM_GPUS一致 limits: huawei.com/ascend-1980: "8" # 每个节点的限制卡数，key保持不变。与MA_NUM_GPUS一致

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
通过APP认证的方式访问在线服务 - AI开发平台ModelArts

AppKey/AppSecret认证：通过AppKey与AppSecret对请求进行加密签名，可标识发送方并防止请求被修改。使用AppKey/AppSecret认证时，您需要使用专门的签名SDK对请求进行签名。 AppKey：APP访问密钥ID。与私有访问密钥关联的唯一标识符；访问密钥ID和

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
advisor分析报告html文件详解 - AI开发平台ModelArts

HCCL通信相关环境变量，通常无需设置该环境变量，建议unset该环境变量。具体参考拥塞控制与纠错配置策略 HCCL_RDMA_SL HCCL通信相关环境变量，通常无需设置该环境变量，建议unset该环境变量。具体参考拥塞控制与纠错配置策略 ACLNN_CACHE_LIMIT 用于缓存cann侧的a

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导

总条数： 866

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Lite Server高危操作一览表 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

认证鉴权 - AI开发平台ModelArts

通过AK/SK认证的方式访问在线服务 - AI开发平台ModelArts

删除节点池 - AI开发平台ModelArts

查询指定节点池详情 - AI开发平台ModelArts

导出ModelArts数据集中的数据到AI Gallery - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

设置断点续训练 - AI开发平台ModelArts

查询节点池列表 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

ModelArts支持云审计的关键操作 - AI开发平台ModelArts

增量模型训练 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

训练作业容错检查 - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

advisor分析报告html文件详解 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线