搜索_华为云

服务管理 - AI开发平台ModelArts
服务管理 - AI开发平台ModelArts

查询专属资源池列表查询服务事件日志启动停止边缘节点服务实例查询服务更新日志添加资源标签删除资源标签查询推理服务标签查询推理VPC访问通道信息的API

帮助中心 > AI开发平台ModelArts > API参考
Standard推理部署 - AI开发平台ModelArts

Standard创建模型部署在线服务第三方推理框架迁移到ModelArts Standard推理自定义引擎 ModelArts Standard推理服务支持VPC直连的高速访问通道配置 ModelArts Standard的WebSocket在线服务全流程开发从0-1制作自定义镜像并创建模型使用AppCode认证鉴权方式进行在线预测

 帮助中心 > AI开发平台ModelArts > 最佳实践
服务预测失败 - AI开发平台ModelArts

问题现象在线服务部署完成且服务已经处于“运行中”的状态，向服务发起推理请求，预测失败。原因分析及处理方法服务预测需要经过客户端、外部网络、APIG、Dispatch、模型服务多个环节。每个环节出现都会导致服务预测失败。图1 推理服务流程图出现APIG.XXXX类型的报错

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
msprobe精度分析工具使用指导 - AI开发平台ModelArts

对和梯度监控等功能。更多内容请参考msprobe工具介绍。一般场景的训练模型都是包括随机种子、数据集Shuffle、网络结构Dropout等操作的，目的是在网络阶段引入一定的随机性使得训练结果更加具有鲁棒性。然而在精度对齐阶段，这些随机性会导致训练运行结果每次表现不一致，无法进

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
配置Lite Cluster存储 - AI开发平台ModelArts

训练任务。静态挂载动态挂载 SFS Turbo 适用于海量小文件业务场景。提供posix协议的文件系统；需要和资源池在同一个VPC下或VPC互通；价格较高。静态挂载动态挂载：不支持 SFS 适用于多读多写场景的持久化存储。适用大容量扩展以及成本敏感型的业务场景，包

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

了多个GPU和深度学习加速器的并行处理能力。可以高效地训练大规模的语言模型。 Megatron-LM是一个用于大规模语言建模的模型。它基于GPT（Generative Pre-trained Transformer）架构，这是一种基于自注意力机制的神经网络模型，广泛用于自然语言处

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

NA NA NA 网络IO 下行速率 ma_container_network_receive_bytes 该指标用于统计测试对象的入方向网络流速。字节/秒（Bytes/Second） ≥0 NA NA NA 接收包速率 ma_container_network_receive_packets

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

OBS+SFS Turbo的存储加速实践。表1 不同场景所需服务及购买推荐场景 OBS SFS SWR DEW ModelArts VPC ECS EVS 单机单卡按需购买（并行文件系统） × 免费免费包月购买免费 × 按需购买单机多卡 × 包月购买（HPC型500G）

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
请求超时返回Timeout - AI开发平台ModelArts

优先排查APIG（API网关）是否是通的，可以在本地使用curl命令排查，命令行：curl -kv {预测地址}。如返回Timeout则需排查本地防火墙，代理和网络配置。检查模型是否启动成功或者模型处理单个消息的时长。因APIG（API网关）的限制，模型单次预测的时间不能超过40S，超过后系统会默认返回Timeout错误。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
从0制作自定义镜像用于创建训练作业（Pytorch+Ascend） - AI开发平台ModelArts

rts平台上进行训练。镜像中使用的AI引擎是PyTorch，训练使用的资源是专属资源池的Ascend芯片。准备工作准备一套可以连接外部网络，装有Linux系统并安装18.09.7及以上版本docker的虚拟机或物理机用作镜像构建节点，以下称“构建节点”。可以通过执行docker

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
如何关闭Mox的warmup - AI开发平台ModelArts

的时候，会先执行“50steps” 4次，然后才会开始正式运行。 warmup即先用一个小的学习率训练几个epoch（warmup），由于网络的参数是随机初始化的，如果一开始就采用较大的学习率会出现数值不稳定的问题，这是使用warm up的原因。等到训练过程基本稳定之后就可以使用原先设定的初始学习率进行训练。

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
ModelArts中常用概念 - AI开发平台ModelArts

端-边-云分别指端侧设备、智能边缘设备、公有云。推理指按某种策略由已知判断推出新判断的思维过程。人工智能领域下，由机器模拟人类智能，使用构建的神经网络完成推理过程。在线推理在线推理是对每一个推理请求同步给出推理结果的在线服务（Web Service）。批量推理批量推理是对批量数据进行推理的批量作业。

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
Standard自动学习 - AI开发平台ModelArts

Standard自动学习 ModelArts通过机器学习的方式帮助不具备算法开发能力的业务开发者实现算法的开发，基于迁移学习、自动神经网络架构搜索实现模型自动生成，通过算法实现模型训练的参数自动化选择和模型自动调优的自动学习功能，让零AI基础的业务开发者可快速完成模型的训练和部署。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
设置断点续训练 - AI开发平台ModelArts

url_0" 。 train_url = args_opt.train_url # 初始定义的网络、损失函数及优化器，详细请参见MindSpore保存与加载。 # 1.初始定义的网络,以“ResNet50”为例。详细请参见ResNet50。 net = resnet50(args_opt

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
查询节点池的节点列表 - AI开发平台ModelArts

Deleting：节点删除中 Abnormal：节点不正常 Checking: 节点自检中 az String 节点所在的可用区。 privateIp String 节点的IP地址。 resources NodeResource object 节点资源量信息。 availableResources

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

install.sh modellink 在执行 install.sh 安装命令时，需要确认机器是否已连通网络。若无法连通网络或无法git clone下载代码，用户则需要找到已连通网络的机器（本章节以Linux系统机器为例）将下载完成的源码放置代码目录：AscendFactory/third-party下，命令如下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
Wav2Lip推理基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

Wav2Lip推理基于Lite Server适配PyTorch NPU推理指导（6.3.907） Wav2Lip是一种基于对抗生成网络的由语音驱动的人脸说话视频生成模型。主要应用于数字人场景。不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频，还可以直接将动态的视频进行唇形转

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
增量模型训练 - AI开发平台ModelArts

url_0" 。 train_url = args_opt.train_url # 初始定义的网络、损失函数及优化器，详细请参见MindSpore保存与加载。 # 1.初始定义的网络,以“ResNet50”为例。详细请参见ResNet50。 net = resnet50(args_opt

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
配置Lite Server存储 - AI开发平台ModelArts

存放的是二进制数据，无法直接存放文件，如果需要存放文件，需要先格式化文件系统后使用。访问方式在BMS中通过网络协议挂载使用，支持NFS和CIFS的网络协议。需要指定网络地址进行访问，也可以将网络地址映射为本地目录后进行访问。可以通过互联网或专线访问。需要指定桶地址进行访问，使用的是HTTP和HTTPS等传输协议。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
日志提示“ Network is unreachable” - AI开发平台ModelArts

日志提示“ Network is unreachable” 问题现象在使用pytorch时，将torchvision.models中的pretrained置为了True，日志中出现如下报错： ‘OSError: [Errno 101] Network is unreachable’

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 外网访问限制

总条数： 457

上一页
1
...
7
8
9
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

服务管理 - AI开发平台ModelArts

Standard推理部署 - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

msprobe精度分析工具使用指导 - AI开发平台ModelArts

配置Lite Cluster存储 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

请求超时返回Timeout - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Pytorch+Ascend） - AI开发平台ModelArts

如何关闭Mox的warmup - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

Standard自动学习 - AI开发平台ModelArts

设置断点续训练 - AI开发平台ModelArts

查询节点池的节点列表 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

Wav2Lip推理基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

增量模型训练 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

日志提示“ Network is unreachable” - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线