搜索_华为云

状态码 - AI开发平台ModelArts
状态码 - AI开发平台ModelArts

未满足前提条件，服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大，服务器无法处理，因此拒绝请求。为防止客户端的连续请求，服务器可能会关闭连接。如果只是服务器暂时无法处理，则会包含一个Retry-After的响应信息。

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ ModelArts提供AI诊断功能，用户可以通过NCCl Test，测试节点GPU状态，并且测试多个节点间的通信速度。操作步骤单击资源池名称，进入资源池详情。单击左侧“AI组件管理 > AI诊断”。单击“诊断”，选择“日志上传路径”和NCCL

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Cluster
Ascend上如何查看实时性能指标？ - AI开发平台ModelArts

Ascend上如何查看实时性能指标？ Ascend芯片上查看实时性能指标：npu-smi info，类似GPU的nvidia-smi。父主题：更多功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
训练作业的自定义镜像如何安装Moxing？ - AI开发平台ModelArts

训练作业的自定义镜像如何安装Moxing？为避免自动安装Moxing会影响用户自定义镜像中的包环境，所以自定义镜像需要用户手动安装Moxing。Moxing安装包会在作业启动后放在“/home/ma-user/modelarts/package/”目录下。可在使用Moxing功

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
如何查看训练作业资源占用情况？ - AI开发平台ModelArts

如何查看训练作业资源占用情况？在ModelArts管理控制台，选择“模型训练>训练作业”，进入训练作业列表页面。在训练作业列表中，单击目标作业名称，查看该作业的详情。您可以在“资源占用情况”页签查看到如下指标信息。 CPU：CPU使用率（cpuUsage）百分比（Percent）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 查看作业详情
在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

在线服务预测时，如何提高预测速度？部署在线服务时，您可以选择性能更好的“计算节点规格”提高预测速度。例如使用GPU资源代替CPU资源。部署在线服务时，您可以增加“计算节点个数”。如果节点个数设置为1，表示后台的计算模式是单机模式；如果节点个数设置大于1，表示后台的计算模式为分布式的。您可以根据实际需求进行选择。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
创建Workflow数据集标注节点 - AI开发平台ModelArts

数据集标注节点的名称，命名规范(只能包含英文字母、数字、下划线（_）、中划线（-），并且只能以英文字母开头，长度限制为64字符)，一个Workflow里的两个step名称不能重复是 str inputs 数据集标注节点的输入列表是 LabelingInput或者LabelingInput的列表

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
在Notebook中如何查看GPU使用情况 - AI开发平台ModelArts

在Notebook中如何查看GPU使用情况创建Notebook时，当您选择的类型为GPU时，查看GPU使用情况具体操作如下：登录ModelArts管理控制台，选择“开发空间>Notebook”。在Notebook列表中，单击目标Notebook“操作”列的“打开”，进入“Jupyter”开发页面。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

ontainer_dir为要挂载到的容器中的目录。为方便两个地址可以相同。 shm-size：共享内存大小，建议不低于80GB。 name ${container_name}：容器名称，进入容器时会用到，此处可以自己定义一个容器名称。 v ${work_dir}:${contai

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
如何用ModelArts训练基于结构化数据的模型？ - AI开发平台ModelArts

如何用ModelArts训练基于结构化数据的模型？针对一般用户，ModelArts提供自动学习的预测分析场景来完成结构化数据的模型训练。针对高阶用户，ModelArts在开发环境提供创建Notebook进行代码开发的功能，在训练作业提供创建大数据量训练任务的功能；用户在开发、

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
模型推理代码编写说明 - AI开发平台ModelArts

说明，针对常用AI引擎的自定义脚本代码示例（包含推理代码示例），请参见自定义脚本代码示例。本文在编写说明下方提供了一个TensorFlow引擎的推理代码示例以及一个在推理脚本中自定义推理逻辑的示例。 ModelArts推理因API网关（APIG）的限制，模型单次预测的时间不能超过

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
创建单机多卡的分布式训练（DataParallel） - AI开发平台ModelArts

MindSpore引擎的分布式训练参见MindSpore官网。训练流程简述单机多卡数据并行训练流程介绍如下：将模型复制到多个GPU上将一个Batch的数据均分到每一个GPU上各GPU上的模型进行前向传播，得到输出主GPU（逻辑序号为0）收集各GPU的输出，汇总后计算损失分发损失，各GPU各自反向传播梯度

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
在Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

在Notebook中，如何使用昇腾多卡进行调试？昇腾多卡训练任务是多进程多卡模式，跑几卡需要起几个python进程。昇腾底层会读取环境变量：RANK_TABLE_FILE，开发环境已经设置，用户无需关注。比如跑八卡，可以如下片段代码： export RANK_SIZE=8

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
MoXing常用操作的样例代码 - AI开发平台ModelArts

remove('obs://bucket_name/sub_dir_0', recursive=True) 移动和复制操作移动一个OBS文件或文件夹。移动操作本身是用“复制+删除”来实现的。一个OBS文件移动到另一个OBS文件，例如将“obs://bucket_name/obs_file.txt”移动到“ob

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
服务部署 - AI开发平台ModelArts
服务部署 - AI开发平台ModelArts

服务启动失败服务部署、启动、升级和修改时，拉取镜像失败如何处理？服务部署、启动、升级和修改时，镜像不断重启如何处理？服务部署、启动、升级和修改时，容器健康检查失败如何处理？服务部署、启动、升级和修改时，资源不足如何处理？模型使用CV2包部署在线服务报错服务状态一直处于“部署中”

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？问题现象启动服务失败，报错：资源不足，服务调度失败。（Schedule failed due to insufficient resources. Retry later.或ModelArts.3976：No resources

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
训练作业失败，如何使用开发环境调试训练代码？ - AI开发平台ModelArts

训练作业失败，如何使用开发环境调试训练代码？在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VsCode）联接云上环境调试请参考使用本地IDE开发模型。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
配置节点参数控制分支执行 - AI开发平台ModelArts

# 训练节点的名称，命名规范(只能包含英文字母、数字、下划线（_）、中划线（-），并且只能以英文字母开头，长度限制为64字符)，一个Workflow里的两个step名称不能重复 title="图像分类训练", # 标题信息，不填默认使用name algorithm=wf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

步骤二：使用Docker安装和配置正向代理购买弹性云服务器ECS，详情请见购买ECS。镜像可选择Ubuntu最新版本。虚拟私有云选择提前创建好的VPC。申请弹性公网IP EIP，详情请见申请弹性公网IP。将弹性公网IP绑定到ECS，详情请见将弹性公网IP绑定至实例。登录ECS，执行如下命令进行Do

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
如何安装第三方包，安装报错的处理方法 - AI开发平台ModelArts

如何安装第三方包，安装报错的处理方法问题现象 ModelArts如何安装自定义库函数，例如“apex”。 ModelArts训练环境安装第三方包时出现如下报错： xxx.whl is not a supported wheel on this platform 原因分析由于安装的文件名格式不支持，导致出现“xxx

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障

总条数： 1383

上一页
1
...
14
15
16
...
70
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

状态码 - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

Ascend上如何查看实时性能指标？ - AI开发平台ModelArts

训练作业的自定义镜像如何安装Moxing？ - AI开发平台ModelArts

如何查看训练作业资源占用情况？ - AI开发平台ModelArts

在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

创建Workflow数据集标注节点 - AI开发平台ModelArts

在Notebook中如何查看GPU使用情况 - AI开发平台ModelArts

Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

如何用ModelArts训练基于结构化数据的模型？ - AI开发平台ModelArts

模型推理代码编写说明 - AI开发平台ModelArts

创建单机多卡的分布式训练（DataParallel） - AI开发平台ModelArts

在Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

MoXing常用操作的样例代码 - AI开发平台ModelArts

服务部署 - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

训练作业失败，如何使用开发环境调试训练代码？ - AI开发平台ModelArts

配置节点参数控制分支执行 - AI开发平台ModelArts

ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

如何安装第三方包，安装报错的处理方法 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线