搜索_华为云

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上，如何解决？ - AI开发平台ModelArts

scp"超过10分钟以上，如何解决？问题现象原因分析通过查看日志发现本地vscode-scp-done.flag显示成功上传，但远端未接收到。解决方法关闭VS Code所有窗口后，回到ModelArts控制台界面再次单击界面上的“VS Code接入”按钮。父主题： VS

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

sequence”报错。粘贴完代码后，建议检查代码文件是否出现中文注释变为乱码的情况，如果出现该情况请将编辑器改为utf-8格式后再粘贴代码。在本地电脑中创建训练脚本“train.py”，内容如下： # base on https://github.com/pytorch/examples

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
状态码 - AI开发平台ModelArts
状态码 - AI开发平台ModelArts

状态码如表1那所示。表1 状态码状态码编码状态码说明 100 Continue 继续请求。这个临时响应用来通知客户端，它的部分请求已经被服务器接收，且仍未被拒绝。 101 Switching Protocols 切换协议。只能切换到更高级的协议。例如，切换到HTTP的新版本协议。 200

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

sequence”报错。粘贴完代码后，建议检查代码文件是否出现中文注释变为乱码的情况，如果出现该情况请将编辑器改为utf-8格式后再粘贴代码。在本地电脑中创建训练脚本“train.py”，内容如下： # base on https://github.com/pytorch/examples

帮助中心 > AI开发平台ModelArts > 快速入门
切换Lite Server服务器操作系统 - AI开发平台ModelArts

像或者私有共享镜像。在BMS控制台切换操作系统获取操作系统镜像。由华为云官方提供给客户操作系统镜像，在IMS镜像服务的共享镜像处进行接收即可，参考如下图操作。图1 共享镜像切换操作系统。对Lite Server资源对应的裸金属服务器，对其进行关机操作，完成关机后，才可以执行切换操作系统动作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
入驻AI Gallery - AI开发平台ModelArts

Gallery，在报名实践活动或发布AI说时，将跳转至“欢迎入驻AI Gallery”页面。在“欢迎入驻AI Gallery”页面，填写“昵称”和“邮箱”，并根据提示获取验证码。阅读并同意《华为云AI Gallery数字内容发布协议》和《华为云AI Gallery服务协议》后，单击“确定”完成入驻。图1 入驻AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

下载代码至本地。本案例中，以图像分类模型resnet50模型为例，路径为“./models/official/cv/resnet/” # 在本地电脑Terminal下载代码至本地 git clone https://gitee.com/mindspore/models.git -b v1

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

25端口出方向无法访问时怎么办？。 HTTP 80 使用HTTP协议访问网站。 POP3 110 使用POP3协议接收邮件。 IMAP 143 使用IMAP协议接收邮件。 HTTPS 443 使用HTTPS协议访问网站。 SQL Server 1433 SQL Server的TCP端口，用于供SQL

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

"value": 2}) # 启动脚本以parser.add_argument('--dist', action='store_true')的形式来接收该布尔类型的参数，如果要传入True，则以本行代码的形式传递； parameters.append({"name": "dist"}) estimator

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

5025 Incorrect verification code 验证码错误请重新填写验证码。 400 ModelArts.5026 Verification code expired 验证码过期请重新获取验证码。 400 ModelArts.5027 The verification

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
使用CES监控Lite Server资源 - AI开发平台ModelArts

npu_opt_rx_power_lane0 NPU光模块通道0接收功率该指标描述NPU光模块通道0接收功率 mW ≥0 instance_id，npu 62 npu_opt_rx_power_lane1 NPU光模块通道1接收功率该指标描述NPU光模块通道1接收功率 mW ≥0 instance_id，npu

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

res=$(($y-$x)) echo $res 上述获取的值*4/300 ，即为当前网卡的接收速率，单位Byte/s。方法2：使用ib_write_bw测试RDMA的读写处理确定带宽服务器A：服务端从mlx4_0网卡接收数据 ib_write_bw -a -d mlx5_0 服务器B：客户端向服务端mlx4_0网卡发送数据。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

mW ≥0 NA NA NA 光模块接收功率0 ma_node_npu_optical_rx_power0 光模块接收功率0。毫瓦 mW ≥0 NA NA NA 光模块接收功率1 ma_node_npu_optical_rx_power1 光模块接收功率1。毫瓦 mW ≥0 NA

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

动态shape 在某些推理场景中，模型输入的shape可能是不固定的，因此需要支持用户指定模型的动态shape，并能够在推理中接收多种shape的输入。在CPU上进行模型转换时无需考虑动态shape问题，因为CPU算子支持动态shape；而在Ascend场景上，算子需要指定具体的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

available for execution on the device 原因分析因为编译的时候需要设置setup.py中编译的参数arch和code和电脑的显卡匹配。解决方法对于GP Vnt1的显卡，GPU算力为-gencode arch=compute_70,code=[sm_70,compute_70]，设置setup

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

参考Tailor指导文档。在某些推理场景中，模型输入的shape可能是不固定的，因此需要支持用户指定模型的动态shape，并能够在推理中接收多种shape的输入。在CPU上进行模型转换时无需考虑动态shape问题，因为CPU算子支持动态shape；而在昇腾场景上，算子需要指定具

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
套餐包 - AI开发平台ModelArts
套餐包 - AI开发平台ModelArts

所有任务消耗时长的总和，每个任务消耗的时长 = 单任务节点个数 * 任务运行时间。套餐包余量预警为避免产生按需消费，建议通过设置套餐包剩余量预警，以确保在套餐包用尽前及时接收预警。设置套餐包剩余量预警步骤如下：进入控制台“费用中心 > 资源包”，单击右上角“剩余量预警”。在“剩余量预警”弹窗中，设置套餐包阈

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
创建训练作业 - AI开发平台ModelArts

from modelarts.estimatorV2 import Estimator session = Session() #训练脚本里接收的参数，请根据实际情况填写 parameters = [{"name": "mod", "value":"gpu"},

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

Connection refused, retrying”。原因分析 NCCL是一个提供GPU间通信原语的库，实现集合通信和点对点发送/接收原语。当训练作业出现NCCL的报错时，可以通过调整NCCL的环境变量尝试解决问题。处理步骤进入状态“运行失败”的训练作业详情页，单击“日志”页签，查看NCCL报错。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

'c:\python39\Scripts\ephemeral-port-reserve.exe.deleteme ”。原因分析用户使用权限问题导致。处理方法用户电脑切换到管理员角色，键盘快捷键（Windows+R模式）并输入cmd，进入黑色窗口，执行如下命令： python -m pip install

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK

总条数： 61

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上，如何解决？ - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

状态码 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

切换Lite Server服务器操作系统 - AI开发平台ModelArts

入驻AI Gallery - AI开发平台ModelArts

使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

套餐包 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线