搜索_华为云

GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

GPU A系列裸金属服务器如何进行RoCE性能带宽测试？场景描述本文主要指导如何在GPU A系列裸金属服务器上测试RoCE性能带宽。前提条件 GPU A系列裸金属服务器已经安装了IB驱动。（网卡设备名称可以使用ibstatus或者ibstat获取。华为云Ant8裸金属服务器使用Ubuntu20

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？问题现象在高性能8卡GPU的裸金属上的训练任务突然变慢，以前1个epoch约2小时执行完成，最近1个epoch需要2天才能执行完成，并且执行“nvidia-smi”也明显变很卡顿。原因分析根据现象描述可能出现了nvidia-smi

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

可纠正ECC错误（单比特ECC错误），不影响业务。观测方式：nvidia-smi -a中查询到Volatile Correctable记录。 L2: 不可纠正ECC错误（多比特ECC错误），当次业务受损，重启进程可恢复。观测方式：nvidia-smi -a中查询到Volatile Uncorrectable记录。 L3:

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
自动学习项目中，如何进行增量训练？ - AI开发平台ModelArts

自动学习项目中，如何进行增量训练？在自动学习项目中，每训练一次，将自动产生一个训练版本。当前一次的训练结果不满意时（如对训练精度不满意），您可以适当增加高质量的数据，或者增减标签，然后再次进行训练。增量训练目前仅支持“图像分类”、“物体检测”、“声音分类”类型的自动学习项目。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
报错“The VS Code Server failed to start”如何解决？ - AI开发平台ModelArts

报错“The VS Code Server failed to start”如何解决？问题现象解决方法检查VS Code版本是否为1.78.2或更高版本，如果是，请查看Remote-SSH版本，若低于v0.76.1，请升级Remote-SSH。打开命令面板（Windows：

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
报错“The VS Code Server failed to start”如何解决？ - AI开发平台ModelArts

报错“The VS Code Server failed to start”如何解决？问题现象解决方法检查VS Code版本是否为1.78.2或更高版本，如果是，请查看Remote-SSH版本，如果Remote-SSH版本低于v0.76.1，请升级Remote-SSH。打开命令面板（Windows：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
AI Gallery简介 - AI开发平台ModelArts

Gallery的“数据”中，可以查找并下载满足业务需要的数据集。也可以将自己本地的数据集发布至AI Gallery中，共享给其他用户使用。 “资产集市 > 算法”：共享了算法。 AI Gallery的算法模块支持算法的共享和订阅。在AI Gallery的“算法”中，可以查找您想要的算法，订阅满

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

--tensor-parallel-size：并行卡数。此处举例为1，表示使用单卡启动服务。 --host：服务部署的IP，使用本机IP 0.0.0.0。 --port：服务部署的端口8080。 -max-num-seqs：最大同时处理的请求数，超过后在等待池等候处理。 --max-model-len：推理时最

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
连接远端开发环境时，一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上，如何解决？ - AI开发平台ModelArts

SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上，如何解决？问题现象原因分析通过查看日志发现本地vscode-scp-done.flag显示成功上传，但远端未接收到。解决方法关闭VS Code所有窗口

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
【下线公告】华为云ModelArts旧版自动学习下线公告 - AI开发平台ModelArts

主入口面向用户开放，用户可实现在租户账号下管理个人的作业与资源。下线旧版自动学习对现有用户的使用是否有影响？用户将无法再使用旧版自动学习的功能，且因旧版自动学习文件均存储于ModelArts统一管理账号下，用户无法找回旧版自动学习的作业记录。旧版自动学习如何升级到新版自动学习？

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
报错“Load key "C:/Users/xx/test1/xxx.pem": invalid format”如何解决？ - AI开发平台ModelArts

invalid format”如何解决？问题现象原因分析密钥文件内容不正确或格式不正确。解决方法请使用正确的密钥文件进行远程访问，如果本地没有正确的密钥文件或文件已损坏，可以尝试：登录控制台，搜索“数据加密服务 DEW”，选择“密钥对管理 > 账号密钥对”页签，查看并下载正确的密钥文件。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

护套件。及时检测主机层、应用层、网络层和数据层的安全入侵行为。 ModelArts服务涉及对互联网开放的Web应用，采用了统一推荐的Web安全组件防范Web安全风险，并且通过WAF进行安全防护。所有承载ModelArts服务的主机部署了主机安全防护产品。包括不限于华为自研HSS或计算安全平台CSP。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
在推理生产环境中部署推理服务 - AI开发平台ModelArts

--tensor-parallel-size：并行卡数。此处举例为1，表示使用单卡启动服务。 --host：服务部署的IP，使用本机IP 0.0.0.0。 --port：服务部署的端口8080。 -max-num-seqs：最大同时处理的请求数，超过后在等待池等候处理。 --max-model-len：推理时最

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
部署推理服务 - AI开发平台ModelArts

${chat_template_path} \ --dtype ${dtype} \ --host=${docker_ip} \ --port=${port} \ --gpu-memory-utilization=0.9 \ --trust-remote-code 多模态推理服务启动模板参数说明如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
报错“Load key "C:/Users/xx/test1/xxx.pem": invalid format”如何解决？ - AI开发平台ModelArts

invalid format”如何解决？问题现象原因分析密钥文件内容不正确或格式不正确。解决方法请使用正确的密钥文件进行远程访问，如果本地没有正确的密钥文件或文件已损坏，可以尝试：登录控制台，搜索“数据加密服务DEW”，选择“密钥对管理 > 账号密钥对”页签，查看并下载正确的密钥文件。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
如何在代码中打印GPU使用信息 - AI开发平台ModelArts

如何在代码中打印GPU使用信息用户可通过shell命令或python命令查询GPU使用信息。使用shell命令执行nvidia-smi命令。依赖CUDA nvcc watch -n 1 nvidia-smi 执行gpustat命令。 pip install gpustat

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
VS Code ToolKit连接Notebook - AI开发平台ModelArts

too open”如何解决？报错“ssh: connect to host ModelArts-xxx port xxx: Connection timed out”如何解决？报错“Host key verification failed.'或者'Port forwarding

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
部署推理服务 - AI开发平台ModelArts

4和128。 --host=${docker_ip}：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：服务部署的端口。 --gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0.9。 --tru

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

2）不同模型推理支持的max-model-len长度说明。 --hostname：服务部署的IP，使用本机IP 0.0.0.0。 --port：服务部署的端口。服务启动后，会打印如下信息。 server launch time cost: 15.443044185638428 s INFO:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
Notebook如何离线安装VS Code Server - AI开发平台ModelArts

Notebook如何离线安装VS Code Server 背景介绍 VS Code执行remote-ssh远程连接时，会根据用户的VS Code版本去自动更新vscode-server和Vscode-client的版本，通过本地和远端尝试下载相关的安装脚本和包。当远端网络和本地网

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code使用技巧

总条数： 1428

上一页
1
...
8
9
10
...
72
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

自动学习项目中，如何进行增量训练？ - AI开发平台ModelArts

报错“The VS Code Server failed to start”如何解决？ - AI开发平台ModelArts

报错“The VS Code Server failed to start”如何解决？ - AI开发平台ModelArts

AI Gallery简介 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Copying VS Code Server to host with scp"超过10分钟以上，如何解决？ - AI开发平台ModelArts

【下线公告】华为云ModelArts旧版自动学习下线公告 - AI开发平台ModelArts

报错“Load key "C:/Users/xx/test1/xxx.pem": invalid format”如何解决？ - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

报错“Load key "C:/Users/xx/test1/xxx.pem": invalid format”如何解决？ - AI开发平台ModelArts

如何在代码中打印GPU使用信息 - AI开发平台ModelArts

VS Code ToolKit连接Notebook - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

Notebook如何离线安装VS Code Server - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线