搜索_华为云

报错“Permissions for 'x:/xxx.pem' are too open”如何解决？ - AI开发平台ModelArts

Windows：C:\Users\{{user}} macOS/Linux： Users/{{user}} 解决方法二：请检查文件和文件夹权限。父主题： VS Code连接开发环境失败常见问题

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

permute(0, 3, 1, 2).contigous()) 将版本回退至pytorch1.3。必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
日志提示“ Network is unreachable” - AI开发平台ModelArts

load(checkpoint) model1.load_state_dict(state_dict) 必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 外网访问限制
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

请求URI 参数说明 URI-scheme 传输请求的协议，当前所有API均采用HTTPS协议。 Endpoint 承载REST服务端点的服务器域名或IP，不同服务在不同区域时，对应Endpoint不同，可以从终端节点中获取。例如IAM服务在“华北-北京一”区域的Endpoint为“iam

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
报错“no such identity: C:/Users/xx /test.pem: No such file or directory”如何解决？ - AI开发平台ModelArts

directory”如何解决？问题现象原因分析密钥文件不存在于该路径下，或者该路径下密钥文件名被修改。解决方法重新选择密钥路径。父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

_wirte_check_passed = True df = pd.read_csv(ff, **param) 必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
Standard资源池 - AI开发平台ModelArts

吗？ 1个节点的专属资源池，能否部署多个服务？专属资源池购买后，中途扩容了一个节点，如何计费？共享池和专属池的区别是什么？如何通过ssh登录专属资源池节点？训练任务的排队逻辑是什么？专属资源池下的在线服务停止后，启动新的在线服务，提示资源不足不同实例的资源池安装的cuda和驱动版本号分别是什么？

帮助中心 > AI开发平台ModelArts > 常见问题
报错“no such identity: C:/Users/xx /test.pem: No such file or directory”如何解决？ - AI开发平台ModelArts

directory”如何解决？问题现象原因分析密钥文件不存在于该路径下，或者该路径下密钥文件名被修改。解决方法重新选择密钥路径。父主题： VS Code连接开发环境失败常见问题

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

Turbo中。方式一操作简单，但是数据传输速度比较慢，费时间。方式二操作相对方式一复杂一些，但是数据传输速度较快。方式一：将已下载的模型文件通过SSH直接上传至SFS Turbo中。具体步骤如下：进入到/mnt/sfs_turbo/目录下。创建目录“training_data”，将原始

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.911） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

购买并开通资源如果使用DevServer资源，请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 准备工作
训练作业失败，返回错误码139 - AI开发平台ModelArts

通和跑不通的日志是否存在pip源更新了依赖包，如下图，安装之前跑通的老版本即可。图1 PIP安装对比图推荐您使用本地Pycharm远程连接Notebook调试。如果上述情况都解决不了，请联系技术支持工程师。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

Turbo中。方式一操作简单，但是数据传输速度比较慢，费时间。方式二操作相对方式一复杂一些，但是数据传输速度较快。方式一：将已下载的模型文件通过SSH直接上传至SFS Turbo中。具体步骤如下：进入到/mnt/sfs_turbo/目录下。创建目录“training_data”，将原始

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

Turbo中。方式一操作简单，但是数据传输速度比较慢，费时间。方式二操作相对方式一复杂一些，但是数据传输速度较快。方式一：将已下载的模型文件通过SSH直接上传至SFS Turbo中。具体步骤如下：进入到/mnt/sfs_turbo/目录下。创建目录“training_data”，将原始

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

Turbo中。方式一操作简单，但是数据传输速度比较慢，费时间。方式二操作相对方式一复杂一些，但是数据传输速度较快。方式一：将已下载的模型文件通过SSH直接上传至SFS Turbo中。具体步骤如下：进入到/mnt/sfs_turbo/目录下。创建目录“training_data”，将原始

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910） > 准备工作
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

购买并开通资源如果使用DevServer资源，请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
日志提示"write line error" - AI开发平台ModelArts

system("ulimit -c 0") 排查数据集大小，checkpoint保存文件大小，是否占满了磁盘空间。必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
OOM导致训练作业失败 - AI开发平台ModelArts

释放一些不需要的tensor，使用过的，如下： del tmp_tensor torch.cuda.empty_cache() 必现的问题，使用本地Pycharm远程连接Notebook调试超参。如果还存在问题，可能需要提工单进行定位，甚至需要隔离节点修复。建议与总结在创建训练作业前，推荐您先使用Mo

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

cudaGetDeviceCount()提示CUDA initializat失败裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案

 帮助中心 > AI开发平台ModelArts > 故障排除
部署模型为在线服务 - AI开发平台ModelArts

在线服务列表页面单击“名称/ID”，进入在线服务详情页面。单击CloudShell页签，选择模型版本和计算节点，当连接状态变为时，即登录实例容器成功。如果遇到异常情况服务器主动断开或超过10分钟未操作自动断开，此时可单击“重新连接”重新登录实例容器。图5 CloudShell界面部分用户登录Cloud Sh

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

需要进入容器看日志。注意：重点对应日志中是否有ERROR（包括，容器启动时、API执行时）。牵扯部分文件用户组不一致的情况，可以在宿主机用root权限执行命令进行修改 docker exec -u root:root 39c9ceedb1f6 bash -c "chown -R

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业

总条数： 409

上一页
1
...
10
11
12
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

报错“Permissions for 'x:/xxx.pem' are too open”如何解决？ - AI开发平台ModelArts

日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

日志提示“ Network is unreachable” - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

报错“no such identity: C:/Users/xx /test.pem: No such file or directory”如何解决？ - AI开发平台ModelArts

使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

Standard资源池 - AI开发平台ModelArts

报错“no such identity: C:/Users/xx /test.pem: No such file or directory”如何解决？ - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

训练作业失败，返回错误码139 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

日志提示"write line error" - AI开发平台ModelArts

OOM导致训练作业失败 - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线