搜索_华为云

VS Code自动升级后，导致远程连接时间过长 - AI开发平台ModelArts

Code自动升级后，导致远程连接时间过长问题现象原因分析由于VS Code自动升级，导致连接时需要重新下载新版vscode-server。解决方法禁止VS Code自动升级。单击左下角选择Settings项，搜索Update: Mode，将其设置为none。图1 打开Settings

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

推理精度测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题附录：工作负载Pod异常问题和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
使用Windows下生成的文本文件时报错找不到路径？ - AI开发平台ModelArts

原因分析 Notebook是Linux环境，和Windows环境下的换行格式不同，Windows下是CRLF，而Linux下是LF。解决方法可以在Notebook中转换文件格式为Linux格式。 shell语言： dos2unix 文件名父主题：代码运行常见错误

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
使用Windows下生成的文本文件时报错找不到路径？ - AI开发平台ModelArts

原因分析 Notebook是Linux环境，和Windows环境下的换行格式不同，Windows下是CRLF，而Linux下是LF。解决方法可以在Notebook中转换文件格式为Linux格式。 shell语言： dos2unix 文件名父主题：代码运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
文件上传下载 - AI开发平台ModelArts

如何下载Notebook中的文件到本地？如何将开发环境Notebook A的数据复制到Notebook B中？在Notebook中上传文件失败，如何解决？动态挂载OBS并行文件系统成功，但是在Notebook的JupyterLab中无法看到本地挂载点父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
训练作业卡死检测定位 - AI开发平台ModelArts

由于检测规则的局限性，当前卡死检测存在一定的误检率。如果是作业代码本身逻辑（如长时间sleep）导致的卡死，请忽略。如果对于误检有疑问或者卡死问题无法自行解决，您可以前往ModelArts开发者论坛进行提问或者搜索问题。约束限制目前卡死检测仅支持资源类型为GPU的训练作业。操作步骤卡死检

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业卡死
Lite功能介绍 - AI开发平台ModelArts

Cluster主要支持以下功能：同一昇腾算力资源池中，支持存在不同订购周期的服务器同一昇腾算力资源池中，支持资源池中订购不同计费类型/计费周期的资源，解决如下用户的使用场景：用户在包长周期的资源池中无法扩容短周期的节点。用户无法在包周期的资源池中扩容按需的节点（包括AutoScaler场景）。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
使用PyCharm ToolKit ，提示Error occurs when accessing to OBS - AI开发平台ModelArts

ToolKit的日志，报错信息为：Error occurs when accessing to OBS。原因分析可能是用户无OBS权限。解决方法判断用户是否有OBS权限。登录ModelArts控制台，进入“数据管理 > 数据集 ”，单击“创建数据集”，如果可以成功访问对应的

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > PyCharm Toolkit使用
在Notebook中使用tensorboard命令打开日志文件报错Permission denied - AI开发平台ModelArts

--logdir ./命令，报错[Errno 13] Permission denied……。原因分析当前目录下包含没有权限的文件。解决方法建议用户新建一个文件夹（例如：tb_logs），将tensorboard的日志文件（例如：tb.events）放到新建的文件夹下，然

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 其他故障
创建训练作业 - AI开发平台ModelArts

创建训练作业创建训练作业时提示“对象目录大小/数量超过限制”，如何解决？训练环境中不同规格资源“/cache”目录的大小训练作业的“/cache”目录是否安全？训练作业一直在等待中（排队）？创建训练作业时，超参目录为什么有的是/work有的是/ma-user？在Mod

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业
VS Code连接开发环境时报错Missing GLIBC，Missing required dependencies - AI开发平台ModelArts

additional information. 原因分析该问题为用户使用VS Code 1.86版本软件导致的，需要用户使用较低版本的VS Code 。解决方案使用VS Code 1.85版本软件。下载链接：https://code.visualstudio.com/updates/v1_85。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

model quota. 查询模型配额失败。联系服务运维人员解决。 400 ModelArts.3577 Failed to update the model quota. 更新模型配额失败。联系服务运维人员解决。 400 ModelArts.3578 Insufficient

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
使用PyCharm Toolkit提交训练作业报错NoSuchKey - AI开发平台ModelArts

志”页签存在报错“errorCode:NoSuchKey”。原因分析检查配置后发现，是镜像版本太低，旧版的镜像与当前训练作业不兼容。解决措施使用PyCharm Toolkit提交训练作业时，常用框架选择训练作业支持的版本，具体支持哪些版本请参考训练作业支持的AI引擎。Py

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > PyCharm Toolkit使用
训练前卡死 - AI开发平台ModelArts

environ["NCCL_DEBUG"] = "INFO"，查看NCCL DEBUG信息。问题现象1 日志中还未出现NCCL DEBUG信息时已卡死。解决方案1 检查代码，检查是否有参数中未传入“master_ip”和“rank”参数等问题。问题现象2 分布式训练的日志中，发现有的节点含有

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业卡死
创建Notebook失败，查看事件显示JupyterProcessKilled - AI开发平台ModelArts

出现此故障是因为Jupyter进程被清理掉了，一般情况Notebook会自动重启的，如果没有自动重启，创建一直失败，请确认是否是自定义镜像的问题。解决方案排查是否是自定义镜像的问题。自定义镜像构建完成，在ModelArts镜像管理注册时，“架构”和“类型”需要和源镜像保持一致。图2

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
TensorFlow在OBS写入TensorBoard到达5GB时停止 - AI开发平台ModelArts

S单次导入文件大小的上限，导致无法继续写入。处理方法如果在运行训练作业的过程中出现该问题，建议处理方法如下：推荐使用本地缓存的方式来解决，使用如下方法： import moxing.tensorflow as mox mox.cache() 父主题： OBS操作相关故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
AI Gallery - AI开发平台ModelArts
AI Gallery - AI开发平台ModelArts

AI Gallery AI Gallery的入口在哪里在AI Gallery订阅商品失败怎么办？在AI Gallery订阅的数据集可以在SDK中使用吗？ AI Gallery支持哪些区域？ AI Gallery下载数据到OBS中使用的带宽是用户自己的还是华为云的？

帮助中心 > AI开发平台ModelArts > 常见问题
在线服务预测报错MR.0105 - AI开发平台ModelArts

请在“在线服务”详情页面的日志页签中查看对应的报错日志，分析报错原因。图2 报错日志从上图报错日志判断，预测失败是模型推理代码编写有问题。解决方法根据日志报错提示，append方法中缺少必填参数，修改模型推理代码文件“customize_service.py”中的代码，给append方法中传入合理的参数。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
创建训练作业时，超参目录为什么有的是/work有的是/ma-user？ - AI开发平台ModelArts

问题描述创建训练作业时，输入输出参数的超参目录有的是/work，有的是/ma-user。图1 目录是/ma-user 图2 目录是/work 解决方案这是创建训练作业选用的算法有差异导致的。如果选择的算法是使用旧版镜像创建的，那么创建训练作业时输入输出参数的超参目录就是/work。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 创建训练作业
VS Code一键连接Notebook - AI开发平台ModelArts

port xxxxx: Connection refused”如何解决？报错“no such identity: C:/Users/xx /test.pem: No such file or directory”如何解决？报错“Bad owner or permissions on

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例

总条数： 366

上一页
1
...
11
12
13
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

VS Code自动升级后，导致远程连接时间过长 - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

使用Windows下生成的文本文件时报错找不到路径？ - AI开发平台ModelArts

使用Windows下生成的文本文件时报错找不到路径？ - AI开发平台ModelArts

文件上传下载 - AI开发平台ModelArts

训练作业卡死检测定位 - AI开发平台ModelArts

Lite功能介绍 - AI开发平台ModelArts

使用PyCharm ToolKit ，提示Error occurs when accessing to OBS - AI开发平台ModelArts

在Notebook中使用tensorboard命令打开日志文件报错Permission denied - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

VS Code连接开发环境时报错Missing GLIBC，Missing required dependencies - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

使用PyCharm Toolkit提交训练作业报错NoSuchKey - AI开发平台ModelArts

训练前卡死 - AI开发平台ModelArts

创建Notebook失败，查看事件显示JupyterProcessKilled - AI开发平台ModelArts

TensorFlow在OBS写入TensorBoard到达5GB时停止 - AI开发平台ModelArts

AI Gallery - AI开发平台ModelArts

在线服务预测报错MR.0105 - AI开发平台ModelArts

创建训练作业时，超参目录为什么有的是/work有的是/ma-user？ - AI开发平台ModelArts

VS Code一键连接Notebook - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线