搜索_华为云

启动Notebook实例 - AI开发平台ModelArts

描述 200 OK 201 Created 401 Unauthorized 403 Forbidden 404 Not Found 错误码请参见错误码。父主题：开发环境管理

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

cann_8.0.rc3 驱动 23.0.6 PyTorch 2.1.0 Step1 检查环境 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
ModelArts中提示OBS相关错误 - AI开发平台ModelArts

ModelArts中提示OBS相关错误问题现象在ModelArts中引用OBS桶路径时，提示找不到用户创建的OBS桶或提示ModelArts.2791：非法的OBS路径。在对OBS桶操作时，出现Error: stat:403错误。 Notebook中下载OBS文件时提示Permission

帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

常见的模型转换失败原因可以通过查询转换失败错误码来确认具体导失败的原因。Stable Diffusion新推出的模型在转换中可能会遇到算子不支持的问题，您可以到华为云管理页面上提交工单来寻求帮助。图片大Shape性能劣化严重怎么办？在昇腾设备上，可能由于GPU内存墙导致在大sha

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
Open-Clip基于Lite Server适配PyTorch NPU训练指导 - AI开发平台ModelArts

在每个实例节点上运行此命令可以看到NPU卡状态 npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
查看Standard专属资源池详情 - AI开发平台ModelArts

cel表格中，方便查阅。勾选节点名称，在节点列表上方单击“导出 > 导出全部数据到XLSX”或者“导出 > 导出部分数据到XLSX”，在浏览器的下载记录中查看导出的Excel表格。在节点列表页面中，单击设置图标，支持对节点列表中显示的信息进行自定义。查看资源池规格在资源池详

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
查询支持的镜像列表 - AI开发平台ModelArts

} 状态码状态码描述 200 OK 401 Unauthorized 403 Forbidden 404 Not Found 错误码请参见错误码。父主题：开发环境管理

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
LLaMA-VID基于Lite Server适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

下载model_zoo相关数据从以下5个链接下载model_zoo数据 https://huggingface.co/lmsys/vicuna-7b-v1.5 https://huggingface.co/lmsys/vicuna-13b-v1.5 https://storage.googleapis.c

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
查询Notebook实例列表 - AI开发平台ModelArts

} 状态码状态码描述 200 OK 401 Unauthorized 403 Forbidden 404 Not Found 错误码请参见错误码。父主题：开发环境管理

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
非分离部署推理服务 - AI开发平台ModelArts

/bin/bash 评估推理资源。运行如下命令，返回NPU设备信息可用的卡数。 npu-smi info # 启动推理服务之前检查卡是否被占用、端口是否被占用，是否有对应运行的进程如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
非分离部署推理服务 - AI开发平台ModelArts

/bin/bash 评估推理资源。运行如下命令，返回NPU设备信息可用的卡数。 npu-smi info # 启动推理服务之前检查卡是否被占用、端口是否被占用，是否有对应运行的进程如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

HBM单比特当前错误计数 ma_node_npu_hbm_single_bit_error_total HBM单比特当前错误计数。个 ≥0 NA NA NA HBM多比特当前错误计数 ma_node_npu_hbm_double_bit_error_total HBM多比特当前错误计数。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
查询Notebook实例详情 - AI开发平台ModelArts

} 状态码状态码描述 200 OK 401 Unauthorized 403 Forbidden 404 Not Found 错误码请参见错误码。父主题：开发环境管理

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
Bert基于Lite Server适配MindSpore Lite推理指导(6.3.910) - AI开发平台ModelArts

在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先释放被挂载的NPU或者联系华为方技术支持。检查驱动版本。运行如下命令查询驱动版本，回显信息中的“Software Version”字段值表示驱动版本。NPU ID表示设备编号，可通过npu-smi

帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
权限管理 - AI开发平台ModelArts
权限管理 - AI开发平台ModelArts

任务时打开了“消息通知”，该功能依赖SMN委托授权，但只有训练任务运行过程中，真正需要发送消息时，系统才会“出错”，而有些错误系统会选择“忽略”，另一些错误则可能导致任务直接失败。当您做深入的“权限最小化”限制时，请确保您在ModelArts上将要执行的操作仍旧有足够的权限。严格授权模式

 帮助中心 > AI开发平台ModelArts > 产品介绍
非分离部署推理服务 - AI开发平台ModelArts

/bin/bash 评估推理资源。运行如下命令，返回NPU设备信息可用的卡数。 npu-smi info # 启动推理服务之前检查卡是否被占用、端口是否被占用，是否有对应运行的进程如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
通过SSH工具远程使用Notebook - AI开发平台ModelArts

pem文件生成）。单击“Open”。如果首次登录，PuTTY会显示安全警告对话框，询问是否接受服务器的安全证书。单击“Accept”将证书保存到本地注册表中。图6 询问是否接受服务器的安全证书成功连接到云上Notebook实例。图7 连接到云上Notebook实例父主题：使用Notebook进行AI开发调试

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

} 状态码状态码描述 200 OK 401 Unauthorized 403 Forbidden 404 Not Found 错误码请参见错误码。父主题：开发环境管理

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

保存模型时出现Unable to connect to endpoint错误问题现象训练作业保存模型时日志报错，具体信息如下： InternalError (see above for traceback): : Unable to connect to endpoint 原因分析

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
日志出现ECC错误，导致训练作业失败 - AI开发平台ModelArts

日志出现ECC错误，导致训练作业失败问题现象训练作业日志运行出现如下报错：RuntimeError: CUDA error: uncorrectable ECC error encountered 原因分析由于ECC错误，导致作业运行失败。处理方法当ECC错误且计数超过6

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题

总条数： 859

上一页
1
...
6
7
8
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

启动Notebook实例 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

ModelArts中提示OBS相关错误 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

Open-Clip基于Lite Server适配PyTorch NPU训练指导 - AI开发平台ModelArts

查看Standard专属资源池详情 - AI开发平台ModelArts

查询支持的镜像列表 - AI开发平台ModelArts

LLaMA-VID基于Lite Server适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

查询Notebook实例列表 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

查询Notebook实例详情 - AI开发平台ModelArts

Bert基于Lite Server适配MindSpore Lite推理指导(6.3.910) - AI开发平台ModelArts

权限管理 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

通过SSH工具远程使用Notebook - AI开发平台ModelArts

查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

日志出现ECC错误，导致训练作业失败 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线