搜索_华为云

准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

在每个实例节点上运行此命令可以看到NPU卡状态 npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装NPU设备和驱动，或释放被挂载的NPU。检查containerd是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
调用MaaS部署的模型服务 - AI开发平台ModelArts

usage Object 请求输入长度、输出长度和总长度。当调用失败时，可以根据错误码调整脚本或运行环境。表3 常见错误码错误码错误内容说明 400 Bad Request 请求包含语法错误。 403 Forbidden 服务器拒绝执行。 404 Not Found 服务器找不到请求的网页。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
创建Notebook实例 - AI开发平台ModelArts

描述 200 OK 201 Created 401 Unauthorized 403 Forbidden 404 Not Found 错误码请参见错误码。父主题：开发环境管理

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询Workflow Execution - AI开发平台ModelArts

输出配置。表6 WorkflowErrorInfo 参数参数类型描述 error_code String 错误码。 error_message String 错误信息。表7 WorkflowStepExecutionPolicy 参数参数类型描述 execution_policy

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
上传文件夹至OBS - AI开发平台ModelArts

表2 失败响应参数说明参数参数类型描述 error_code String 调用失败时的错误码。调用成功时无此字段。 error_msg String 调用失败时的错误信息。调用成功时无此字段。父主题： OBS管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > OBS管理
AI应用管理 - AI开发平台ModelArts

通过OBS创建AI应用时，构建日志中提示pip下载包失败通过自定义镜像创建AI应用失败导入AI应用后部署服务，提示磁盘不足创建AI应用成功后，部署服务报错，如何排查代码问题自定义镜像导入配置运行时依赖无效通过API接口查询AI应用详情，model_name返回值出现乱码导入AI应用提示模型或镜像大小超过限制

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
创建AI应用失败，如何定位和处理问题？ - AI开发平台ModelArts

和创建AI应用任务下发成功，但最终AI应用创建失败。创建AI应用时直接报错或者是调用API报错。一般都是输入参数不合法导致的。您可以根据提示信息进行排查修改即可。创建AI应用任务下发成功，但最终AI应用创建失败。需要从以下几个方面进行排查：在AI应用详情页面，查看“事件”页

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
如何获取访问密钥？ - AI开发平台ModelArts

我的凭证在“我的凭证”页面，选择“访问密钥>新增访问密钥”，如图3所示。图3 单击新增访问密钥填写该密钥的描述说明，单击“确定”。根据提示单击“立即下载”，下载密钥。图4 新增访问密钥密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

OBS中。 Step10 通过openssl创建SSL pem证书在ECS中执行如下命令，会在当前目录生成cert.pem和key.pem，并将生成的pem证书上传至OBS。证书用于后续在推理生产环境中部署HTTPS推理服务。 openssl genrsa -out key.pem

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
创建节点池 - AI开发平台ModelArts

响应Body参数参数参数类型描述 error_code String ModelArts错误码。 error_msg String 具体错误信息。请求示例创建节点池。 POST https://{endpoint}/v2/{project_id}/pools/{pool_name}/nodepools

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） - AI开发平台ModelArts

h NPU训练指导（6.3.908）场景介绍准备工作预训练 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
GPU相关问题 - AI开发平台ModelArts

GPU相关问题日志提示"No CUDA-capable device is detected" 日志提示“RuntimeError: connect() timed out” 日志提示“cuda runtime error (10) : invalid device ordinal

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

h NPU训练指导（6.3.907）场景介绍准备工作预训练 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
团队标注审核 - AI开发平台ModelArts

} 状态码状态码描述 200 OK 401 Unauthorized 403 Forbidden 404 Not Found 错误码请参见错误码。父主题：数据管理（旧版）

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

h NPU训练指导（6.3.909）场景介绍准备工作预训练 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

h NPU训练指导（6.3.909）场景介绍准备工作预训练 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
更新Workflow Execution - AI开发平台ModelArts

表6 WorkflowErrorInfo 参数是否必选参数类型描述 error_code 否 String 错误码。 error_message 否 String 错误信息。表7 WorkflowStepExecutionPolicy 参数是否必选参数类型描述 execution_policy

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

NPU训练指导（6.3.909）场景介绍准备工作预训练任务 SFT全参微调训练任务 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

NPU训练指导（6.3.907）场景介绍准备工作预训练任务 SFT全参微调训练任务 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

h NPU训练指导（6.3.907）场景介绍准备工作预训练 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理

总条数： 936

上一页
1
...
24
25
26
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备镜像 - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

查询Workflow Execution - AI开发平台ModelArts

上传文件夹至OBS - AI开发平台ModelArts

AI应用管理 - AI开发平台ModelArts

创建AI应用失败，如何定位和处理问题？ - AI开发平台ModelArts

如何获取访问密钥？ - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

创建节点池 - AI开发平台ModelArts

主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） - AI开发平台ModelArts

GPU相关问题 - AI开发平台ModelArts

主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

团队标注审核 - AI开发平台ModelArts

主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

更新Workflow Execution - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线