搜索_华为云

SD3基于DevServer适配PyTorch NPU的训练指导（6.3.912） - AI开发平台ModelArts

确保容器可以访问公网。步骤一：检查环境请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
新建Workflow Execution - AI开发平台ModelArts

deployed service will stop in hours, where -1 means the service will always run", "delay" : true, "used_steps" : [ "service_step" ]

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

8*ascend-snt9b表示昇腾8卡。推荐使用“西南-贵阳一”Region上的昇腾资源。创建OBS桶 ModelArts使用对象存储服务（Object Storage Service，简称OBS）进行数据存储以及模型的备份和快照，实现安全、高可靠和低成本的存储需求。因此，在使用ModelArts之

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

S对象存储服务（Object Storage Service）与SFS Turbo文件系统联动，可以实现灵活数据管理、高性能读取等。约束限制适配的CANN版本是cann_8.0.rc3，驱动版本是23.0.6。本案例仅支持在专属资源池上运行，确保专属资源池可以访问公网。文档更新内容

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912）
OBS操作相关故障 - AI开发平台ModelArts

OBS操作相关故障读取文件报错，如何正确读取文件 TensorFlow-1.8作业连接OBS时反复出现提示错误 TensorFlow在OBS写入TensorBoard到达5GB时停止保存模型时出现Unable to connect to endpoint错误 OBS复制过程中提示“BrokenPipeError:

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
产品发布说明 - AI开发平台ModelArts

ModelArts版本配套关系表昇腾云服务6.3.912版本说明昇腾云服务6.3.911版本说明昇腾云服务6.3.910版本说明（推荐）昇腾云服务6.3.909版本说明昇腾云服务6.3.908版本说明昇腾云服务6.3.907版本说明昇腾云服务6.3.906版本说明昇腾云服务6.3.905版本说明

 帮助中心 > AI开发平台ModelArts > 服务公告
将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

“商品数量”，用户可以基于业务需要选择任务所需的资源卡数。在“运行时长控制”选择是否指定运行时长。不限时长：不限制作业的运行时长，AI Gallery工具链服务部署完成后将一直处于“运行中”。指定时长：设置作业运行几小时后停止，当AI Gallery工具链服务运行时长达到指

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
发布ModelArts模型 - AI开发平台ModelArts

Arts管理控制台向使用方收取。发布至AI云商店华为云云商店是软件及服务交易交付平台。云商店AI专区汇聚优质的人工智能服务提供商，提供丰富的人工智能解决方案、应用、API及算法模型，助力用户快速部署、接入、调用相关应用，方便地购买和使用算法模型。发布至云商店AI专区的模型为

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

0.5。本文档适用于OBS+SFS Turbo的数据存储方案，不适用于仅使用OBS的存储方案。通过OBS对象存储服务（Object Storage Service）与SFS Turbo文件系统联动，可以实现数据灵活管理、高性能读取数据等。通过OBS上传训练所需的模型文件、训练数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

持。提示：本文档适用于OBS+SFS Turbo的数据存储方案，不适用于仅OBS存储方案。通过OBS对象存储服务（Object Storage Service）与SFS Turbo文件系统联动，可以实现灵活数据管理、高性能读取等。约束限制如果要使用自动重启功能，资源规格必须选择八卡规格。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

持。提示：本文档适用于OBS+SFS Turbo的数据存储方案，不适用于仅OBS存储方案。通过OBS对象存储服务（Object Storage Service）与SFS Turbo文件系统联动，可以实现灵活数据管理、高性能读取等。约束限制如果要使用自动重启功能，资源规格必须选择八卡规格。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910）
部署推理服务 - AI开发平台ModelArts

部署推理服务非分离部署推理服务分离部署推理服务父主题：主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
报错“Host key verification failed.'或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

forwarding is disabled.”如何解决？问题现象或原因分析 Notebook实例重新启动后，公钥发生变化，OpenSSH核对公钥发出警告。解决方法在VS Code中使用命令方式进行远程连接时，增加参数"-o StrictHostKeyChecking=no" ssh -tt

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

${pod_scheduler_name} 图3 scheduler 若重启后，还是会Pending，建议多重复重启几次。其他实例调度失败问题首先通过打印Pod日志信息。根据错误信息，可通过访问官网链接：工作负载异常：实例调度失败，进行查找。父主题：主流开源大模型基于Lite Cluster适配PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
产品变更公告 - AI开发平台ModelArts

产品变更公告网络调整公告预测API的域名停用公告

 帮助中心 > AI开发平台ModelArts > 服务公告
查询模型详情 - AI开发平台ModelArts

执行代码存放的OBS地址，名称固定为“customize_service.py”。 schema_doc String 模型schema文档的下载地址。 image_address String 模型的执行镜像地址，镜像未构建之前（即当前模型从未发布成服务），显示为空。 input_params params结构数组

 帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
ModelArts控制台为什么能看到创建失败被删除的专属资源池？ - AI开发平台ModelArts

ModelArts控制台为什么能看到创建失败被删除的专属资源池？在控制台页面操作删除专属资源池后，后端服务需要进行资源实例释放。在资源实例释放过程中，用户依然可以查询到资源池。如果需要创建专属资源池，建议等待5min后再创建，且不要使用已创建过的专属资源池名称来命名新建的专属资

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

${pod_scheduler_name} 图3 scheduler 若重启后，还是会Pending，建议多重复重启几次。其他实例调度失败问题首先通过打印Pod日志信息。根据错误信息，可通过访问官网链接：工作负载异常：实例调度失败，进行查找。父主题：主流开源大模型基于Lite Cluster适配PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
部署推理服务 - AI开发平台ModelArts

部署推理服务非分离部署推理服务分离部署推理服务父主题：主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
部署推理服务 - AI开发平台ModelArts

部署推理服务非分离部署推理服务分离部署推理服务父主题：主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）

总条数： 2284

上一页
1
...
38
39
40
...
115
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SD3基于DevServer适配PyTorch NPU的训练指导（6.3.912） - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

OBS操作相关故障 - AI开发平台ModelArts

产品发布说明 - AI开发平台ModelArts

将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

发布ModelArts模型 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

报错“Host key verification failed.'或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

产品变更公告 - AI开发平台ModelArts

查询模型详情 - AI开发平台ModelArts

ModelArts控制台为什么能看到创建失败被删除的专属资源池？ - AI开发平台ModelArts

附录：工作负载Pod异常问题和解决方法 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线