搜索_华为云

使用ModelArts Standard部署模型并推理预测 - AI开发平台ModelArts

使用ModelArts Standard部署模型并推理预测推理部署使用场景创建模型创建模型规范参考将模型部署为实时推理作业将模型部署为批量推理服务管理ModelArts模型管理同步在线服务管理批量推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
保存ckpt时超时报错 - AI开发平台ModelArts

而其他节点会一直在等待通信。当等待时间超过36分钟时，会发生超时的错误。图1 报错提示解决方法 1. 需要保证磁盘IO带宽正常，可以在36分钟内将文件保存到磁盘。单个节点内，最大只有60G（实际应该在40G以下）的文件内容，只要在36分钟内保存完成，就不会报超时错误。 2.

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） > 常见错误原因和解决方法
保存ckpt时超时报错 - AI开发平台ModelArts

而其他节点会一直在等待通信。当等待时间超过36分钟时，会发生超时的错误。图1 报错提示解决方法 1. 需要保证磁盘IO带宽正常，可以在36分钟内将文件保存到磁盘。单个节点内，最大只有60G（实际应该在40G以下）的文件内容，只要在36分钟内保存完成，就不会报超时错误。 2.

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910） > 常见错误原因和解决方法
保存ckpt时超时报错 - AI开发平台ModelArts

而其他节点会一直在等待通信。当等待时间超过36分钟时，会发生超时的错误。图1 报错提示解决方法 1. 需要保证磁盘IO带宽正常，可以在36分钟内将文件保存到磁盘。单个节点内，最大只有60G（实际应该在40G以下）的文件内容，只要在36分钟内保存完成，就不会报超时错误。 2.

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 常见错误原因和解决方法
管理ModelArts模型 - AI开发平台ModelArts

查看ModelArts模型事件管理ModelArts模型版本发布ModelArts模型父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
创建模型 - AI开发平台ModelArts
创建模型 - AI开发平台ModelArts

创建模型不同方式的场景介绍从训练作业中导入模型文件创建模型从OBS中导入模型文件创建模型从容器镜像中导入模型文件创建模型从AI Gallery订阅模型父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
Lite Cluster资源开通 - AI开发平台ModelArts

和“总数”值大于0时，资源池才能下发任务。可以将鼠标放在“创建中”字样上，查看当前创建过程详情。若单击查看详情，可跳转到“操作记录”中。可以在Lite资源池列表右上角的“操作记录”中查看资源池的任务记录。图9 操作记录图10 查看操作记录当资源池创建成功后，资源池的状态

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
基于ModelArts Standard运行GPU训练任务 - AI开发平台ModelArts

基于ModelArts Standard运行GPU训练任务在ModelArts Standard上运行GPU训练任务的场景介绍在ModelArts Standard运行GPU训练任务的准备工作在ModelArts Standard上运行GPU单机单卡训练任务在ModelArts Standard上运行GPU单机多卡训练任务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
Notebook中无法打开“checkpoints”文件夹 - AI开发平台ModelArts

points里的数据移动到新的文件夹下。图1 JupyterLab浏览器左侧导航无法打开checkpoints 操作步骤：打开Terminal，用命令行进行操作。方法一：执行cd checkpoints命令打开checkpoints文件夹。方法二：新建一个文件夹，移动ch

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 其他故障
日志提示“No space left on device” - AI开发平台ModelArts

left on device” 问题现象训练过程中复制数据/代码/模型时出现如下报错：图1 错误日志原因分析出现该问题的可能原因如下。磁盘空间不足。分布式作业时，有些节点的docker base size配置未生效，容器内“/”根目录空间未达到50G，只有默认的10GB，导致作业训练失败。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
约束与限制 - AI开发平台ModelArts

Standard推理部署在线服务单个账号最多可创建20个在线服务。是提交工单申请提升配额更多信息，请参见部署在线服务。 Standard推理部署批量服务单个账号最多可创建1000个批量服务。否更多信息，请参见部署批量服务。 Standard推理部署边缘服务单个账号最多可创建1000个边缘服务。

帮助中心 > AI开发平台ModelArts > 产品介绍
作为调用发起方的客户端无法访问已经获取到的推理请求地址 - AI开发平台ModelArts

调用发起方的客户端和华为云网络不通。处理方法如果客户端位于华为云网络之外，保证客户端所处的网络环境可以连接Internet；如果客户端位于华为云网络内，默认的网络配置即可以访问通这个地址，避免设置特殊的网络配置，例如防火墙规则等。建议与总结无父主题：在线服务

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
管理批量推理作业 - AI开发平台ModelArts

管理批量推理作业查看批量服务详情查看批量服务的事件管理批量服务生命周期修改批量服务配置父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
管理同步在线服务 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标集成在线服务API至生产环境中应用设置在线服务故障自动重启父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
创建模型规范参考 - AI开发平台ModelArts

模型配置文件编写说明模型推理代码编写说明自定义引擎创建模型规范自定义脚本代码示例父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
创建Notebook实例 - AI开发平台ModelArts

Notebook删除后，此权限策略不会被删除。对象存储服务OBS 说明： OBS对象存储为白名单功能，如需使用，请联系华为技术支持开通。仅支持挂载同一区域下的OBS对象存储。在开发环境中做大规模的数据上传下载时，可以通过OBS桶做中转。存储成本低，吞吐量大，但是小文件读写

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
下载或读取文件报错，提示超时、无剩余空间 - AI开发平台ModelArts

下载或读取文件报错，提示超时、无剩余空间问题现象训练过程中复制数据/代码/模型时出现如下报错：图1 错误日志原因分析出现该问题的可能原因如下。磁盘空间不足。分布式作业时，有些节点的docker base size配置未生效，容器内“/”根目录空间未达到50GB，只有默认的10GB，导致作业训练失败。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
使用CES监控Lite Server资源 - AI开发平台ModelArts

复位SOC可能中断客户业务 NPU: 需要退出AI任务重新执行 RestartAIProcess 提示当前故障很可能需要客户退出当前的AI任务并尝试重新执行在收集必要信息后，尝试退出当前AI任务并尝试重新执行退出当前AI任务以便重新执行 NPU: errorcode告警 NPUErrorCodeWarning

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
服务管理 - AI开发平台ModelArts
服务管理 - AI开发平台ModelArts

服务管理服务管理概述在开发环境中部署本地服务进行调试部署在线服务查询服务详情推理服务测试查询服务列表查询服务对象列表更新服务配置查询服务监控信息查询服务日志删除服务

 帮助中心 > AI开发平台ModelArts > SDK参考
通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。操作步骤 VPC访问通道访问在线服务操作步骤如下：获取ModelArts终端节点服务地址购买连接ModelArts终端节点创建DNS内网域名 VPC访问在线服务提交工单，提供账号ID给华为云技术支持，用于获取ModelArts终端节点服务地址。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道

总条数： 1973

上一页
1
...
4
5
6
...
99
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用ModelArts Standard部署模型并推理预测 - AI开发平台ModelArts

保存ckpt时超时报错 - AI开发平台ModelArts

保存ckpt时超时报错 - AI开发平台ModelArts

保存ckpt时超时报错 - AI开发平台ModelArts

管理ModelArts模型 - AI开发平台ModelArts

创建模型 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

基于ModelArts Standard运行GPU训练任务 - AI开发平台ModelArts

Notebook中无法打开“checkpoints”文件夹 - AI开发平台ModelArts

日志提示“No space left on device” - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

作为调用发起方的客户端无法访问已经获取到的推理请求地址 - AI开发平台ModelArts

管理批量推理作业 - AI开发平台ModelArts

管理同步在线服务 - AI开发平台ModelArts

创建模型规范参考 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

下载或读取文件报错，提示超时、无剩余空间 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

服务管理 - AI开发平台ModelArts

通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线