搜索_华为云

保存ckpt时超时报错 - AI开发平台ModelArts

时，会发生超时的错误。图1 报错提示解决方法 1. 需要保证磁盘IO带宽正常，可以在36分钟内将文件保存到磁盘。单个节点内，最大只有60G（实际应该在40G以下）的文件内容，只要在36分钟内保存完成，就不会报超时错误。 2. 忽略该报错，因为报错不影响实际报错的权重。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 常见错误原因和解决方法
保存ckpt时超时报错 - AI开发平台ModelArts

时，会发生超时的错误。图1 报错提示解决方法 1. 需要保证磁盘IO带宽正常，可以在36分钟内将文件保存到磁盘。单个节点内，最大只有60G（实际应该在40G以下）的文件内容，只要在36分钟内保存完成，就不会报超时错误。 2. 忽略该报错，因为报错不影响实际报错的权重。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
在ModelArts中物体检测标注时能否自定义标签？ - AI开发平台ModelArts

在ModelArts中物体检测标注时能否自定义标签？可以通过修改数据集给标签添加自定义属性来设置一些自定义的属性。图1 修改数据集父主题： Standard数据准备

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

image, retry later”，同时在“日志”页签中，无任何信息。图1 部署在线服务异常解决方法出现此问题现象，通常是因为您部署的模型过大导致的。解决方法如下：精简模型，重新导入模型和部署上线。购买专属资源池，在部署上线为在线服务时，使用专属资源池进行部署。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
动态扩充云硬盘EVS容量 - AI开发平台ModelArts

Notebook实例的存储配置采用的是云硬盘EVS。图1 创建Notebook实例时选择云硬盘EVS存储单次最大可以扩容100GB，扩容后的总容量不超过4096GB。云硬盘EVS存储容量最大支持4096GB，达到4096GB时，不允许再扩容。实例停止后，扩容后的容量仍然有效。计

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

原因分析自定义镜像导入不支持配置运行时依赖，系统不会自动安装所需要的pip依赖包。处理方法重新构建镜像。在构建镜像的dockerfile文件中安装pip依赖包，例如安装Flask依赖包。 # 配置华为云的源，安装 python、python3-pip 和 Flask RUN

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
删除算法 - AI开发平台ModelArts
删除算法 - AI开发平台ModelArts

提供SDK代码示例调试功能。 URI DELETE /v2/{project_id}/algorithms/{algorithm_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 algorithm_id

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
删除数据集 - AI开发平台ModelArts

删除数据集，但不删除数据集的源数据。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE /v2/{project_id}/datasets/{dataset_id} 表1 路径参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Lite Cluster资源管理介绍 - AI开发平台ModelArts

后，由于用户AI开发业务的变化，对于资源池资源量的需求可能会产生变化，面对这种场景，ModelArts提供了扩缩容功能，用户可以根据自己的需求动态调整。升级Lite Cluster资源池驱动：当资源池中的节点含有GPU/Ascend资源时，用户基于自己的业务，可能会有自定义GP

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
在ModelArts中使用自定义镜像创建在线服务，如何修改端口？ - AI开发平台ModelArts

在ModelArts中使用自定义镜像创建在线服务，如何修改端口？当模型配置文件中定义了具体的端口号，例如：8443，创建模型没有配置端口，或者配置了其他端口号，均会导致服务部署失败。您需要把模型中的端口号配置为8443，才能保证服务部署成功。修改默认端口号，具体操作如下：登录Mo

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
准备数据（可选） - AI开发平台ModelArts

o.json文件中添加数据集描述。关于数据集文件的格式及配置，请参考data/README_zh.md的内容。可以使用HuggingFace/ModelScope上的数据集或加载本地数据集。上传自定义数据到指定目录将下载的原始数据存放在{work_dir}/llm_trai

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 准备工作
在VS Code中上传下载文件 - AI开发平台ModelArts

然后参考文件传输进行OBS传输操作。下载Notebook中的文件至本地在Notebook中开发的文件，可以下载至本地。在本地IDE的Project目录下的Notebook2.0工程单击右键，单击“Download...”将文件下载到本地。图2 VS Code环境下载Notebook中的文件至本地父主题：通过VS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
导入模型提示该账号受限或者没有操作权限 - AI开发平台ModelArts

导入模型账号欠费导致被冻结；导入模型账号没有对应工作空间的权限；导入模型账号为子账号，主账号没有给子账号赋予模型相关权限。权限说明请参见：策略及授权项说明；处理方法确认是账号欠费冻结，补交对应欠费，等待账号解冻即可；如果是导入模型没有对应的工作权限，可以参考创建自定义策略对相应账号赋予导入模型相关权限。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像构建容器镜像并调试镜像构建及调试与单机单卡相同。具体操作，请参考线下容器镜像构建及调试。上传镜像请参考单机单卡训练的上传镜像章节操作。父主题：单机多卡

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
线下容器镜像构建及调试 - AI开发平台ModelArts

线下容器镜像构建及调试构建容器镜像并调试镜像构建及调试与单机单卡相同。具体操作，请参考线下容器镜像构建及调试。上传镜像请参考单机单卡训练的上传镜像章节操作。父主题：多机多卡

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
删除Workflow Execution - AI开发平台ModelArts

cutions/{execution_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。 execution_id 是 String

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
昇腾云服务6.3.904版本说明 - AI开发平台ModelArts

昇腾云服务6.3.904版本说明昇腾云服务6.3.904版本发布支持的软件包和能力说明如下，软件包获取路径：Support-E网站。发布包软件包特性说明配套说明备注昇腾云模型代码三方大模型，包名：AscendCloud-3rdLLM PyTorch框架下支持如下模型训练：

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

Found secret key 原因分析这是TensorFlow-1.8中会出现的情况，该日志是Info级别的，并不是错误信息，可以通过设置环境变量来屏蔽INFO级别的日志信息。环境变量的设置一定要在import tensorflow或者import moxing之前。处理方法

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

than windows。原因分析该报错说明预测使用的数据行数小于window超参值。在使用订阅算法时序预测-time_series_v2训练时，超参：window设置为60。训练完成并创建模型后，部署在线服务，进行预测，当预测的数据行数小于window超参值时，日志中有报错信息：ERROR:

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
日志提示"write line error" - AI开发平台ModelArts

error”。并且问题是必现问题，每次运行到同一地方的时候，出现错误。原因分析出现该问题的可能原因如下：程序运行过程中，产生了core文件，core文件占满了"/"根目录空间。本地数据、文件保存将"/cache"目录3.5T空间用完了。云上训练磁盘空间一般指如下两个目录的磁盘空间： “/”根目录，是docker中配置项“base

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障

总条数： 2382

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

保存ckpt时超时报错 - AI开发平台ModelArts

保存ckpt时超时报错 - AI开发平台ModelArts

在ModelArts中物体检测标注时能否自定义标签？ - AI开发平台ModelArts

自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

动态扩充云硬盘EVS容量 - AI开发平台ModelArts

自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

删除算法 - AI开发平台ModelArts

删除数据集 - AI开发平台ModelArts

Lite Cluster资源管理介绍 - AI开发平台ModelArts

在ModelArts中使用自定义镜像创建在线服务，如何修改端口？ - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

在VS Code中上传下载文件 - AI开发平台ModelArts

导入模型提示该账号受限或者没有操作权限 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

删除Workflow Execution - AI开发平台ModelArts

昇腾云服务6.3.904版本说明 - AI开发平台ModelArts

TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

日志提示"write line error" - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线