搜索_华为云

常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

触发条件和下面的因素有关：文件名越长，文件数量的上限越小。 blocksize越小，文件数量的上限越小。 blocksize系统默认为4096B，总共有三种大小：1024B、2048B、4096B。创建文件越快，越容易触发（机制大概是：有一个缓存，这块大小和上面的1和2有关，

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
Notebook使用场景 - AI开发平台ModelArts

ModelArts提供了云化版本的Notebook，无需关注安装配置，即开即用，具体参见创建Notebook实例。 ModelArts Notebook支持以下几种使用方式，用于开发基于PyTorch、TensorFlow和MindSpore等引擎的AI模型。支持通过Jupyte

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
Msprobe API预检 - AI开发平台ModelArts

Msprobe是MindStudio Training Tools工具链下精度调试部分的工具包，主要包括精度预检、溢出检测和精度比对等功能，目前适配PyTorch和MindSpore框架。这些子工具侧重不同的训练场景，可以定位模型训练中的精度问题。精度预检工具旨在计算单个API在整

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优 > Msprobe工具使用指导
查看训练作业详情 - AI开发平台ModelArts

导出前200行数据。在“训练作业”列表中，单击作业名称，进入训练作业详情页。在训练作业详情页的左侧，可以查看此次训练作业的基本信息和算法配置的相关信息。训练作业基本信息表1 训练作业基本信息参数说明 “作业ID” 训练作业唯一标识。 “作业状态” 训练作业状态。说明：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
通过patch操作对服务进行更新 - AI开发平台ModelArts

_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 service_id 是 String 服务ID。请求参数表2 请求Header参数参数是否必选参数类型描述 X-ModelArts-User-ID

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
自动续费 - AI开发平台ModelArts
自动续费 - AI开发平台ModelArts

自动续费的到期前7日自动扣款属于系统默认配置，您也可以根据需要修改此扣款日，如到期前6日、到期前5日等。更多关于自动续费的规则介绍请参见自动续费规则说明。前提条件请确认包年/包月专属资源池还未到期。在ModelArts控制台开通自动续费包年/包月的Standard专属资源池和弹性集群Lite

帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
查询算法详情 - AI开发平台ModelArts

_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 algorithm_id 是 String 算法ID。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
下载JupyterLab文件到本地 - AI开发平台ModelArts

# 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AK和HUAWEICLOUD_SDK_SK。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
日志提示"Permission denied" - AI开发平台ModelArts

在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：权限问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
扩缩容Lite Cluster资源池 - AI开发平台ModelArts

容器引擎是Kubernetes最重要的组件之一，负责管理镜像和容器的生命周期。Kubelet通过Container Runtime Interface (CRI) 与容器引擎交互，以管理镜像和容器。其中Containerd调用链更短，组件更少，更稳定，占用节点资源更少，Containerd和Docker差异对比请见容器引擎。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
附录：训练常见问题 - AI开发平台ModelArts

json文件中的“merges”时保存的是拆开的列表不是字符串，导致推理异常解决措施，以下两种方法任选其一：更新transformes和tokenizers版本 GLM4-9B模型，容器内执行以下步骤： pip install transformers==4.43.2 其它模型，容器内执行以下步骤：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
附录：训练常见问题 - AI开发平台ModelArts

json文件中的“merges”时保存的是拆开的列表不是字符串，导致推理异常解决措施，以下两种方法任选其一：更新transformes和tokenizers版本 GLM4-9B模型，容器内执行以下步骤： pip install transformers==4.43.2 其它模型，容器内执行以下步骤：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911）
构建条件节点控制分支执行 - AI开发平台ModelArts

model_step_1, model_step_2] ) 场景说明：job_step_1和job_step_2表示两个训练节点，并且均直接依赖于condition_step。condition_step通过参数配置决定后继节点的执行行为。执行情况分析：参数left_value默认值为Tr

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
查询算法列表 - AI开发平台ModelArts

thms 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 offset 否 Integer 查询算法的偏移量，最小为0。例如设置为1，则表示从第二条开始查。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

None 服务介绍 ModelArts产品产品介绍 03:19 了解什么是ModelArts ModelArts自动学习视频介绍 02:59 ModelArts自动学习简介 ModelArts CodeLab 视频介绍 04:16 ModelArts CodeLab介绍 JupyterLab

帮助中心 > AI开发平台ModelArts > 视频帮助
Standard资源池节点故障定位 - AI开发平台ModelArts

驱动升级 NPU升级。节点正在执行NPU驱动升级。 A200008 节点管理节点准入准入检测。节点正在进行节点准入检测，包括基本的节点配置检查和简单的业务验证。 A050933 节点管理容错Failover 当节点具有该污点时，会将节点上容错（Failover）业务迁移走。当

 帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
查看Notebook实例事件 - AI开发平台ModelArts

重要实例扩容完成（User %s updated storage size successfully）重要 UpdateKeyPair 配置实例密钥对（User %s updated the instance keypair to "{%s}"）重要更新实例密钥对（User

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

使用MoXing时，如何进行增量训练？在使用MoXing构建模型时，如果您对前一次训练结果不满意，可以在更改部分数据和标注信息后，进行增量训练。 “mox.run”添加增量训练参数在完成标注数据或数据集的修改后，您可以在“mox.run”中，修改“log_dir”参数，并新增

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
附录：大模型推理常见问题 - AI开发平台ModelArts

使用benchmark-tools访问推理服务时，输入输出的token和大于max_model_len，服务端返回报错Response payload is not completed，见图2。再次设置输入输出的token和小于max_model_len访问推理服务，服务端响应200，见图3。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911）
附录：大模型推理常见问题 - AI开发平台ModelArts

使用benchmark-tools访问推理服务时，输入输出的token和大于max_model_len，服务端返回报错Response payload is not completed，见图2。再次设置输入输出的token和小于max_model_len访问推理服务，服务端响应200，见图3。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）

总条数： 1490

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

Notebook使用场景 - AI开发平台ModelArts

Msprobe API预检 - AI开发平台ModelArts

查看训练作业详情 - AI开发平台ModelArts

通过patch操作对服务进行更新 - AI开发平台ModelArts

自动续费 - AI开发平台ModelArts

查询算法详情 - AI开发平台ModelArts

下载JupyterLab文件到本地 - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

构建条件节点控制分支执行 - AI开发平台ModelArts

查询算法列表 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

查看Notebook实例事件 - AI开发平台ModelArts

使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线