搜索_华为云

批量重启节点 - AI开发平台ModelArts

nodes/batch-reboot 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。请求参数表2 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
Yaml配置文件参数配置说明 - AI开发平台ModelArts

RO内存优化等高级特性，以提高训练效率和性能 stage sft 表示当前的训练阶段。可选择值：sft、rm、ppo、dpo。 sft代表指令监督微调； rm代表奖励模型训练； ppo代表PPO训练； dpo代表DPO训练。 finetuning_type full 用于指定微调策略类型，可选择值full、lora。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
multi-step - AI开发平台ModelArts
multi-step - AI开发平台ModelArts

启动推理服务时，使用multi-step调度需要配置的参数如下表所示。表1 开启multi-step调度参数配置服务启动方式配置项取值类型配置说明 offline num_scheduler_steps int 连续运行模型的步数。默认为1，推荐设置为8 offline

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
上传文件夹至OBS - AI开发平台ModelArts

本地需要上传的文件夹路径。当上传的文件夹下内容为空或者该文件夹下包含多个文件夹且有文件夹下内容有空时，OBS对应路径下不产生该空文件夹。 dst_obs_dir 是 String 上传的目标OBS桶地址，必须以“obs://”作为前缀，上传的目标文件夹后缀必须以“/”结尾。表2 失败响应参数说明

 帮助中心 > AI开发平台ModelArts > SDK参考 > OBS管理
BF16和FP16说明 - AI开发平台ModelArts

速计算并减少内存的占用，对模型准确性的影响在大多数情况下较小。与BF16相比在处理非常大或非常小的数值时遇到困难，导致数值的精度损失。综上所述，BF16因其与FP32相似的数值范围和稳定性，在大模型训练中提供了优势。而FP16则在计算效率和内存使用方面有其独特的优点，但可能在数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
BF16和FP16说明 - AI开发平台ModelArts

速计算并减少内存的占用，对模型准确性的影响在大多数情况下较小。与BF16相比在处理非常大或非常小的数值时遇到困难，导致数值的精度损失。综上所述，BF16因其与FP32相似的数值范围和稳定性，在大模型训练中提供了优势。而FP16则在计算效率和内存使用方面有其独特的优点，但可能在数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
创建标注任务 - AI开发平台ModelArts

description="label task") 参数说明表1 请求参数参数是否必选参数类型描述 task_name 是 String 标注任务的名称。 task_type 是 Integer 标注任务的类型。可选值如下： 0：图像分类 1：物体检测 3: 图像分割 100：文本分类

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 标注任务管理
删除服务 - AI开发平台ModelArts
删除服务 - AI开发平台ModelArts

删除模型服务，仅可删除本人名下的服务。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE /v1/{project_id}/services/{service_id} 表1 路径参数

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
获取Workflow工作流节点度量信息 - AI开发平台ModelArts

是 String 工作流的一次执行中一个节点的执行ID。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 [数组元素] Array of WorkflowStepMetric objects 工作流节点度量信息。表3 WorkflowStepMetric

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
AI Gallery功能介绍 - AI开发平台ModelArts

Gallery提供了大量基于昇腾云底座适配的三方开源大模型，同步提供了可以快速体验模型的能力、极致的开发体验，助力开发者快速了解并学习大模型。构建零门槛线上模型体验，零基础开发者开箱即用，初学者三行代码使用所有模型通过AI Gallery的模型在线模型体验，可以实现模型服务的即时可用性，开发者无需

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
设置断点续训练 - AI开发平台ModelArts

卡死等）导致训练作业还未完成就被中断，下一次训练可以在上一次的训练基础上继续进行。这种方式对于需要长时间训练的模型而言比较友好。断点续训练是通过checkpoint机制实现。 checkpoint的机制是：在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

ok，来修复实例崩溃的问题。此时只是解决了崩溃问题，如果重新运行训练代码仍将失败。如果您需要解决“内存不够”的问题，建议您创建一个新的Notebook，使用更高规格的资源池，比如专属资源池来运行此训练代码。已经创建成功的Notebook不支持选用更高规格的资源规格进行扩容。父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
数据管理计费项 - AI开发平台ModelArts

创建数据清洗、数据校验、数据选择和数据增强的数据处理任务时，不收费。但是存储到OBS中的数据会收取费用。具体内容如表1所示。表1 存储计费项计费项计费项说明适用的计费模式计费公式存储资源对象存储OBS 用于存储训练和推理的输入数据和输出结果数据。具体费用可参见对象存储价格详情。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
Yaml配置文件参数配置说明 - AI开发平台ModelArts

eRO内存优化等高级特性，以提高训练效率和性能 stage sft 表示当前的训练阶段。可选择值：【sft、rm、ppo、dpo】 sft代表监督微调； rm代表奖励模型训练； ppo代表PPO训练； dpo代表DPO训练。 finetuning_type full 用于指定微调策略类型，可选择值full、lora。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
推理服务测试 - AI开发平台ModelArts

"default_policy/eps:0" : "0.0" } path 否 String 服务内的推理路径，默认为"/"。表2 predict返回参数说明参数描述返回消息体输出的参数和值，平台只做转发，不做识别。父主题：服务管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
更新团队标注任务 - AI开发平台ModelArts

或指定团队自行分配。表3 WorkforcesConfig 参数是否必选参数类型描述 agency 否 String 管理员。 workforces 否 Array of WorkforceConfig objects 执行标注任务的团队列表。表4 WorkforceConfig

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
启动/停止/删除实例 - AI开发平台ModelArts

“/home/ma-user/work”目录以及动态挂载在“/data”下的目录下的数据会保存，其余目录下内容会被清理。例如：用户在开发环境中的其他目录下安装的外部依赖包等，在Notebook停止后会被清理。您可以通过保存镜像的方式保留开发环境设置，具体操作请参考保存Notebook实例。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
使用订阅算法训练结束后没有显示模型评估结果 - AI开发平台ModelArts

使用订阅算法训练结束后没有显示模型评估结果问题现象 AI Gallery中的YOLOv5算法，训练结束后没有显示模型评估结果。原因分析未标注的图片过多，导致没有模型评估结果。处理方法对所有训练数据进行标注。父主题：预置算法运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

准备资源创建专属资源池本文档中的模型运行环境是ModelArts Standard。资源规格需要使用专属资源池中的昇腾Snt9B资源，请参考创建资源池购买资源。推荐使用“西南-贵阳一”Region上的昇腾资源。创建OBS桶 ModelArts使用对象存储服务（Object

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

OBS”。原因分析复制数据慢的可能原因如下：直接从OBS上读数据会造成读数据变成训练的瓶颈，导致迭代缓慢。由于环境或网络问题，读OBS时遇到读取数据失败情况，从而导致整个作业失败。重复打印日志，该日志表示正在读取远端存在的文件，当文件列表读取完成以后，开始下载数据。如果文件比较多，那么该过程会消耗较长时间。

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing

总条数： 2388

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

批量重启节点 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

multi-step - AI开发平台ModelArts

上传文件夹至OBS - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

创建标注任务 - AI开发平台ModelArts

删除服务 - AI开发平台ModelArts

获取Workflow工作流节点度量信息 - AI开发平台ModelArts

AI Gallery功能介绍 - AI开发平台ModelArts

设置断点续训练 - AI开发平台ModelArts

运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

数据管理计费项 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

推理服务测试 - AI开发平台ModelArts

更新团队标注任务 - AI开发平台ModelArts

启动/停止/删除实例 - AI开发平台ModelArts

使用订阅算法训练结束后没有显示模型评估结果 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线