搜索_华为云

批量删除样本 - AI开发平台ModelArts

参数类型描述 error_code String 操作失败的错误码。 error_msg String 操作失败的错误信息。 results Array of BatchResponse objects 批量删除样本的响应列表。 success Boolean 操作是否执行成功。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练作业进程被kill - AI开发平台ModelArts

在开发环境（notebook）申请相同规格的开发环境实例。在notebook调试用户代码，并找出问题的代码段。通过关键代码段 + 退出码尝试去搜索引擎寻找解决办法。，通过训练日志排查问题通过日志判断出问题的代码范围。修改代码，在问题代码段添加打印，输出更详细的日志信息。再次运行作业，判断出问题的代码段。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
按标签名称更新单个标签 - AI开发平台ModelArts

@modelarts:color 否 String 内置属性：标签展示的颜色，为色彩的16进制代码，默认为空。例如：“#FFFFF0”。 @modelarts:default_shape 否 String 内置属性：物体检测标签的默认形状（物体检测标签专用属性），默认为空。可选值如下： bndbox：矩形。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
执行训练任务 - AI开发平台ModelArts

必须修改。用于指定模板。如果设置为"qwen"，则使用Qwen模板进行训练，模板选择可参照表1中的template列 output_dir /home/ma-user/ws/Qwen2-72B/sft-4096 必须修改。指定输出目录。训练过程中生成的模型参数和日志文件将保存在这个目录下。用户根据自己实际要求适配。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
ECS获取基础镜像 - AI开发平台ModelArts

docker 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4.ip_forward 如果net.ipv4.ip_forward配置项的值不为1，执行以下命令配置IP转发。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
获取训练作业事件列表 - AI开发平台ModelArts

结束时间，需要与开始时间一起传入。 level 否 String 指定返回的事件级别，取值范围[Info Error Warning]。 pattern 否 String 指定事件信息包含的内容，最长256个字符。 source 否 String 指定返回的事件来源，取值范围为[K8S Job Task]。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询数据集标签列表 - AI开发平台ModelArts

@modelarts:color String 内置属性：标签展示的颜色，为色彩的16进制代码，默认为空。例如：“#FFFFF0”。 @modelarts:default_shape String 内置属性：物体检测标签的默认形状（物体检测标签专用属性），默认为空。可选值如下： bndbox：矩形。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询训练作业镜像保存任务 - AI开发平台ModelArts

可以基于保存的镜像创建训练作业。 message String 镜像创建的时间，UTC毫秒。 create_time Long 镜像保存操作过程中，展示构建信息。请求示例如下以查询uuid为2cd88daa-31a4-40a8-a58f-d186b0e93e4f的训练作业对应worker-0镜像保存任务为例。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
停止训练作业版本 - AI开发平台ModelArts

error_message String 调用失败时的错误信息。调用成功时无此字段。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。请求示例如下以停止“job_id”为10，“version_id”为10的作业版本为例。 POST htt

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

750 /home/ma-user 排查密钥是否是和实例绑定的一致。停止实例，进入实例详情页。更新密钥：单击“认证”旁边的编辑按钮，然后单击“立即创建”创建并选择新密钥。重新使用VS Code连接实例，选择新创建的密钥。父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
执行训练任务 - AI开发平台ModelArts

必须修改。用于指定模板。如果设置为"qwen"，则使用Qwen模板进行训练，模板选择可参照表1中的template列 output_dir /home/ma-user/ws/Qwen2-72B/sft-4096 必须修改。指定输出目录。训练过程中生成的模型参数和日志文件将保存在这个目录下。用户根据自己实际要求适配。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
执行训练任务 - AI开发平台ModelArts

必须修改。用于指定模板。如果设置为"qwen"，则使用Qwen模板进行训练，模板选择可参照表1中的template列 output_dir /home/ma-user/ws/Qwen2-72B/sft-4096 必须修改。指定输出目录。训练过程中生成的模型参数和日志文件将保存在这个目录下。用户根据自己实际要求适配。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
调优数据集异常日志说明 - AI开发平台ModelArts

like ["conversation_id", "text"]. 对于csv、xlsx文件，平台会根据训练类型的不同，将其转为Alpaca格式或MOSS格式，选择预期的数据类型无效。父主题： Studio

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
删除训练作业标签 - AI开发平台ModelArts

TmsTagForDelete objects 要删除的标签列表。表3 TmsTagForDelete 参数是否必选参数类型描述 key 是 String TMS标签的key。 value 否 String TMS标签的value，非必填。响应参数无请求示例 DELETE

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
指令监督微调训练任务 - AI开发平台ModelArts

指定每个设备的训练批次大小 gradient_accumulation_steps 8 指定梯度累积的步数，这可以增加批次大小而不增加内存消耗。可根据自己要求适配 num_train_epochs 5 表示训练轮次，根据实际需要修改。一个Epoch是将所有训练样本训练一次的过程。可根据自己要求适配

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907）
更新训练作业描述 - AI开发平台ModelArts

description 否 String 对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。响应参数无请求示例如下以修改uuid为3faf5c03-aaa1-4cbe-879d-24b05d997347的训练作业为例。修改成功后再调用查询训练作业接口即可看到description已被修改。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
删除可视化作业 - AI开发平台ModelArts

请求是否成功。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。 error_message String 调用失败时的错误信息。调用成功时无此字段。请求示例如下以删除作业ID为10的可视化作业为例。 DELETE https://en

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
重启可视化作业 - AI开发平台ModelArts

请求是否成功。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。 error_message String 调用失败时的错误信息。调用成功时无此字段。请求示例如下以重启作业ID为10的可视化作业为例。 POST https://e

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
删除训练作业 - AI开发平台ModelArts

job_id 是 Long 训练作业的ID。请求消息无请求参数。响应消息响应参数如表2所示。表2 响应参数参数参数类型说明 is_success Boolean 请求是否成功。 error_message String 调用失败时的错误信息。调用成功时无此字段。 error_code

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

rt_rcv_data) res=$(($y-$x)) echo $res 上述获取的值*4/300 ，即为当前网卡的接收速率，单位Byte/s。方法2：使用ib_write_bw测试RDMA的读写处理确定带宽服务器A：服务端从mlx4_0网卡接收数据 ib_write_bw

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server

总条数： 2607

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

批量删除样本 - AI开发平台ModelArts

训练作业进程被kill - AI开发平台ModelArts

按标签名称更新单个标签 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

ECS获取基础镜像 - AI开发平台ModelArts

获取训练作业事件列表 - AI开发平台ModelArts

查询数据集标签列表 - AI开发平台ModelArts

查询训练作业镜像保存任务 - AI开发平台ModelArts

停止训练作业版本 - AI开发平台ModelArts

报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

调优数据集异常日志说明 - AI开发平台ModelArts

删除训练作业标签 - AI开发平台ModelArts

指令监督微调训练任务 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

删除可视化作业 - AI开发平台ModelArts

重启可视化作业 - AI开发平台ModelArts

删除训练作业 - AI开发平台ModelArts

GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线