搜索_华为云

查看日志和性能 - AI开发平台ModelArts

参数查看表1。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。也可以使用可视化工具TrainingLogParser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910）
更新资源池 - AI开发平台ModelArts

空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 os.modelarts/name String 用户指定的pool名称。 os.modelarts/resource.id String 资源池的主资源id，通常提供给cbc使用。 os.modelarts/tenant

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

connect to endpoint 原因分析 OBS连接不稳定可能会出现报错，“Unable to connect to endpoint”。处理方法对于OBS连接不稳定的现象，通过增加代码来解决。您可以在代码最前面增加如下代码，让TensorFlow对ckpt和summary的读

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
日志提示“ValueError: label - AI开发平台ModelArts

3:'banana'} 原因分析训练集中的标签个数与验证集中的个数不一致，导致该错误发生。例如，训练集中的标签共有4个，验证集中的标签只有3个。处理方法请您保持数据中训练集和验证集的标签数量一致。父主题：预置算法运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
查询Workflow工作流 - AI开发平台ModelArts

描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求参数无响应参数状态码：200 表3 响应Body参数参数参数类型描述 name String

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询开发环境实例列表 - AI开发平台ModelArts

限制本次返回的结果数据条数，取值范围(0,∞)，默认值为“0”，返回全部。 workspace_id 否 String 工作空间id。未创建工作空间时取值默认值为0，存在创建并使用的工作空间，以实际取值为准。 show_self 否 string 只显示自己，默认值是True。 ai_project 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
查看日志和性能 - AI开发平台ModelArts

参数查看表1。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。也可以使用可视化工具TrainingLogParser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）
查看日志和性能 - AI开发平台ModelArts

参数查看表1。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。也可以使用可视化工具TrainingLogParser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911）
创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

选择的支持实例无效，请检查请求中信息的合法性。原因分析用户选择的训练规格资源和算法不匹配。例如：算法支持的是GPU规格，创建训练作业时选择了ASCEND规格的资源类型。处理方法查看算法代码中设置的训练资源规格。检查创建训练作业时所选的资源规格是否正确，重新创建训练作业选择正确的资源规格。父主题：云上迁移适配故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
创建数据集 - AI开发平台ModelArts

数据集输出位置，用于存放输出的标注信息等文件。格式为 “/桶名称/文件路径”，例如“/obs-bucket/flower/rose/”（使用目录作为路径）。不能直接使用桶作为路径。输出位置不能与输入位置相同或者是输入位置的子目录。长度限制：不少于3字符，不能超过700个字符。字符限制：

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
批量删除标签 - AI开发平台ModelArts

@modelarts:from_type 否 String 内置属性：三元组关系标签的起始实体类型，创建关系标签时必须指定，该参数仅文本三元组数据集使用。 @modelarts:rename_to 否 String 内置属性：重命名后的标签名。 @modelarts:shortcut 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
批量修改标签 - AI开发平台ModelArts

@modelarts:from_type 否 String 内置属性：三元组关系标签的起始实体类型，创建关系标签时必须指定，该参数仅文本三元组数据集使用。 @modelarts:rename_to 否 String 内置属性：重命名后的标签名。 @modelarts:shortcut 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建数据集标签 - AI开发平台ModelArts

@modelarts:from_type 否 String 内置属性：三元组关系标签的起始实体类型，创建关系标签时必须指定，该参数仅文本三元组数据集使用。 @modelarts:rename_to 否 String 内置属性：重命名后的标签名。 @modelarts:shortcut 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
手动部署推理服务 - AI开发平台ModelArts

时会与基础镜像冲突，导致基础镜像不可用。 driver及npu-smi需同时挂载至容器。不要将同一个NPU挂载给多个容器使用，会导致后续的容器无法正常使用NPU功能。 --name ${container_name}：容器名称，进入容器时会用到，此处可以自己定义一个容器名称。 {image_id}

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 > 部署推理服务
创建训练作业 - AI开发平台ModelArts

示例二：提交自定义镜像训练作业 Estimator中同时指定user_image_url和user_command，会提交自定义镜像训练作业，并使用自定义启动命令来启动训练任务。 from modelarts.session import Session from modelarts.train_params

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
日志提示“No module name 'unidecode'” - AI开发平台ModelArts

requirements.txt的Unidecode名字写错了，应该把U改成小写，所以导致训练作业的环境没有装上unidecode模块。处理方法将requirements.txt中的Unidecode改为unidecode。建议与总结您可以在训练代码里添加一行： os.system('pip

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
更新数据集 - AI开发平台ModelArts

@modelarts:from_type 否 String 内置属性：三元组关系标签的起始实体类型，创建关系标签时必须指定，该参数仅文本三元组数据集使用。 @modelarts:rename_to 否 String 内置属性：重命名后的标签名。 @modelarts:shortcut 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在ModelArts中数据标注完成后，标注结果存储在哪里？ - AI开发平台ModelArts

“数据集输出位置”，指在ModelArts完成数据标注后，执行数据集发布操作后，在此指定路径下，按数据集版本，生成相关目录。包含ModelArts中使用的Manifest文件（包含数据及标注信息）。详细文件说明可参见数据集发布后，相关文件的目录结构说明。查看步骤在ModelArts管理控制台，进入“数据管理>数据集”。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
查看日志和性能 - AI开发平台ModelArts

参数查看表1。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。也可以使用可视化工具TrainingLogParser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）
查看日志和性能 - AI开发平台ModelArts

参数查看表1。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。也可以使用可视化工具TrainingLogParser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910）

总条数： 2315

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看日志和性能 - AI开发平台ModelArts

更新资源池 - AI开发平台ModelArts

保存模型时出现Unable to connect to endpoint错误 - AI开发平台ModelArts

日志提示“ValueError: label - AI开发平台ModelArts

查询Workflow工作流 - AI开发平台ModelArts

查询开发环境实例列表 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

批量删除标签 - AI开发平台ModelArts

批量修改标签 - AI开发平台ModelArts

创建数据集标签 - AI开发平台ModelArts

手动部署推理服务 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

日志提示“No module name 'unidecode'” - AI开发平台ModelArts

更新数据集 - AI开发平台ModelArts

在ModelArts中数据标注完成后，标注结果存储在哪里？ - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线