搜索_华为云

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

Cluster监控指标。 AOM上查看已有监控指标登录控制台，搜索AOM，进入“应用运维管理 AOM”控制台。单击“监控 > 指标浏览”，进入“指标浏览”“页面”，单击“添加指标查询”。图1 示例图片添加指标查询信息。图2 示例图片添加方式：选择“按指标维度添加”。指标名称：在右侧下拉框

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
查询训练作业指定任务的日志（预览） - AI开发平台ModelArts

s/{task_id}/logs/preview 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
精度问题概述 - AI开发平台ModelArts

为了更好地了解这种计算差异，并且能够正确区分正常计算差异和引起模型精度问题的异常差异，本指南提供了算子问题定位工具集详细的使用场景和使用步骤，方便用户自行或在支持下排查可能的数值计算精度问题。当用户将大语言模型或者其他类型深度神经网络的训练从GPU迁移到昇腾AI处理器时，可能出现以下不同现象的模型精度问题。一般包括：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
删除数据处理任务的版本 - AI开发平台ModelArts

d}/versions/{version_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 task_id 是 String 数据处理任务ID。 version_id 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
停止智能任务 - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 task_id 是 String 任务ID。请求参数无响应参数无请求示例停止智能标注或自动分组任务

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建AI应用 - AI开发平台ModelArts

project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
查询模型详情 - AI开发平台ModelArts

model_version String 模型版本。 tenant String 租户。 project String 项目。 owner String 用户。 create_at Long 模型创建时间，距'1970.1.1 0:0:0 UTC'的毫秒数。 source_location String

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
查询OS的配额 - AI开发平台ModelArts

GET /v1/{project_id}/quotas 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 quotas

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
创建标注团队的成员 - AI开发平台ModelArts

s/{workforce_id}/workers 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_id 是 String 标注团队ID。请求参数表2 请求Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建标注团队 - AI开发平台ModelArts

/v2/{project_id}/workforces 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 description 否

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建ModelArts委托 - AI开发平台ModelArts

POST /v2/{project_id}/agency 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 agency_name_suffix

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
查询团队标注任务成员的进度信息 - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_task_id 是 String 团队标注任务ID。请求参数无响应参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
删除标注团队 - AI开发平台ModelArts

/v2/{project_id}/workforces/{workforce_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_id 是 String 标注团队ID。请求参数无响应参数状态码：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

范围。当前针对常见的开源LLM/AIGC等领域的开源模型，ModelArts已经提供了迁移好的开箱即用模型，且保证了较优的精度和性能。如果用户业务同样使用这些开源模型，建议直接使用ModelArts提供的模型运行指导，其余场景再考虑使用本指导自行迁移和调优。迁移流程模型迁移主

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
训练的数据集预处理说明 - AI开发平台ModelArts

_filter方法，然后在数据预处理的参数里指定自己的handler名称即可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以 llama2 为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
获取超参敏感度分析结果 - AI开发平台ModelArts

earch-parameter-analysis 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
获取Execution列表 - AI开发平台ModelArts

{workflow_id}/executions 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。表2 Query参数参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
创建训练作业标签 - AI开发平台ModelArts

ning_job_id}/tags/create 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询数据集同步任务的状态 - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 add_sample_count

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
断点续训和故障快恢说明 - AI开发平台ModelArts

示例，latest_checkpointed_iteration.txt文件内容：20 同时开启故障快恢和断点续训时需满足以下条件：如果用户指定${user_converted_ckpt_path} 因故障快恢读取权重的优先级最高则训练过程的权重保存路径${output_dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法 > 工作负载Pod异常 > 训练脚本说明

总条数： 1423

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

查询训练作业指定任务的日志（预览） - AI开发平台ModelArts

精度问题概述 - AI开发平台ModelArts

删除数据处理任务的版本 - AI开发平台ModelArts

停止智能任务 - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

查询模型详情 - AI开发平台ModelArts

查询OS的配额 - AI开发平台ModelArts

创建标注团队的成员 - AI开发平台ModelArts

创建标注团队 - AI开发平台ModelArts

创建ModelArts委托 - AI开发平台ModelArts

查询团队标注任务成员的进度信息 - AI开发平台ModelArts

删除标注团队 - AI开发平台ModelArts

训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

获取超参敏感度分析结果 - AI开发平台ModelArts

获取Execution列表 - AI开发平台ModelArts

创建训练作业标签 - AI开发平台ModelArts

查询数据集同步任务的状态 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线