搜索_华为云

升级Standard专属资源池驱动 - AI开发平台ModelArts

交工单联系华为工程师开启节点绑定。驱动升级操作登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池 > 弹性集群Cluster”，进入“Standard资源池”页面。在资源池列表中，选择需要进行驱动升级的资源池，在右侧的操作列，单击“ > 驱动升级”。在“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
查询团队标注任务详情 - AI开发平台ModelArts

CheckTaskStats object 历史验收任务汇总后的验收报告。表5 CheckTaskStats 参数参数类型描述 accepted_sample_count Integer 通过的样本数目。 checked_sample_count Integer 已验收的样本数目。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

|── alpaca_gpt4_data.json # 微调数据文件在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作
使用VS Code创建并调试训练作业 - AI开发平台ModelArts

待左侧导航出现图标，表示插件安装完成。图1 安装VS Code插件创建训练作业单击左侧导航的图标，单击“登录”进入登录页面，输入对应的登录信息。单击“获取AccessKey”即可跳转到AK/SK获取教程页面。图2 登录VS Code插件登录后，VS Code自动同步ModelArts中的训练作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
查询算法列表 - AI开发平台ModelArts

查询算法列表功能介绍查询算法列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/algorithms 表1 路径参数

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
删除资源池 - AI开发平台ModelArts

资源池的驱动信息。 controlMode Integer 资源池的受限状态。可选值如下： 0：代表不受限 1：转包周期受限 2：规格变更受限 4：服务受限 8：冻结 16：公安冻结（不可退订）另外状态是可以叠加的，比如9代表转包周期受限+冻结状态。表8 resources 参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
ModelArts中提示OBS路径错误 - AI开发平台ModelArts

py”结尾，会提示非法的OBS路径。图2 查看训练作业的代码目录和启动文件如果还不能解决问题，请参考案例已配置OBS权限，仍然无法访问OBS（403 AccessDenied）进行进一步排查。父主题：通用问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
释放Lite Server资源 - AI开发平台ModelArts

鼠标移动至节点名称上，复制需要退订的实例ID。图3 复制实例ID Server购买订单里绑定的资源ID为Server ID，与Server产品所封装的BMS/ECS ID不同，若要退订Server，需要在ModelArts控制台的“资源管理 > AI专属资源池 > 弹性节点Server”中查询对应ID。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
创建节点池 - AI开发平台ModelArts

objects 支持给创建出来的节点加taints来设置反亲和性，非特权池不能指定。 labels 否 Map<String,String> k8s标签，格式为key/value键值对。 tags 否 Array of UserTag objects 资源标签，非特权池不能指定。 network

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

|── alpaca_gpt4_data.json # 微调数据文件在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

|── alpaca_gpt4_data.json # 微调数据文件在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作
查询资源池 - AI开发平台ModelArts

资源池的驱动信息。 controlMode Integer 资源池的受限状态。可选值如下： 0：代表不受限 1：转包周期受限 2：规格变更受限 4：服务受限 8：冻结 16：公安冻结（不可退订）另外状态是可以叠加的，比如9代表转包周期受限+冻结状态。表8 resources 参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
批量更新团队标注样本的标签 - AI开发平台ModelArts

操作失败的错误信息。 results Array of BatchResponse objects 批量更新样本标签的响应结果列表。 success Boolean 操作是否执行成功。可选值如下： true：执行成功 false：执行失败表8 BatchResponse 参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询资源池列表，可通过标签、资源池状态筛选查询资源池列表 - AI开发平台ModelArts

资源池的驱动信息。 controlMode Integer 资源池的受限状态。可选值如下： 0：代表不受限 1：转包周期受限 2：规格变更受限 4：服务受限 8：冻结 16：公安冻结（不可退订）另外状态是可以叠加的，比如9代表转包周期受限+冻结状态。表9 resources 参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
附录：训练常见问题 - AI开发平台ModelArts

e调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Deepspeed-ZeRO-1替换为Deepspeed-ZeRO-2以此类推，重新训练如未解决则执行下一步。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
扩缩容Standard专属资源池 - AI开发平台ModelArts

对已有规格增减目标总实例数修改容器引擎空间大小登录ModelArts管理控制台，在左侧菜单栏中选择“AI专属资源池 > 弹性集群Cluster”，进入“Standard资源池”页签，查看资源池列表。在旧版资源池迁移到新版资源池的过程中，资源池状态显示为“受限”。此时，资源池无法进行扩缩容和退订。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
附录：训练常见问题 - AI开发平台ModelArts

e调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-ZeRO-1，Deepspeed-ZeRO-1替换为Deepspeed-ZeRO-2以此类推，重新训练如未解决则执行下一步。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
批量更新样本标签 - AI开发平台ModelArts

操作失败的错误信息。 results Array of BatchResponse objects 批量更新样本标签的响应结果列表。 success Boolean 操作是否执行成功。可选值如下： true：执行成功 false：执行失败表8 BatchResponse 参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
配置仪表盘查看指标数据 - AI开发平台ModelArts

cn-north-4.myhuaweicloud.com/metrics/grafana/dashboards/ModelArts-Cluster-View.json 节点视图 https://cnnorth4-modelarts-sdk.obs.cn-north-4.myhuaweicloud

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
查询Workflow Execution - AI开发平台ModelArts

dataset：数据集 obs：OBS swr：SWR model_list：AI应用列表 label_task：标注任务 service：在线服务 conditions Array of Constraint objects 数据约束条件。 value Map<String,Object>

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理

总条数： 1643

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

升级Standard专属资源池驱动 - AI开发平台ModelArts

查询团队标注任务详情 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

使用VS Code创建并调试训练作业 - AI开发平台ModelArts

查询算法列表 - AI开发平台ModelArts

删除资源池 - AI开发平台ModelArts

ModelArts中提示OBS路径错误 - AI开发平台ModelArts

释放Lite Server资源 - AI开发平台ModelArts

创建节点池 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

查询资源池 - AI开发平台ModelArts

批量更新团队标注样本的标签 - AI开发平台ModelArts

查询资源池列表，可通过标签、资源池状态筛选查询资源池列表 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

扩缩容Standard专属资源池 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

批量更新样本标签 - AI开发平台ModelArts

配置仪表盘查看指标数据 - AI开发平台ModelArts

查询Workflow Execution - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线