搜索_华为云

重建、停止或删除训练作业 - AI开发平台ModelArts

订阅算法不支持另存为算法。重建训练作业当对创建的训练作业不满意时，您可以单击操作列的重建，重新创建训练作业。在重创训练作业页面，会自动填入上一次训练作业设置的参数，您仅需在原来的基础上进行修改即可重新创建训练作业。停止训练作业在训练作业列表中，针对“创建中”、“等待中”、“运行中”的训练作

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
Notebook Cache盘告警上报 - AI开发平台ModelArts

service_id:xxx，然后单击“确定”。监控对象设置完成后，选择“统计方式”和“统计周期”。 “告警条件设置”：触发条件根据实际需求设置。图1 监控对象指标设置图2 设置指标统计方式图3 告警条件设置设置告警通知，单击“立即创建”。 “告警方式”：选择“直接告警”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
图模式 - AI开发平台ModelArts
图模式 - AI开发平台ModelArts

16,32 # 设置动态分档的档位，根据实际情况设置，另外请不要设置档位1(DeepSeek V2 236B W8A8 模型建议最大设置4个档位) export VLLM_ENGINE_ITERATION_TIMEOUT_S=1500 # 设置vllm请求超时时间(DeepSeek

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
自定义镜像训练作业配置节点间SSH免密互信 - AI开发平台ModelArts

command”表示训练作业中需要执行的其他自定义命令。 “环境变量”增加“MY_SSHD_PORT = 38888”。 “配置节点间SSH免密互信”开关打开，并设置“SSH密钥目录”，一般保持默认值。该配置会在下发训练作业后，自动在训练容器的“/home/ma-user/.ssh”目录下生成SSH密钥

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
配置Grafana数据源 - AI开发平台ModelArts

配置说明 Name 自定义名称。 URL 设置为从c.从“设置”页签的“Grafana数据源配置信...获取的HTTP URL信息。 Basic auth 建议开启。 Skip TLS Verify 建议开启。 User 设置为从c.从“设置”页签的“Grafana数据源配置信..

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
创建ModelArts人工标注作业 - AI开发平台ModelArts

数据集名称选择支持当前标注类型的数据集。添加标签集设置标签名称：在标签名称文本框中，输入标签名称。长度为1～1024字符。添加标签：单击“添加标签”可增加多个标签。设置标签颜色：“物体检测”和“图像分割”类型标注作业需设置此参数。在每个标签右侧的标签颜色区域下，可在色板中选

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
使用VS Code创建并调试训练作业 - AI开发平台ModelArts

（可选）设置中转目录：中转目录支持OBS路径和SFS盘挂载路径。如果已经在步骤3配置，此处会自动显示中转目录。如果设置的是OBS路径，单击“提交作业”后，插件会自动将当前打开的项目文件整体上传至OBS中转目录上。图6 设置中转目录设置输入路径：本地项目对应的输入文件设置为输入路径。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
multi-step - AI开发平台ModelArts
multi-step - AI开发平台ModelArts

multi-step参数设置启动推理服务时，使用multi-step调度需要配置的参数如下表所示。表1 开启multi-step调度参数配置服务启动方式配置项取值类型配置说明 offline num_scheduler_steps int 连续运行模型的步数。默认为1，推荐设置为8 offline

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

默认值与参数类型不一致请检查默认值参数类型 400 ModelArts.2769 DefaultValueIsNotInRange 默认值不在设置范围内请确保默认值在设置范围内 400 ModelArts.2770 RangeError 参数范围错误请重新填写参数范围 400 ModelArts

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
在推理生产环境中部署推理服务 - AI开发平台ModelArts

登录ModelArts控制台，单击“AI应用管理 > AI应用 > 创建”，开始创建AI应用。图2 创建AI应用设置创建AI应用的相应参数。此处仅介绍关键参数，设置AI应用的详细参数解释请参见从OBS中选择元模型。根据需要自定义应用的名称和版本。模型来源选择“从对象存储服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

登录ModelArts控制台，单击“AI应用管理 > AI应用 > 创建”，开始创建AI应用。图2 创建AI应用设置创建AI应用的相应参数。此处仅介绍关键参数，设置AI应用的详细参数解释请参见从OBS中选择元模型。根据需要自定义应用的名称和版本。模型来源选择“从对象存储服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
审核并验收团队标注任务结果 - AI开发平台ModelArts

业名称进入“标注作业详情页”，单击右上角“团队标注>验收”，发起验收。图5 发起验收在弹出的对话框中，设置“抽样策略”，可设置为“按百分比”，也可以设置为“按数量”。设置好参数值后，单击“确定”启动验收。 “按百分比”：按待验收图片总数的一定比例进行抽样验收。 “按数量”：按一定数量进行抽样验收。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
发布免费模型 - AI开发平台ModelArts

限期使用。如果打开时长限制，除了设置资产免费使用的时长，还可以设置到期后是否续订。如果是更新已发布资产的版本。 “发布方式”选择“添加资产版本”。在“资产标题”下拉框中选择已有资产名称。支持搜索资产名称。设置“ModelArts区域”。设置可以使用该资产的ModelArts区域，以控制台实际可选值为准。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
在MaaS体验模型服务 - AI开发平台ModelArts

在线体验”，进入“模型体验”页面。在“模型体验”右上角，单击“参数设置”，拖动或直接输入数值配置推理参数。单击“恢复默认”可以将参数值调回默认值。图1 设置推理参数表1 参数设置参数说明温度/Temperature 设置推理温度。数值较高，输出结果更加随机。数值较低，输出结果更加集中和确定。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
创建并管理工作空间 - AI开发平台ModelArts

默认无限制，支持设置1~60000。分钟推理服务GPU规格使用时长（单节点为统计基础单元）默认无限制，支持设置1~60000。分钟训练作业CPU规格训练核数默认无限制，支持设置1~10000。核训练作业GPU规格训练卡数默认无限制，支持设置1~1000。卡训练作业RAM规格训练内存大小

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
发布和管理AI Gallery项目 - AI开发平台ModelArts

性。编辑Notebook介绍在Notebook详情页，单击“项目介绍”。在基础设置中设置“许可证”、“语言”、“框架”、“任务类型”和“硬件资源”等信息。单击“确定”。编辑设置基本设置单击右侧的，可以更改Notebook名称和描述。编辑完成之后单击“确定”。关联资产

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
套餐包 - AI开发平台ModelArts
套餐包 - AI开发平台ModelArts

为避免产生按需消费，建议通过设置套餐包剩余量预警，以确保在套餐包用尽前及时接收预警。设置套餐包剩余量预警步骤如下：进入控制台“费用中心 > 资源包”，单击右上角“剩余量预警”。在“剩余量预警”弹窗中，设置套餐包阈值类型，并在套餐包列表中打开需开启剩余量预警的套餐包开关、设置阈值类型和剩余量阈值。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

图5 资源设置表2 部署模型服务参数说明取值样例服务设置服务名称自定义模型服务的名称。 service-1122 描述部署模型服务的简介。 - 模型设置部署模型当从“我的模型”进入部署模型服务页面时，此处默认呈现选择的模型。 Qwen2-7B 资源设置资源池类型

 帮助中心 > AI开发平台ModelArts > 快速入门
训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

到通信网卡或者是无法正常访问IP地址。需要排查训练代码中是否有设置NCCL_SOCKET_IFNAME环境变量，该环境变量由系统自动注入，训练代码中无需设置。训练代码去除NCCL_SOCKET_IFNAME环境变量设置逻辑后，单击右侧“重建”，重新创建训练作业，提交训练作业后等待作业完成。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
修复Standard专属资源池故障节点 - AI开发平台ModelArts

冗余实例数：此规格设置的高可用冗余实例数量。冗余系数指的是冗余节点分布策略为step均分时，每个超节点内预留的冗余节点数量。方式二：在资源池详情页的规格页签设置图2 规格页签设置图3 设置高可用冗余能力方式三：在扩缩容页面设置图4 设置高可用冗余能力设置单节点为高可用冗余节点

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池

总条数： 882

上一页
1
...
8
9
10
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

重建、停止或删除训练作业 - AI开发平台ModelArts

Notebook Cache盘告警上报 - AI开发平台ModelArts

图模式 - AI开发平台ModelArts

自定义镜像训练作业配置节点间SSH免密互信 - AI开发平台ModelArts

配置Grafana数据源 - AI开发平台ModelArts

创建ModelArts人工标注作业 - AI开发平台ModelArts

使用VS Code创建并调试训练作业 - AI开发平台ModelArts

multi-step - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

审核并验收团队标注任务结果 - AI开发平台ModelArts

发布免费模型 - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

创建并管理工作空间 - AI开发平台ModelArts

发布和管理AI Gallery项目 - AI开发平台ModelArts

套餐包 - AI开发平台ModelArts

使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线