搜索_华为云

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

名称可以包含字母、中文、数字、中划线、下划线。版本设置所创建模型的版本。第一次导入时，默认为0.0.1。说明：模型创建完成后，可以通过创建新版本，导入不同的元模型进行调优。描述模型的简要描述。填写元模型来源及其相关参数。当“元模型来源”选择“从训练中选择”时，其相关的参数配置请参见表2。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
增量模型训练 - AI开发平台ModelArts

量训练通过保留旧知识的同时学习新知识来避免这个问题。增量训练在很多领域都有应用，比如自然语言处理、计算机视觉和推荐系统等。它使得AI系统能够更加灵活和适应性强，更好地应对现实世界中不断变化的数据环境。 ModelArts Standard中如何实现增量训练增量训练是通过Checkpoint机制实现。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
删除资源标签 - AI开发平台ModelArts

"value" : "dev1" } ] } 响应示例无状态码状态码描述 204 删除成功。 400 参数非法。 401 鉴权失败。 403 权限不足。 404 资源不存在。错误码请参见错误码。父主题：开发环境管理

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询资源池上的标签 - AI开发平台ModelArts

"values" : [ "dev1" ] } ] } 状态码状态码描述 204 标签列表。 400 参数非法。 401 鉴权失败。 403 权限不足。 404 资源不存在。错误码请参见错误码。父主题：资源标签管理

 帮助中心 > AI开发平台ModelArts > API参考 > 资源标签管理
查询服务监控信息 - AI开发平台ModelArts

String 模型版本。 invocation_times Number 模型实例的总调用次数。 failed_times Number 模型实例调用失败次数。 cpu_core_usage Float 已使用CPU核数。 cpu_core_total Float 总CPU核数。 cpu_memory_usage

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
续费概述 - AI开发平台ModelArts
续费概述 - AI开发平台ModelArts

华为云根据客户等级定义了不同客户的宽限期和保留期时长。在专属资源池到期前均可开通自动续费，到期前7日凌晨3:00首次尝试自动续费，如果扣款失败，每天凌晨3:00尝试一次，直至专属资源池到期或者续费成功。到期前7日自动续费扣款是系统默认配置，您也可以根据需要修改此扣款日。父主题：

帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
如何定位Workflow运行报错 - AI开发平台ModelArts

根据具体报错信息定位到报错的代码行，分析上下文逻辑。历史SDK包常见的报错如下服务部署节点运行报错输入服务相关的参数后，执行报错如下：解决方案以上两种常见报错均可通过升级最新的SDK包解决。父主题： Standard Workflow

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Workflow
查询专属资源池作业统计信息 - AI开发平台ModelArts

Completed Integer 已完成的作业个数。 Terminated Integer 已终止的作业个数。 Failed Integer 运行失败的作业个数。状态码：400 表6 响应Body参数参数参数类型描述 error_code String ModelArts错误码。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

books/{id}/flavors 表1 路径参数参数是否必选参数类型描述 id 是 String Notebook实例ID，可通过调用查询Notebook实例列表接口获取。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。表2

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
如何关闭Mox的warmup - AI开发平台ModelArts

up的原因。等到训练过程基本稳定之后就可以使用原先设定的初始学习率进行训练。原因分析 Tensorflow分布式有多种执行模式，mox会通过4次执行50 step记录执行时间，选择执行时间最少的模型。处理方法创建训练作业时，在“运行参数”中增加参数“variable_upd

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
推理性能测试 - AI开发平台ModelArts

多个，如 128 2048 128 2048，数量需和--prompt-tokens的数量对应。 --benchmark-csv：结果保存文件，如benchmark_parallel.csv。 --served-model-name：选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
AI Gallery简介 - AI开发平台ModelArts

AI Gallery社区，供其他开发者学习使用；也可以在AI Gallery上查看其他人共享的Notebook案例的详细描述、代码信息等，通过“Run in ModelArts”将Notebook案例在ModelArts控制台快速打开、运行以及进行二次开发等操作。 “资产集市 >

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

Qwen2-7B_template 调优类型全参微调：直接在模型上训练，影响模型全量参数的微调训练，效果较好，收敛速度较慢，训练时间较长。 LoRA微调：冻结原模型，通过往模型中加入额外的网络层，并只训练这些新增的网络层参数，效果接近或略差于全参训练，收敛速度快，训练时间短。增量预训练：在现有预训练模型基

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
创建训练作业镜像保存任务 - AI开发平台ModelArts

String 镜像状态。枚举值如下： INIT：初始化。 CREATING：镜像保存中，此时训练作业不可用。 CREATE_FAILED：镜像保存失败。 ACTIVE：镜像保存成功，保存的镜像可以在SWR控制台查看，同时可以基于保存的镜像创建训练作业。 message String 镜像创建的时间，UTC毫秒。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

nstall.sh文件。具体为删除install.sh的第43行 "git cherrypick 171ba0b3"。该问题会导致代码安装失败，会在后续版本修复。代码上传至OBS 将AscendSpeed代码包AscendCloud-3rdLLM-905-xxx.zip在本地解

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
训练作业的自定义镜像制作流程 - AI开发平台ModelArts

擎空间的默认为50G，支持在创建专属资源池时自定义容器引擎空间。自定义镜像的默认用户必须为“uid”为“1000”的用户。自定义镜像中不能安装GPU或Ascend驱动程序。当用户选择GPU资源运行训练作业时，ModelArts后台自动将GPU驱动程序放置在训练环境中的 /us

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
查询所有团队的标注成员列表 - AI开发平台ModelArts

参数参数类型描述 create_time Long 创建时间。 description String 标注成员描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 email String 标注成员邮箱。 role Integer 角色。可选值如下： 0：打标者 1：审核者

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Prefix Caching - AI开发平台ModelArts

更高效的显存使用：当正在处理的请求相互之间存在公共前缀时，公共前缀部分的KV Cache可以共用，不必重复占用多份显存。约束限制该特性不能和Chunked-prefill、KV Cache量化特性同时使用。该特性暂不支持与LoRA特性配合。多模态模型暂不支持prefix cache。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
语言模型推理性能测试 - AI开发平台ModelArts

多个，如 128 2048 128 2048，数量需和--prompt-tokens的数量对应。 --benchmark-csv：结果保存文件，如benchmark_parallel.csv。 --num-scheduler-steps: 服务启动时如果配置了--num-sche

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
执行训练任务（推荐） - AI开发平台ModelArts

异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图3 开启故障重启断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务

总条数： 1835

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

增量模型训练 - AI开发平台ModelArts

删除资源标签 - AI开发平台ModelArts

查询资源池上的标签 - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

续费概述 - AI开发平台ModelArts

如何定位Workflow运行报错 - AI开发平台ModelArts

查询专属资源池作业统计信息 - AI开发平台ModelArts

查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

如何关闭Mox的warmup - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

AI Gallery简介 - AI开发平台ModelArts

在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

创建训练作业镜像保存任务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

训练作业的自定义镜像制作流程 - AI开发平台ModelArts

查询所有团队的标注成员列表 - AI开发平台ModelArts

Prefix Caching - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线