搜索_华为云

Yaml配置文件参数配置说明 - AI开发平台ModelArts

disable_gradient_checkpointing true 关闭重计算，用于禁用梯度检查点，默认开启梯度检查点;在深度学习模型训练中用于保存模型的状态，以便在需要时恢复。这种技术可以帮助减少内存使用，特别是在训练大型模型时，但同时影响性能。True表示关闭重计算功能。 include_tokens_per_second

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 训练脚本说明
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

txt，打印训练过程中AICORE利用率本章节主要介绍训练性能训练任务流程，如需执行训练精度任务可参考训练精度测试 PPO强化训练时必须关闭共享内存，启动任务命令需设置PYTORCH_NPU_ALLOC_CONF值为False，具体命令如下： PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 执行训练任务
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

txt，打印训练过程中AICORE利用率本章节主要介绍训练性能训练任务流程，如需执行训练精度任务可参考训练精度测试 PPO强化训练时必须关闭共享内存，启动任务命令需设置PYTORCH_NPU_ALLOC_CONF值为False，具体命令如下： PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
Yaml配置文件参数配置说明 - AI开发平台ModelArts

disable_gradient_checkpointing true 关闭重计算，用于禁用梯度检查点，默认开启梯度检查点;在深度学习模型训练中用于保存模型的状态，以便在需要时恢复。这种技术可以帮助减少内存使用，特别是在训练大型模型时，但同时影响性能。True表示关闭重计算功能。 include_tokens_per_second

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
在MaaS中创建模型 - AI开发平台ModelArts

境为准。当开启权重校验时，平台会对OBS中的权重文件进行校验，确认其是否满足规范。权限校验常见的失败情况及其处理建议请参见权重校验。当关闭权重校验时，则不进行校验，创建模型可能会因为权重文件不合规而失败。表2 模型介绍模型系列模型类型应用场景支持语言 GLM-4 文本生成

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
非分离部署推理服务 - AI开发平台ModelArts

com/SafeAILab/EAGLE/ 版本实现，默认开启 export ENABLE_SPEC_METRIC=0 # 是否关闭投机推理的metric采集功能，关闭有助于提升投机推理性能，默认关闭如果需要使用eagle投机推理功能，需要进入 lm_tools/spec_decode/EAGLE文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
将模型部署为批量推理服务 - AI开发平台ModelArts

“部署超时时间” 用于设置单个模型实例的超时时间，包括部署和启动时间。默认值为20分钟，输入值必须在3到120之间。 “运行日志输出” 默认关闭，批量服务的运行日志仅存放在ModelArts日志系统，在服务详情页的“日志”支持简单查询。如果开启此功能，批量服务的运行日志会输出存放

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
创建资源池 - AI开发平台ModelArts

Notebook：Notebook作业 state String 业务状态。可选值如下： Enabling：启动中 Enabled：已启动 Disabling：关闭中 Disabled：已关闭表29 driver 参数参数类型描述 gpu PoolDriverStatus object GPU驱动信息。 npu

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
发布免费算法 - AI开发平台ModelArts

“指定用户”：表示仅特定用户可以查看及使用该资产。 “仅自己可见”：表示只有当前账号可以查看并使用该资产。设置“时长限制”。设置订阅者可以免费使用资产的时长，默认关闭，即无限期使用。如果打开时长限制，除了设置资产免费使用的时长，还可以设置到期后是否续订。如果是更新已发布资产的版本。 “发布方式”选择“添加资产版本”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
停止计费 - AI开发平台ModelArts
停止计费 - AI开发平台ModelArts

户。详细的退订规则请参见云服务退订规则概览。如果您已开启“自动续费”功能，为避免继续产生费用，请在自动续费扣款日（默认为到期前7日）之前关闭自动续费。按需计费资源对于按需计费模式的资源，如果不再使用这些资源且需停止计费，请删除相应资源。通过账单查找云服务资源并停止计费为

 帮助中心 > AI开发平台ModelArts > 计费说明
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

Gallery中提供了常见的精度较高的算法和相应的训练数据集，用户可以在AI Gallery的资产集市中获取。后续操作：清除相应资源在完成预测之后，建议关闭服务，以免产生不必要的计费。停止运行服务预测完成后，单击页面右上角的“停止”，即可停止该服务。单击左上角返回在线服务，在对应的服务名

 帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

Gallery中提供了常见的精度较高的算法和相应的训练数据集，用户可以在AI Gallery的资产集市中获取。后续操作：清除相应资源在完成预测之后，建议关闭服务，以免产生不必要的计费。停止运行服务预测完成后，单击页面右上角的“停止”，即可停止该服务。单击左上角返回在线服务，在对应的服务名

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
通过Token认证的方式访问在线服务 - AI开发平台ModelArts

通过Token认证的方式访问在线服务如果在线服务的状态处于“运行中”，则表示在线服务已部署成功，部署成功的在线服务，将为用户提供一个可调用的API，此API为标准Restful API。在集成至生产环境之前，需要对此API进行调测，您可以使用以下方式向在线服务发起预测请求：方

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
Lite Cluster资源开通 - AI开发平台ModelArts

到影响。如果您要做分布式训练，建议您只选择一个GPU或NPU规格。一个资源池中，最多可添加10种规格。资源调度与切分自定义驱动默认关闭。部分GPU和Ascend规格资源池允许自定义安装驱动。集群中默认会安装驱动，无需用户操作。只有需要指定驱动版本时，需要开启。建议在购买C

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
在Workflow中更新已部署的服务 - AI开发平台ModelArts

其中ServiceStep节点包含两个输入，一个是模型列表对象，另一个是在线服务对象，此时在运行态通过开关的方式来控制部署/更新服务，如下图所示：在线服务开关默认关闭，节点走部署服务的流程；如果需要更新服务，则手动打开开关，选择相应的在线服务即可。进行服务更新时，需要保证被更新的服务所使用的模型与配置的模型名称相同。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

Key管理”。在“API Key管理”页面，单击“创建API Key”，填写描述信息后，单击“确认”会返回“您的密钥”，请复制保存密钥，单击“关闭”后将无法再次查看密钥。最多支持创建5个密钥，密钥只会在新建后显示一次，请妥善保存。当密钥丢失将无法找回，请新建API Key获取新的访问密钥。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 使用MaaS DeepSeek API搭建AI应用
基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

Key管理”。在“API Key管理”页面，单击“创建API Key”，填写描述信息后，单击“确认”会返回“您的密钥”，请复制保存密钥，单击“关闭”后将无法再次查看密钥。最多支持创建5个密钥，密钥只会在新建后显示一次，请妥善保存。当密钥丢失将无法找回，请新建API Key获取新的访问密钥。

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理应用
ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

--page-size Int 否每页显示的作业数量，默认是20。 -v / --verbose Bool 否显示详细的信息开关，默认关闭。示例：查询DLI Spark所有作业。 ma-cli dli-job get-job 使用ma-cli dli-job submit命令提交DLI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
执行训练任务 - AI开发平台ModelArts

FlashAttention融合算子，具体约束详见NPU_Flash_Attn融合算子约束是，配置以下参数。 flash_attn: sdpa 否，配置以下参数关闭。 flash_attn: disabled 是否使用固定句长。是，配置以下参数 packing: true 否，默认使用动态句长，注释掉packing参数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）

总条数： 373

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Yaml配置文件参数配置说明 - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

将模型部署为批量推理服务 - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

发布免费算法 - AI开发平台ModelArts

停止计费 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

在Workflow中更新已部署的服务 - AI开发平台ModelArts

基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

基于MaaS DeepSeek API和Dify快速构建网站智能客服 - AI开发平台ModelArts

ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线