搜索_华为云

依赖和委托 - AI开发平台ModelArts

桶）前，需要用户通过IAM委托向ModelArts显式授权，ModelArts在需要时使用用户的委托获取临时认证凭据用于操作用户资源，见“添加授权”。图1 委托授权如图1所示，用户向ModelArts授权后，ModelArts使用委托授权的临时凭证访问和操作用户资源，协助用户

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
开发环境的应用示例 - AI开发平台ModelArts

39 } 根据“description”和“name”字段选择创建Notebook实例所需要的镜像，并记录对应的“id”，本章以TensorFlow引擎为例创建Notebook实例，记录“id”为"e1a07296-22a8-4f05-8bc8-e936c8e54100" 调用创建N

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
配置Workflow的输入输出目录 - AI开发平台ModelArts

storages=[input_storage, output_storage] # 注意在整个工作流中使用到的Storage对象需要在这里添加 ) 开发态配置调用工作流对象的run方法，在开始运行时展示输入框，等待用户输入，如下所示：图1 等待用户输入要求用户输入已存在的路

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
SD1.5基于Lite Server适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

rainingLogParser查看loss收敛情况。其它注意事项默认500step保存一个checkpoint，可以通过在启动脚本里添加参数--checkpointing_steps=num修改。若显存较低可以调整batch_size保证正常运行，改为8或者更小。本次训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
Yaml配置文件参数配置说明 - AI开发平台ModelArts

aMA-Factory/data 【可选】dataset_info.json配置文件所属的绝对路径；如使用自定义数据集，yaml配置文件需添加此参数。 template qwen 必须修改。用于指定模板。如果设置为"qwen"，则使用QWEN模板进行训练，模板选择可参照表1中的template列

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
查询训练作业列表 - AI开发平台ModelArts

训练在子任务状态信息。 running_records Array of RunningRecord objects 训练作业运行及故障恢复记录。表8 TaskStatuses 参数参数类型描述 task String 训练作业子任务名称。 exit_code Integer

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

":"cabinet"}”，如图2所示。图2 Volcano调度器的高级配置是，则执行2。否，则在高级配置的“plugins”参数下添加“{"name":"cabinet"}”，单击下方的“安装”使Volcano调度器更新配置，完成滚动重启。修改torch_npu训练启动脚本。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

在“服务列表”中选择“管理与监管 > 云监控服务”，进入“云监控服务”管理控制台。在左侧导航栏，选择“云服务监控 > ModelArts”。选择需要添加告警规则的在线服务名称，单击操作列的“创建告警规则”。在“创建告警规则”界面，根据界面提示设置ModelArts在线服务和模型负载的告警规则。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

length_penalty表示在beam search过程中，对于较长的序列，模型会给予较大的惩罚。如果要使用length_penalty，必须添加如下三个参数，并且需将use_beam_search参数设置为true，best_of参数设置大于1，top_k固定为-1。 "top_k":

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
训练作业卡死检测 - AI开发平台ModelArts

解决方案2 在程序开头设置“os.environ["NCCL_NET_GDR_LEVEL"] = '0'”关闭使用GDR，或者寻找运维人员将机器添加GDR。问题现象3 NCCL信息中报出Got completion with error 12, opcode 1, len 32478

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

Administrator 云硬盘EVS EVS FullAccess 如果系统预置的权限，不满足您的授权要求，可以创建自定义策略。自定义策略中可以添加的授权项（Action）请参考ModelArts资源权限项。目前支持以下两种方式创建自定义策略：可视化视图创建自定义策略：无需了解策略

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
执行训练任务（历史版本） - AI开发平台ModelArts

OUTPUT_SAVE_DIR：训练完成后指定的输出模型路径。 MG_TO_HF_PATH：训练完成的权重文件自动转换为Hugging Face格式权重输出的路径（确保添加CONVERT_MG2HF环境变量并设置为True）。分别单击“输入”和“输出”的数据存储位置，如图所示，选择OBS桶中指定的目录。OR

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
Yaml配置文件参数配置说明 - AI开发平台ModelArts

aMA-Factory/data 【可选】dataset_info.json配置文件所属的绝对路径；如使用自定义数据集，yaml配置文件需添加此参数。 template qwen 必须修改。用于指定模板。如果设置为"qwen"，则使用QWEN模板进行训练，模板选择可参照表1中的template列

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
Yaml配置文件参数配置说明 - AI开发平台ModelArts

aMA-Factory/data 【可选】dataset_info.json配置文件所属的绝对路径；如使用自定义数据集，yaml配置文件需添加此参数。 template qwen 必须修改。用于指定模板。如果设置为"qwen"，则使用QWEN模板进行训练，模板选择可参照表1中的template列

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
云上迁移适配故障 - AI开发平台ModelArts

云上迁移适配故障无法导入模块训练作业日志中提示“No module named .*” 如何安装第三方包，安装报错的处理方法下载代码目录失败训练作业日志中提示“No such file or directory” 训练过程中无法找到so文件 ModelArts训练作业无法解析参数，日志报错

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
Yaml配置文件参数配置说明 - AI开发平台ModelArts

aMA-Factory/data 【可选】dataset_info.json配置文件所属的绝对路径；如使用自定义数据集，yaml配置文件需添加此参数。 template qwen 必须修改。用于指定模板。如果设置为"qwen"，则使用QWEN模板进行训练，模板选择可参照表1中的template列

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
产品变更公告 - AI开发平台ModelArts

产品变更公告网络调整公告预测API的域名停用公告

 帮助中心 > AI开发平台ModelArts > 服务公告
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

访问这些依赖服务。使用华为云账号登录ModelArts管理控制台，在左侧导航栏单击“权限管理”，进入“权限管理”页面，单击“添加授权”。在弹出的“添加授权”窗口中，选择：授权对象类型：所有用户委托选择：新增委托权限配置：普通用户选择完成后勾选“我已经详细阅读并同意《M

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明以 llama2-13b 举例，运行：0_pl_pretrain_13b.sh 训练脚本后，脚本检查是否已经完成数据集预处理的过程。若已完成数据集预处理，则直接执行预训练任务。若未进行数据集预处理，则会自动执行 scripts/llama2/1_preprocess_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

访问这些依赖服务。使用华为云账号登录ModelArts管理控制台，在左侧导航栏单击“权限管理”，进入“权限管理”页面，单击“添加授权”。在弹出的“添加授权”窗口中，选择：授权对象类型：所有用户委托选择：新增委托权限配置：普通用户选择完成后勾选“我已经详细阅读并同意《M

帮助中心 > AI开发平台ModelArts > 快速入门

总条数： 885

上一页
1
...
40
41
42
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

依赖和委托 - AI开发平台ModelArts

开发环境的应用示例 - AI开发平台ModelArts

配置Workflow的输入输出目录 - AI开发平台ModelArts

SD1.5基于Lite Server适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

云上迁移适配故障 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

产品变更公告 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线