搜索_华为云

AI Gallery简介 - AI开发平台ModelArts

者提供免费分享和灵活使用Notebook代码样例的功能。您可以将优秀的Notebook代码样例发布在AI Gallery社区，供其他开发者学习使用；也可以在AI Gallery上查看其他人共享的Notebook案例的详细描述、代码信息等，通过“Run in ModelArts”将

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
业务代码问题 - AI开发平台ModelArts

分布式Tensorflow无法使用“tf.variable” MXNet创建kvstore时程序被阻塞，无报错日志出现ECC错误，导致训练作业失败超过最大递归深度导致训练作业失败使用预置算法训练时，训练失败，报“bndbox”错误训练作业状态显示“审核作业初始化” 训练作业进程异常退出训练作业进程被kill

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
创建单机多卡的分布式训练（DataParallel） - AI开发平台ModelArts

主GPU（逻辑序号为0）收集各GPU的输出，汇总后计算损失分发损失，各GPU各自反向传播梯度主GPU收集梯度并更新参数，将更新后的模型参数分发到各GPU 具体流程图如下：图1 单机多卡数据并行训练代码改造点模型分发：DataParallel(model) 完整代码由于代码变动较少，此处进行简略介绍。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
在Workflow中更新已部署的服务 - AI开发平台ModelArts

default="0.002", description="训练的学习率策略(10:0.001,20:0.0001代表0-10个epoch学习率0.001，10-20epoch学习率0.0001),如果不指定epoch, 会根据验证精度情况自动调整学习率，并当精度没有明显提升时，训练停止")),

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
发布Workflow到ModelArts - AI开发平台ModelArts

default="0.002", description="训练的学习率策略(10:0.001,20:0.0001代表0-10个epoch学习率0.001，10-20epoch学习率0.0001),如果不指定epoch, 会根据验证精度情况自动调整学习率，并当精度没有明显提升时，训练停止")),

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
编排Workflow - AI开发平台ModelArts

default="0.002", description="训练的学习率策略(10:0.001,20:0.0001代表0-10个epoch学习率0.001，10-20epoch学习率0.0001),如果不指定epoch, 会根据验证精度情况自动调整学习率，并当精度没有明显提升时，训练停止")),

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

是否有“运行中”的Workflow列表。如果有，单击Workflow列表中“操作 > 删除”即可停止计费。进入“ModelArts>自动学习”页面，检查是否有“运行中”的项目。如果有，单击项目列表中“操作 > 删除”即可停止计费。进入“ModelArts>开发空间>Noteb

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
创建并完成图像分类的智能标注任务 - AI开发平台ModelArts

创建并完成图像分类的智能标注任务本节通过调用一系列API，以创建并完成智能标注任务为例介绍ModelArts API的使用流程。概述创建智能标注任务的流程如下：调用认证鉴权接口获取用户Token，在后续的请求中需要将Token放到请求消息头中作为认证。调用启动智能任务接

 帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

开发环境的Notebook实例 exemlProject 自动学习项目 exemlProjectInf 自动学习项目的在线推理服务 exemlProjectTrain 自动学习项目的训练作业 exemlProjectVersion 自动学习项目的版本 workflow Workflow项目 pool

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

是否有“运行中”的Workflow列表。如果有，单击Workflow列表中“操作 > 删除”即可停止计费。进入“ModelArts>自动学习”页面，检查是否有“运行中”的项目。如果有，单击项目列表中“操作 > 删除”即可停止计费。进入“ModelArts>开发空间>Noteb

帮助中心 > AI开发平台ModelArts > 常见问题 > 计费相关
自定义镜像使用场景 - AI开发平台ModelArts

安全可信，基于安全加固最佳实践，访问策略、用户权限划分、开发软件漏洞扫描、操作系统安全加固等方式，确保镜像使用的安全性。 ModelArts的自定义镜像使用场景当用户对深度学习引擎、开发库有特殊需求场景的时候，预置镜像已经不能满足用户需求。ModelArts提供自定义镜像功能支持用户自定义运行引擎。 Model

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
模型推理代码编写说明 - AI开发平台ModelArts

model_path) 初始化方法，适用于深度学习框架模型。该方法内加载模型及标签等（pytorch和caffe类型模型必须重写，实现模型加载逻辑）。 __init__(self, model_path) 初始化方法，适用于机器学习框架模型。该方法内初始化模型的路径（self.

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用规范参考
SFT全参微调训练 - AI开发平台ModelArts

表示张量并行。 PP 1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
服务预测失败 - AI开发平台ModelArts

原因分析及处理方法服务预测需要经过客户端、外部网络、APIG、Dispatch、模型服务多个环节。每个环节出现都会导致服务预测失败。图1 推理服务流程图出现APIG.XXXX类型的报错，表示请求在APIG（API网关）出现问题而被拦截。常见问题请参见服务预测失败，报错APIG.XXXX。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
LoRA微调训练 - AI开发平台ModelArts

表示张量并行。 PP 1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
迁移过程使用工具概览 - AI开发平台ModelArts

运行内置的知识库进行自动优化，以提升模型的运行效率。自动高性能算子生成工具AKG AKG(Auto Kernel Generator)对深度神经网络中的算子进行优化，并提供特定模式下的算子自动融合功能。提升在昇腾硬件后端上运行网络的性能。 AKG由三个基本的优化模块组成：规范化、自动调度和后端优化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

表示张量并行。 PP 1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

ModelArts与OBS交互示意表1 ModelArts各模块与OBS的关系功能子任务 ModelArts与OBS的关系 Standard自动学习Standard Workflow 数据标注 ModelArts标注的数据存储在OBS中。自动训练训练作业结束后，其生成的模型存储在OBS中。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
查询预置算法 - AI开发平台ModelArts

\"required\":true},{\"label\":\"lr\",\"value\":\"0.0001\",\"placeholder_cn\":\"更新参数的学习率\",\"placeholder_en\":\"\",\"required\":true},{\"label\":\"save_frequency\"

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

context-parallel-size 。（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）

总条数： 1006

上一页
1
...
9
10
11
...
51
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

AI Gallery简介 - AI开发平台ModelArts

业务代码问题 - AI开发平台ModelArts

创建单机多卡的分布式训练（DataParallel） - AI开发平台ModelArts

在Workflow中更新已部署的服务 - AI开发平台ModelArts

发布Workflow到ModelArts - AI开发平台ModelArts

编排Workflow - AI开发平台ModelArts

如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

创建并完成图像分类的智能标注任务 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

自定义镜像使用场景 - AI开发平台ModelArts

模型推理代码编写说明 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

迁移过程使用工具概览 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

查询预置算法 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线