搜索_华为云

获取训练作业事件列表 - AI开发平台ModelArts

d}/events 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。表2 Query参数参数

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
Notebook Cache盘告警上报 - AI开发平台ModelArts

图3 告警条件设置设置告警通知，单击“立即创建”。 “告警方式”：选择“直接告警” “行动规则”：开启开关，选择已创建的行动规则。如果现有列表中的告警行动规则无法满足需要，可单击“新建告警行动规则”添加，详细操作请参考创建告警行动规则。 “告警恢复通知”：开启开关图4 设置告警通知

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

适配的CANN版本是cann_8.0.rc2，驱动版本是23.0.5。约束限制本案例仅支持在专属资源池上运行。支持的模型列表本方案支持以下模型的训练，如表1所示。表1 代码包中适配的模型序号支持模型支持模型参数量权重文件获取地址 1 Llama2 llama2-7b https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
获取训练作业支持的AI预置框架 - AI开发平台ModelArts

/v2/{project_id}/training-job-engines 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 total

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
VS Code ToolKit连接Notebook - AI开发平台ModelArts

安装过程预计1~2分钟，如图2所示，请耐心等待。图2 安装过程安装完成后，系统右下角提示安装完成，导航左侧出现ModelArts图标和SSH远程连接图标，表示VS Code插件安装完成。图3 安装完成提示图4 安装完成当前网络不佳时SSH远程连接插件可能未安装成功，此时无需操作，在Step4

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
在ModelArts Standard上运行GPU训练任务的场景介绍 - AI开发平台ModelArts

26:10:25 4机8卡Vnt1 10 07:08:44 表3 训练各步骤性能参考步骤说明预计时长镜像下载首次下载镜像的时间（25G）。 8分钟资源调度点创建训练任务开始到变成运行中的时间（资源充足、镜像已缓存）。 20秒训练列表页打开已有50条训练作业，单击训练模块后的时间。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
在ModelArts Standard上运行GPU多机多卡训练任务 - AI开发平台ModelArts

docker run -ti -d -v /mnt/sfs_turbo:/sfs my_deeplearning_image:v1 上述命令表示把宿主机的"/mnt/sfs_turbo"目录挂载到容器的"/sfs"目录，在宿主机和容器对应目录的所有改动都是实时同步的。分析错误时：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
Yaml配置文件参数配置说明 - AI开发平台ModelArts

优化等高级特性，以提高训练效率和性能 stage sft 表示当前的训练阶段。可选择值：[pt、sft、rm、ppo、dpo]，pt代表预训练，sft代表指令监督微调，rm代表奖励模型训练，ppo代表PPO训练，dpo代表DPO训练。 finetuning_type full 用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

本文档适配昇腾云ModelArts 6.3.907版本，请参考表1获取配套版本的软件包和镜像，请严格遵照版本配套关系使用本文档。确保容器可以访问公网。资源规格要求推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。软件配套版本表1 获取软件分类名称获取路径

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

t_shape及dynamic_dims动态参数。其中input_shape的-1表示动态shape所在的维度，dynamic_dims指定动态维度的取值范围，比如“[1~4],[8],[16]”表示该动态维度支持1、2、3、4、8、6共六种大小。 # config.ini [ascend_context]

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
创建资源池 - AI开发平台ModelArts

controlMode Integer 资源池的受限状态。可选值如下： 0：代表不受限 1：转包周期受限 2：规格变更受限 4：服务受限 8：冻结 16：公安冻结（不可退订）另外状态是可以叠加的，比如9代表转包周期受限+冻结状态。表17 resources 参数参数类型描述 flavor String

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
新建Workflow Execution - AI开发平台ModelArts

是否使用的是缓存。表8 WorkflowConditionExecution 参数是否必选参数类型描述 result 否 String 执行结果。 metric_list 否 Array of WorkflowMetricPair objects 工作流度量信息列表。表9 WorkflowMetricPair

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
在Notebook中添加自定义IPython Kernel - AI开发平台ModelArts

--quiet --yes -n my-env python=3.6.5 创建完成后，执行conda info --envs命令查看现有的虚拟环境列表，可以看到my-env虚拟环境： sh-4.4$conda info --envs # conda environments: # base

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 环境配置相关
创建IAM用户并授权使用MaaS - AI开发平台ModelArts

给用户组授权之前，请先了解用户组可以添加的使用ModelArts及其依赖服务的权限，并结合实际需求进行选择，MaaS服务支持的系统权限，请参见表1。表1 服务授权列表待授权的服务授权说明 IAM权限设置是否必选 ModelArts 授予子用户使用ModelArts服务的权限。 ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

镜像中包含的各类固件版本，配置Standard物理机环境操作。基础镜像地址本教程中用到的训练的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本训练基础镜像 swr.cn-southwest-2.myhuaweicloud

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

configs 是 JSON Array 本地服务运行配置。表2 predictor configs结构参数是否必选参数类型描述 model_id 是 String 模型ID。“model_id”可以通过查询模型列表或者ModelArts管理控制台获取。 weight 是 Integer

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

如果要使用自动重启功能，资源规格必须选择八卡规格，只有llama3-8B/70B支持该功能。本案例仅支持在专属资源池上运行。支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
查询团队标注任务统计信息 - AI开发平台ModelArts

select：单选下拉列表 values Array of LabelAttributeValue objects 标签属性值列表。表8 LabelAttributeValue 参数参数类型描述 id String 标签属性值ID。 value String 标签属性值。表9 LabelProperty

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
ModelArts Standard使用流程 - AI开发平台ModelArts

以根据实际需要选择其中的环节。下文介绍使用ModelArts平台，从准备数据到完成模型开发上线的全流程。图1 Standard使用流程表1 使用流程说明流程子任务说明详细指导配置权限配置ModelArts委托授权 ModelArts功能使用还依赖与其他云服务的交互

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）

总条数： 821

上一页
1
...
35
36
37
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

获取训练作业事件列表 - AI开发平台ModelArts

Notebook Cache盘告警上报 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

获取训练作业支持的AI预置框架 - AI开发平台ModelArts

VS Code ToolKit连接Notebook - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练任务的场景介绍 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练任务 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook中添加自定义IPython Kernel - AI开发平台ModelArts

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

查询团队标注任务统计信息 - AI开发平台ModelArts

ModelArts Standard使用流程 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线