搜索_华为云

训练启动脚本说明和参数配置 - AI开发平台ModelArts

1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。 SN 1200 必

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
Namespace和Network - 云容器实例 CCI

通用计算型：支持创建含CPU资源的容器实例及工作负载，适用于通用计算场景。 GPU型：支持创建含GPU资源的容器实例及工作负载，适用于深度学习、科学计算、视频处理等场景。 Network是云容器实例扩展的一种Kubernetes资源对象，用于关联VPC及子网，从而使得容器实例能够使用公有云的网络资源。

帮助中心 > 云容器实例 CCI > 开发指南
环境准备 - AI开发平台ModelArts
环境准备 - AI开发平台ModelArts

昇腾规格规格名称描述 Ascend 1*ascend-snt9b|ARM 24核 192GB Snt9b单卡规格，配搭ARM处理器，适合深度学习场景下的模型训练和调测 ModelArts提供了面向推理迁移工作的预置镜像，其中包含了最新商用版驱动、昇腾软件开发库，迁移工具链等。预置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
常用概念 - 视频点播 VOD
常用概念 - 视频点播 VOD

转码的一种方式，是指一个视频源文件在一个转码任务中输出多个分辨率、码率的视频文件，以满足不同终端、不同网速的播放需求。画质增强是指通过传统成熟的超分辨率算法与AI深度学习的画质增强算法相结合，达到视频分辨率提升、视频画质提升等效果，可用于2K视频转4K视频、修复视频的受损图像，提升已有视频播放画质等效果。

帮助中心 > 视频点播 VOD > 产品介绍
执行微调训练任务 - AI开发平台ModelArts

ta 【可选】dataset_info.json配置文件所属的绝对路径；如使用自定义数据集，yaml配置文件需添加此参数。是否选择加速深度学习训练框架Deepspeed，可参考表1选择不同的框架。是，选用ZeRO (Zero Redundancy Optimizer)优化器。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
Namespace和Network - 云容器实例 CCI

通用计算型：支持创建含CPU资源的容器实例及工作负载，适用于通用计算场景。 GPU型：支持创建含GPU资源的容器实例及工作负载，适用于深度学习、科学计算、视频处理等场景。 Network是云容器实例扩展的一种Kubernetes资源对象，用于关联VPC及子网，从而使得容器实例能够使用公有云的网络资源。

帮助中心 > 云容器实例 CCI > API参考 > 附录
方案概述 - 媒体应用
方案概述 - 媒体应用

方案概述本方案将介绍一种虚拟数字人的方案，包含该方案的应用场景、方案架构、方案优势及其约束与限制。虚拟数字人是基于近年来深度学习开发出的前沿技术而成形的一种“虚拟人”，它能够根据不同的应用场景，通过模拟人类行为并采用深度学习技术来实现自动化处理，使得被认知的过程更加准确、高效

 帮助中心 > 媒体应用 > 追一政企服务数字人解决方案
大模型开发基本概念 - 盘古大模型 PanguLargeModels

训练数据中推导出预测函数。有标记的训练数据是指每个训练实例都包括输入和期望的输出。 LoRA 局部微调（LoRA）是一种优化技术，用于在深度学习模型的微调过程中，只对模型的一部分参数进行更新，而不是对所有参数进行更新。这种方法可以显著减少微调所需的计算资源和时间，同时保持或接近模型的最佳性能。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
PERF03-03 使用弹性伸缩 - 云架构中心

Kubernetes社区开源组件，用于节点水平伸缩，CCE在其基础上提供了独有的调度、弹性优化、成本优化的功能。全场景支持，适合在线业务、深度学习、大规模成本算力交付等。节点自动伸缩 CCE突发弹性引擎（对接CCI）将Kubernetes API扩展到无服务器的容器平台（如CCI），无需关心节点资源。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
Yaml配置文件参数配置说明 - AI开发平台ModelArts

examples/deepspeed/ds_z3_config.json 可选项。用于指定DeepSpeed的配置文件相对或绝对路径。DeepSpeed是一个开源库，用于加速深度学习训练。通过使用DeepSpeed，可以实现如混合精度训练、ZeRO内存优化等高级特性，以提高训练效率和性能 stage sft 表示当前

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
附录：训练常见问题 - AI开发平台ModelArts

expandable_segments:True 将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deepspeed-Ze

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

8 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。 SN 1200 必

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
执行训练任务（推荐） - AI开发平台ModelArts

加此值（≥ 2）。（此参数目前仅适用于Llama3系列模型长序列训练） lr 2.5e-5 学习率设置。 min-lr 2.5e-6 最小学习率设置。 seq-length 4096 要处理的最大序列长度。 convert_mg2hf_at_last true 是否将Megat

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
目标集群资源规划 - 云容器引擎 CCE

务器、开发、测试环境以及中低性能数据库等场景。 GPU加速型：提供优秀的浮点计算能力，从容应对高实时、高并发的海量计算场景。P系列适合于深度学习，科学计算，CAE等；G系列适合于3D动画渲染，CAD等。仅支持1.11及以上版本集群添加GPU加速型节点。高性能计算型：实例提供具有

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 迁移 > 将K8s集群迁移到CCE
调度概述 - 云容器引擎 CCE
调度概述 - 云容器引擎 CCE

为工作负载提供NPU资源。 NPU调度 Volcano调度 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性，提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

实现对大模型输出的精确把控，不用进行强化学习，也可以准确判断和学习到使用者的偏好，最后，DPO算法还可以与其他优化算法相结合，进一步提高深度学习模型的性能。 SFT监督式微调(Self-training Fine-tuning)：是一种利用有标签数据进行模型训练的方法。它基于一

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
执行训练任务【新】 - AI开发平台ModelArts

加此值（≥ 2）。（此参数目前仅适用于Llama3系列模型长序列训练） lr 2.5e-5 学习率设置。 min-lr 2.5e-6 最小学习率设置。 seq-length 4096 要处理的最大序列长度。 convert_mg2hf_at_last 1 Megatron格式权重转换为HuggFace格式权重，如不

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
函数初始化入口Initializer - 函数工作流 FunctionGraph

其中1、2和3是系统层面的冷启动开销，通过对调度以及各个环节的优化，函数服务能做到负载快速增长时稳定的延时。4是函数内部初始化逻辑，属于应用层面的冷启动开销，例如深度学习场景下加载规格较大的模型、数据库场景下连接池构建、函数依赖库加载等等。为了减小应用层冷启动对延时的影响，FunctionGraph推出

 帮助中心 > 函数工作流 FunctionGraph > 开发指南
训练启动脚本说明和参数配置 - AI开发平台ModelArts

context-parallel-size 。（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。 SN 1200 必

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明
执行训练任务（历史版本） - AI开发平台ModelArts

context-parallel-size 。（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。 TRAIN_ITERS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务

总条数： 330

上一页
1
...
6
7
8
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练启动脚本说明和参数配置 - AI开发平台ModelArts

Namespace和Network - 云容器实例 CCI

环境准备 - AI开发平台ModelArts

常用概念 - 视频点播 VOD

执行微调训练任务 - AI开发平台ModelArts

Namespace和Network - 云容器实例 CCI

方案概述 - 媒体应用

大模型开发基本概念 - 盘古大模型 PanguLargeModels

PERF03-03 使用弹性伸缩 - 云架构中心

Yaml配置文件参数配置说明 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

目标集群资源规划 - 云容器引擎 CCE

调度概述 - 云容器引擎 CCE

场景介绍 - AI开发平台ModelArts

执行训练任务【新】 - AI开发平台ModelArts

函数初始化入口Initializer - 函数工作流 FunctionGraph

训练启动脚本说明和参数配置 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线