搜索_华为云

管理团队和团队成员 - AI开发平台ModelArts

管理团队和团队成员修改成员信息团队中的成员，当其信息发生变化时，可以编辑其基本情况。在“团队详情”区域，选择需修改的成员。在成员所在行的“操作”列，单击“修改”。在弹出的对话框中，修改其“描述”或“角色”。成员的“邮箱”无法修改，如果需要修改邮箱地址，建议先删除此成员，然后再基于新的邮箱地址添加新成员。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
Lite Cluster高危操作一览表 - AI开发平台ModelArts

点管理、扩缩容、驱动升级、带本地盘机型的本地盘数据丢失等。高不可恢复。修改网络安全组可能影响ModelArts侧基本功能，包括但不限于节点管理、扩缩容、驱动升级等。中改回原有内容。网络修改/删除集群关联网段。影响ModelArts侧基本功能，包括但不限于节点管理、扩缩容、驱动升级等。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
训练tokenizer文件说明 - AI开发平台ModelArts

zer文件，需要修改代码。修改文件chatglm4-9b/tokenization_chatglm.py 。文件最后几处代码中需要修改，具体位置可根据上下文代码信息进行查找，修改后如图所示。图3 修改ChatGLMv4-9B tokenizer文件图4 修改ChatGLMv4-9B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练tokenizer文件说明 - AI开发平台ModelArts

zer文件，需要修改代码。修改文件chatglm4-9b/tokenization_chatglm.py 。文件最后几处代码中需要修改，具体位置可根据上下文代码信息进行查找，修改后如图所示。图3 修改ChatGLMv4-9B tokenizer文件图4 修改ChatGLMv4-9B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

sh安装命令时，需要确认机器是否已连通网络。若无法连通网络，可使用离线安装的方式，具体参考离线训练安装包准备说明。若要对ChatCLMv3、GLMv4系列模型进行训练时，需要修改 install.sh 脚本中的 transformers 的版本。由默认 transformers==4.45.0 修改为：transformers==4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
版本说明和要求 - AI开发平台ModelArts

Snt9B。请参考Lite Server资源开通，购买Lite Server资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
执行训练任务【新】 - AI开发平台ModelArts

user_converted_ckpt_path=xxx 前提条件已上传训练代码、训练权重文件和数据集到SFS Turbo中。步骤一修改训练Yaml配置文件修改或添加代码目录下modellink_performance_cfgs.yaml文件参数内容，参数详解可查看表1。样例yaml配置文件结构分为：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
CogVideoX模型基于DevServer适配PyTorch NPU全量训练指导（6.3.911） - AI开发平台ModelArts

如果为风格微调，请准备至少50条风格相似的视频和标签，以利于拟合。修改CogVideo/sat/configs/cogvideox_*.yaml文件如果希望使用 Lora 微调，需要修改cogvideox_<模型参数>_lora 文件，修改参考如下： *** conditioner_config:

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
专属资源池关联SFS Turbo显示异常 - AI开发平台ModelArts

专属资源池关联SFS Turbo时显示异常，关联失败。图1 关联异常图2 报错提示问题现象2 网络操作解除关联SFS Turbo后状态仍显示已关联且无报错信息，而解除关联按钮置灰不可操作。同时该网络的解除关联SFS Turbo按钮置灰不可操作。图3 关联SFS Turbo状态原因分析

 帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

路由加速的原理是改变rank编号，所以代码中对rank的使用要统一。将训练作业完成如下修改后，启动训练作业即可实现网络加速。将训练启动脚本中的“NODE_RANK="$VC_TASK_INDEX"”修改为“NODE_RANK="$RANK_AFTER_ACC"”。将训练启动脚本中的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

安装命令时，需要确认机器是否已连通网络。若无法连通网络，可使用离线安装的方式，具体参考离线训练安装包准备说明。若要对ChatCLMv3、GLMv4系列模型进行训练时，需要修改 install.sh 脚本中的 transformers 的版本。由默认 transformers==4.45.0 修改为：transformers==4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
不同机型的对应的软件配套版本 - AI开发平台ModelArts

Standard 集群版本：v1.23|v1.25|v1.28（推荐）集群规模：50|200|1000|2000 集群网络模式：容器隧道网络|VPC 分布式训练时仅支持容器隧道网络集群转发模式：iptables|ipvs gpu-beta gpu-driver rdma-sriov-dev-plugin

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

说明查询事件列表查询事件列表。表17 网络管理 API 说明创建网络资源创建网络资源。查询网络资源列表查询网络资源列表。查询网络资源查询指定网络资源的详情信息。删除网络资源删除指定网络资源。更新网络资源更新指定网络资源。表18 资源指标管理 API 说明

 帮助中心 > AI开发平台ModelArts > API参考
离线训练安装包准备说明 - AI开发平台ModelArts

离线训练安装包准备说明在华为公有云平台，申请的资源一般要求连通网络。因此用户在准备环境时可以运行 scripts/install.sh 直接下载安装资源，或通过 Dockerfile 下载安装资源并构建一个新的镜像。若用户的机器或资源池无法连通网络，并无法git clone下载代码、安装pyt

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
离线训练安装包准备说明 - AI开发平台ModelArts

离线训练安装包准备说明申请的模型软件包一般依赖连通网络的环境。若用户的机器或资源池无法连通网络，并无法git clone下载代码、安装python依赖包的情况下，用户则需要找到已联网的机器（本章节以Linux系统机器为例）提前下载资源，以实现离线安装。用户可遵循以下步骤操作。步骤一：资源下载

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
MiniCPM-V2.0推理及LoRA微调基于DevServer适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

Lite的DevServer环境中，使用NPU卡对MiniCPM-V2.0进行LoRA微调及推理。本文档中提供的训练脚本，是基于原生MiniCPM-V的代码基础适配修改，可以用于NPU芯片训练。 MiniCPM系列的最新多模态版本MiniCPM-V2.0。该模型基于MiniCPM 2.4B和SigLip-400M构建，共拥有2

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

有下载权限，请联系您所在企业的华为方技术支持下载获取。修改代码将AscendSpeed代码包AscendCloud-LLM-xxx.zip在本地解压缩后。在上传代码前，需要对解压后的训练脚本代码进行修改。具体文件为：修改llm_train/AscendSpeed/scripts/dev_pipeline

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
Lite Cluster资源配置流程 - AI开发平台ModelArts

netes基础知识、网络知识、存储和镜像知识。配置流程图1 Lite Cluster资源配置流程图表1 Cluster资源配置流程配置顺序配置任务场景说明 1 配置Lite Cluster网络购买资源池后，需要弹性公网IP并进行网络配置，配置网络后可通过公网访问集群资源。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
MiniCPM-V2.6基于Lite Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

Lite的Server环境中，使用NPU卡对MiniCPM-V2.6进行LoRA微调及SFT微调。本文档中提供的训练脚本，是基于原生MiniCPM-V的代码基础适配修改，可以用于NPU芯片训练。方案概览本方案介绍了在ModelArts的Server上使用昇腾计算资源开展MiniCPM-V 2.6 Lo

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
使用Advisor工具分析生成调优建议 - AI开发平台ModelArts

两种： Terminal日志信息的概览建议。包含Detail信息及修改示例的HTML信息。按照建议信息做如下修改：亲和优化器使能，在train.py中修改优化器为apex混合精度模式下的DDP优化方式（修改点：注释第161和167行，增加第168~170行）。二进制调优使能，减少算子编译耗时，在train

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 性能调优

总条数： 1117

上一页
1
...
6
7
8
...
56
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理团队和团队成员 - AI开发平台ModelArts

Lite Cluster高危操作一览表 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

版本说明和要求 - AI开发平台ModelArts

执行训练任务【新】 - AI开发平台ModelArts

CogVideoX模型基于DevServer适配PyTorch NPU全量训练指导（6.3.911） - AI开发平台ModelArts

专属资源池关联SFS Turbo显示异常 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

MiniCPM-V2.0推理及LoRA微调基于DevServer适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

MiniCPM-V2.6基于Lite Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

使用Advisor工具分析生成调优建议 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线