搜索_华为云

准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备环境准备代码准备镜像环境 DockerFile构建镜像（可选）准备数据（可选）父主题：主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911）
训练脚本说明 - AI开发平台ModelArts

训练脚本说明 Yaml配置文件参数配置说明模型NPU卡数、梯度累积值取值表各个模型训练前文件替换 NPU_Flash_Attn融合算子约束 BF16和FP16说明录制Profiling 父主题：主流开源大模型基于DevServer适配LlamaFactory PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911）
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置训练的数据集预处理说明训练中的权重转换说明训练tokenizer文件说明父主题：主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911）
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备资源准备数据准备权重准备代码准备镜像准备Notebook（可选）父主题：主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备环境准备代码准备数据准备镜像父主题：主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备资源准备数据准备权重准备代码准备镜像父主题：主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像镜像方案说明 ECS获取和上传基础镜像使用基础镜像 ECS中构建新镜像父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练启动脚本说明和参数配置【旧】训练tokenizer文件说明断点续训和故障快恢说明父主题：主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912）
准备工作 - AI开发平台ModelArts
准备工作 - AI开发平台ModelArts

准备工作准备环境准备代码准备镜像环境 DockerFile构建镜像（可选）准备数据（可选）父主题：主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
训练脚本说明参考 - AI开发平台ModelArts

训练脚本说明参考训练参数配置说明【旧】训练tokenizer文件说明断点续训和故障快恢说明父主题：主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）
不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置表1 不同模型推荐的参数与NPU卡数设置模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值优化工具 (Deepspeed) 规格与节点数 Qwen-VL Qwen-VL 7B full 2048 gr

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
ModelArts Standard训练作业和模型部署如何收费？ - AI开发平台ModelArts

如果您使用的是专属资源池，则训练作业就不再进行单独计费。由专属资源池进行收费。 Standard中模型部署为服务后如何收费？ ModelArts支持将模型按照业务需求部署为服务。训练类型不同，部署后的计费方式不同。将模型部署为服务时，根据数据集大小评估模型的计算节点个数，根据实际编码情况选择计算模式。具体

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
配置IAM权限 - AI开发平台ModelArts

创建自定义策略时，建议将项目级云服务和全局级云服务拆分为两条策略，便于授权时设置最小授权范围。此处的“Policy1”为项目级云服务、“Policy2”为全局级云服务。了解更多。将自定义策略授权给开发者用户组user_group。在统一身份认证服务控制台的左侧菜单栏中，选择“用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

“inference”。 “数据特征指标”：在右侧下拉框中勾选需要展示的指标。详细指标说明请参见支持分析指标及其说明。选择完成后，页面将自动呈现您选择对应版本及其指标数据，您可以根据呈现的图表了解数据分布情况，帮助您更好的处理您的数据。查看分析任务的历史记录。在数据特征分析

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
责任共担 - AI开发平台ModelArts
责任共担 - AI开发平台ModelArts

完善云服务安全保障体系。安全性是华为云与您的共同责任，如图1所示。华为云：负责云服务自身的安全，提供安全的云。华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS各类各项云服务自身的安全，涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
ModelArts的API或SDK支持模型下载到本地吗？ - AI开发平台ModelArts

ModelArts的API或SDK支持模型下载到本地吗？ ModelArts的API和SDK不支持模型下载到本地，但训练作业输出的模型是存放在对象存储服务（OBS）里面的，您可以通过OBS的API或SDK下载存储在OBS中的文件，具体请参见从OBS下载文件。父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
训练参数配置说明【旧】 - AI开发平台ModelArts

表示训练轮次，根据实际需要修改。一个Epoch是将所有训练样本训练一次的过程。 TRAIN_ITERS 10 非必填。表示训练step迭代次数，会进行自动计算得出。 SEED 1234 随机种子数。每次数据采样时，保持一致。 SAVE_INTERVAL 1000 用于模型中间版本地保存。当

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考
训练参数配置说明【旧】 - AI开发平台ModelArts

表示训练轮次，根据实际需要修改。一个Epoch是将所有训练样本训练一次的过程。 TRAIN_ITERS 10 非必填。表示训练step迭代次数，会进行自动计算得出。 SEED 1234 随机种子数。每次数据采样时，保持一致。 SAVE_INTERVAL 1000 用于模型中间版本地保存。当

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考
附录：大模型推理常见问题 - AI开发平台ModelArts

model_len访问推理服务，服务端响应200，见图3。客户端仍返回报错Response payload is not completed，见图4。图2 服务端返回报错Response payload is not completed 图3 服务端响应200 图4 仍返回报错Response

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
查询训练作业版本列表 - AI开发平台ModelArts

total_metric_values属性列表参数参数类型说明 f1_score Float 训练作业模型总召回。仅限部分预置算法使用，会自动生成，仅供参考。 recall Float 训练作业模型总召回率。 precision Float 训练作业模型总精确率。 accuracy

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业

总条数： 2206

上一页
1
...
96
97
98
...
111
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备工作 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

准备工作 - AI开发平台ModelArts

训练脚本说明参考 - AI开发平台ModelArts

不同模型推荐的参数与NPU卡数设置 - AI开发平台ModelArts

ModelArts Standard训练作业和模型部署如何收费？ - AI开发平台ModelArts

配置IAM权限 - AI开发平台ModelArts

分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

责任共担 - AI开发平台ModelArts

ModelArts的API或SDK支持模型下载到本地吗？ - AI开发平台ModelArts

训练参数配置说明【旧】 - AI开发平台ModelArts

训练参数配置说明【旧】 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

查询训练作业版本列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线