搜索_华为云

训练启动脚本说明和参数配置 - AI开发平台ModelArts

-size）的设置：需要遵循GBS/MBS的值能够被NPU/(TP×PP×CP)的值进行整除。模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.911） > 训练脚本说明
ModelArts Standard使用流程 - AI开发平台ModelArts

创建训练作业前需要先准备算法，可以订阅AI Gallery中的算法，也可以使用用户自己的算法。准备算法创建训练作业创建一个训练作业，选择可用的数据集版本，并使用前面编写完成的训练脚本。训练完成后，将生成模型并存储至OBS中。创建训练作业管理模型编写推理代码和配置文件针对您生成的模型，建议您按照Mode

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

S/MBS的值能够被NPU/(TP×PP×CP)的值进行整除。模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910） > 训练脚本说明
训练作业容错检查 - AI开发平台ModelArts

补充健康的计算节点至专属资源池。（该功能即将上线）容错检查详细介绍请参考：开启容错检查检测项目与执行条件触发容错环境检测达到的效果环境预检查通过后，如果发生硬件故障会导致用户业务中断。您可以在训练中补充reload ckpt的代码逻辑，使能读取训练中断前保存的预训练模型。指导请参考设置断点续训练。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

Gallery仓库依次下载除某种格式之外的其他格式的文件到服务器的缓存目录下。 gallery-cli download {repo_id} --exclude "*.json" 如下所示，表示下载除“.json”格式之外的其他格式的文件到服务器的缓存目录“/test”下，当回显“100%”时表示下载完成。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
CUDA和CUDNN - AI开发平台ModelArts
CUDA和CUDNN - AI开发平台ModelArts

源时，用户基于自己的业务，可能会有自定义GPU/Ascend驱动的需求，ModelArts面向此类客户提供了自助升级专属资源池GPU/Ascend驱动的能力，具体操作请参见资源池驱动升级。父主题： FAQ

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
提交训练作业报错“Invalid OBS path” - AI开发平台ModelArts

提交训练作业报错“Invalid OBS path” 当运行训练作业时，出现“Invalid OBS path”错误。图1 训练作业报错该问题可以通过以下方法排查：如果是首次使用ModelArts的新用户，需要登录ModelArts管理控制台，在权限管理页面完成访问授权配置，推荐使用委托授权的方式。完成访问授权配置后，再次提交作业即可。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > PyCharm Toolkit使用
删除资源池 - AI开发平台ModelArts

时可填，例如："C78"。 updateStrategy String 驱动升级策略。可选值如下： force：强制升级，立即升级节点驱动，可能影响节点上正在运行的作业 idle：安全升级，待节点上没有作业运行时进行驱动升级表12 PoolStatus 参数参数类型描述 phase

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
训练性能测试 - AI开发平台ModelArts

<rank> <cfgs_yaml_file>：性能测试配置的yaml文件地址，如代码目录中performance_cfgs.yaml相对或绝对路径。 <model_name>：训练模型名，如qwen2-7b <run_type>：训练策略类型及数据序列长度：【lora：4096-lora

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
自动学习/Workflow计费项 - AI开发平台ModelArts

时不再收费。专属资源池的费用请参考专属资源池计费项。 - - 存储资源对象存储OBS 用于存储训练和推理的输入数据和输出结果数据。具体费用可参见对象存储价格详情。注意：存储到OBS中的数据需在OBS控制台进行手动删除。如果未删除，则会按照OBS的计费规则进行持续计费。按需计费

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

准备代码本教程中用到的训练推理代码和如下表所示，请提前准备好。获取模型软件包和权重文件本方案支持的模型对应的软件和依赖包获取地址如表1所示，模型列表、对应的开源权重获取地址如表1所示。表1 模型对应的软件包和依赖包获取地址代码包名称代码说明下载地址 AscendCloud-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.910） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

准备代码本教程中用到的训练推理代码和如下表所示，请提前准备好。获取模型软件包和权重文件本方案支持的模型对应的软件和依赖包获取地址如表1所示，模型列表、对应的开源权重获取地址如表1所示。表1 模型对应的软件包和依赖包获取地址代码包名称代码说明下载地址 AscendCloud-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 准备工作
ModelArts Standard数据管理相关计费FAQ - AI开发平台ModelArts

ModelArts上传数据集收费吗？ ModelArts中的数据集管理、标注等操作不收费，但是由于数据集存储在OBS中，因此会根据您使用的OBS桶进行收费。建议您前往OBS服务，了解OBS计费详情，创建相应的OBS桶用于存储ModelArts使用的数据。 ModelArts标注完样本集后，如何保证退出后不再产生计费？

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
查询资源池 - AI开发平台ModelArts

object 资源池的metadata信息。 spec PoolSpecModel object 资源池的期望信息。 status PoolStatus object 资源池的状态信息。表4 PoolMetadata 参数参数类型描述 name String 系统自动生成的pool名称，相当于pool

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
托管镜像到AI Gallery - AI开发平台ModelArts

上传镜像文件在镜像详情页，选择“镜像文件”页签。单击“添加文件”，进入上传文件页面，选择本地的数据文件单击“点击上传”或拖动文件，单击“确认上传”启动上传。上传单个超过5GB的文件时，请使用Gallery CLI工具。CLI工具的获取和使用请参见Gallery CLI配置工具指南。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery镜像
Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

为用户配置云服务使用权限主用户为子账号授予ModelArts、OBS等云服务的使用权限后，子账号才可以使用这些云服务。此步骤介绍如何为用户组中的所有子账号授予使用ModelArts、OBS、SWR等各类云服务的权限。主用户在IAM服务的用户组列表页面，单击“授权”，进入到授权页面，为子账号配置权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
训练性能测试 - AI开发平台ModelArts

<rank> <cfgs_yaml_file>：性能测试配置的yaml文件地址，如代码目录中performance_cfgs.yaml相对或绝对路径。 <model_name>：训练模型名，如qwen2-7b <run_type>：训练策略类型及数据序列长度：【lora：4096-lora

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。支持的特性表1 本版本支持的特性说明分类软件包特性说明参考文档三方大模型，包名：AscendCloud-LLM 支持如下模型适配PyTorch-NPU的训练(ModelLink)

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
从0-1制作自定义镜像并创建AI应用 - AI开发平台ModelArts

本地验证镜像并上传镜像至SWR服务：验证自定义镜像的API接口功能，无误后将自定义镜像上传至SWR服务。将自定义镜像创建为AI应用：将上传至SWR服务的镜像导入ModelArts的AI应用。将AI应用部署为在线服务：将导入的模型部署上线。本地构建镜像以linux x86_x64架构的主机为例，您可以购买

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署

总条数： 1924

上一页
1
...
74
75
76
...
97
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练启动脚本说明和参数配置 - AI开发平台ModelArts

ModelArts Standard使用流程 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练作业容错检查 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

CUDA和CUDNN - AI开发平台ModelArts

提交训练作业报错“Invalid OBS path” - AI开发平台ModelArts

删除资源池 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

自动学习/Workflow计费项 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

ModelArts Standard数据管理相关计费FAQ - AI开发平台ModelArts

查询资源池 - AI开发平台ModelArts

托管镜像到AI Gallery - AI开发平台ModelArts

Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

从0-1制作自定义镜像并创建AI应用 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线