搜索_华为云

SFT全参微调训练 - AI开发平台ModelArts

ging Face格式权重会保存至OUTPUT_SAVE_DIR的目录中。对于Yi系列模型、ChatGLMv3-6B和Qwen系列模型，还需要手动修改训练参数和tokenizer文件，具体请参见训练tokenizer文件说明。 Step2 创建SFT全参微调训练任务创建训练作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911）
SFT全参微调训练 - AI开发平台ModelArts

ging Face格式权重会保存至OUTPUT_SAVE_DIR的目录中。对于Yi系列模型、ChatGLMv3-6B和Qwen系列模型，还需要手动修改训练参数和tokenizer文件，具体请参见训练tokenizer文件说明。 Step2 创建SFT全参微调训练任务创建训练作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910）
LoRA微调训练 - AI开发平台ModelArts

ging Face格式权重会保存至OUTPUT_SAVE_DIR的目录中。对于Yi系列模型、ChatGLMv3-6B和Qwen系列模型，还需要手动修改训练参数和tokenizer文件，具体请参见训练tokenizer文件说明。 Step2 创建LoRA微调训练任务创建训练作业

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910）
计算规格说明 - AI开发平台ModelArts

可能由于平台的折扣优惠变化导致单价发生变化，而云服务是先使用后通过话单进行记录，计费会存在延时，因此，实际价格和折扣优惠可能与当前询价会不完全相同，请以真正计费的价格和优惠为准。欠费说明当用户账号余额不足造成扣费失败时，账号将变成欠费状态。欠费后，按需资源不会立即停止服务，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
管理Lite Cluster节点 - AI开发平台ModelArts

GPU和NPU规格，重置节点完成后，节点可能会出现驱动升级的现象，请耐心等待。事件中心页面授权运维针对ModelArts运维平台告警的故障节点，控制台“资源管理>事件中心”页面记录故障节点的计划事件，包括故障节点的基本信息、事件类型、事件状态、事件描述等，并支持授权和重部署操

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
开发环境的应用示例 - AI开发平台ModelArts

当Notebook实例不再需要时，调用删除Notebook实例接口删除实例。前提条件已获取IAM的EndPoint和ModelArts的EndPoint。确认服务的部署区域，获取项目ID和名称、获取帐号名和帐号ID和获取用户名和用户ID。操作步骤调用认证鉴权接口获取用户的Token。请求消息体： URI格式：POST

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

后可配置告警规则实现实时告警通知。业务运行阶段，先将业务系统对接在线服务请求，然后进行业务逻辑处理和监控设置。图1 推理服务的端到端运维流程图整个运维过程会对服务请求失败和资源占用过高的场景进行监控，当超过阈值时发送告警通知。图2 监控告警流程图方案优势通过端到端的服

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
扩缩容模型服务实例数 - AI开发平台ModelArts

在使用大型模型进行推理时，其业务需求会呈现出明显的峰谷波动。因此，模型服务必须具备灵活的扩缩容能力，以适应不同时间段内的用户负载变化，确保服务的高可用性和资源的高效利用。 ModelArts Studio大模型即服务平台支持手动扩缩容模型服务的实例数，该操作不会影响部署服务的正常运行。约束限制

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

创建OBS桶 ModelArts使用对象存储服务（Object Storage Service，简称OBS）存储输入输出数据、运行代码和模型文件，实现安全、高可靠和低成本的存储需求。因此，在使用ModelArts之前通常先创建一个OBS桶，然后在OBS桶中创建文件夹用于存放数据。本文档也

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

创建OBS桶 ModelArts使用对象存储服务（Object Storage Service，简称OBS）存储输入输出数据、运行代码和模型文件，实现安全、高可靠和低成本的存储需求。因此，在使用ModelArts之前通常先创建一个OBS桶，然后在OBS桶中创建文件夹用于存放数据。本文档也

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
创建工作空间 - AI开发平台ModelArts

创建工作空间。设置工作空间名称为“test-workspace”，授权类型为“internal”，授权的IAM用户名称为“test”。 POST https://{endpoint}/v1/{project_id}/workspaces { "name" : "test-workspace", "description"

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
ModelArts中常用概念 - AI开发平台ModelArts

批量推理是对批量数据进行推理的批量作业。昇腾芯片昇腾芯片又叫Ascend芯片，是华为自主研发的高计算力低功耗的AI芯片。资源池 ModelArts提供的大规模计算集群，可应用于模型开发、训练和部署。支持公共资源池和专属资源池两种，分别为共享资源池和独享资源池。 ModelArts Standard默认提供公共资源池。ModelArts

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
SD3.5基于Lite Server适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

本文基于diffusers和comfyui两个框架进行适配。方案概览本方案介绍了在ModelArts Lite Server上使用昇腾计算资源Ascend Snt9B开展SD3.5模型的推理过程。资源规格要求推荐使用“西南-贵阳一”Region上的Server资源和Ascend Snt9B单机。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
创建网络资源 - AI开发平台ModelArts

orks 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 apiVersion 是 String API版本。可选值如下： v1

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

功能，ModelArts使用对象存储服务（Object Storage Service，简称OBS）进行数据存储以及模型的备份和快照，实现安全、高可靠和低成本的存储需求。 AI开发过程中的输入数据、输出数据、中间缓存数据都可以在OBS桶中进行存储、读取。因此，建议您在使用Mode

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

不同AI模型训练所需要的数据量和算力不同，在训练时选择合适的存储及训练方案可提升模型训练效率与资源性价比。ModelArts Standard支持单机单卡、单机多卡和多机多卡的训练场景，满足不同AI模型训练的要求。 ModelArts Standard提供了公共资源池和专属资源池，专属资源

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
推理业务迁移评估表 - AI开发平台ModelArts

当前推理业务的操作系统及版本，如：Ubuntu 22.04。是否使用容器化运行业务，以及容器中OS版本，HostOS中是否有业务软件以及HostOS的类型和版本。需要评估是否愿意迁移到华为云的通用OS。 - AI引擎及版本当前引擎（TF/PT/LibTorch），是否接受切换MindSpore。例如：当前使用TF

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
执行训练任务【新】 - AI开发平台ModelArts

断点续训：训练过程中保存的某个权重，可参考断点续训和故障快恢说明 train_auto_resume false 【可选】是否开启【故障快恢】功能，【true、false】默认false不开启，当训练中断时重启任务会从最新生成权重文件处继续训练。可参考断点续训和故障快恢说明 stage pt 表示训练类型。可选择值：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.5.901） > 执行训练任务
执行训练任务【新】 - AI开发平台ModelArts

断点续训：训练过程中保存的某个权重，可参考断点续训和故障快恢说明 train_auto_resume false 【可选】是否开启【故障快恢】功能，【true、false】默认false不开启，当训练中断时重启任务会从最新生成权重文件处继续训练。可参考断点续训和故障快恢说明 stage pt 表示训练类型。可选择值：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

sh 如果镜像使用ECS中构建新镜像构建的新镜像时，训练作业启动命令中输入： cd /home/ma-user/modelarts/user-job-dir/AscendSpeed; sh ./scripts/obs_pipeline.sh Step2 配置数据输入和输出单击“增加

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）

总条数： 1773

上一页
1
...
55
56
57
...
89
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SFT全参微调训练 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

计算规格说明 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

开发环境的应用示例 - AI开发平台ModelArts

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

扩缩容模型服务实例数 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

创建工作空间 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

SD3.5基于Lite Server适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

创建网络资源 - AI开发平台ModelArts

创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

执行训练任务【新】 - AI开发平台ModelArts

执行训练任务【新】 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线